首页 > 学院 > 开发设计 > 正文

如何在java中去掉文本文件中的“”

2019-11-18 13:18:19
字体:
来源:转载
供稿:网友

  将Word文档转换后有一个方形的全黑的符号,只有自己写一个filter才能过滤掉。把转换后的文档里面非中文的字符串过滤掉这个黑框即可。如何过滤? 根据byte值过滤就行了。看byte值是否相等。
  注重,一定要先判定这个字符串是不是中文字符,是中文就不要进行过滤,否则,就会得出错误的结果。如何判定是不是中文字符? 根据该string第一个字节的byte值的范围。
  但是有两点要注重:
  
  1 因为可能是中英文混和,所以才要判定,你可以把一个String分成String.length()个string来看待。然后每个string判定它第一个字节值是多少。
  2 黑框的byte值,你copy过去,然后new一个string,PRint出他的bytevalue就可以得到了。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表