首页 > 学院 > 开发设计 > 正文

VB6内置的内码转换功能

2019-11-18 17:34:36
字体:
来源:转载
供稿:网友
嘿嘿,看到这个题目,想必吓了一大跳吧,或者是摆出一副不相信的表情?不用着急,请听我慢慢道来。
  话说这个VB6,很是无耻,居然内置了支持Unicode的功能,也就是说,当你读入一个字符串时,它根据本地缺省语言的对应关系将之转换为Unicode,输出时,再从Unicode转换为本地编码。一方面,它当然方便啦,随便出个什么语言的版本都好方便的,而且在Unicode的系统上,如NT,那它可就如鱼得水,Unicode毕竟是软件发展的方向,像现在中文Win9X使用的GBK内码,实际上就是向着Unicode走了一大步。可是在另一方面,这种支持实际上极大地延缓了字符串的处理时间!想想看,如果我们从文件里读一行并显示,本来是很简单的事情,可是在VB6里面,实际上多了一段转换到Unicode的时间,如果我们用字符串从原文件里读一行,然后分析,再写到目的文件里去,实际上就多了两重的时间(本地到Unicode,unicode到本地)。当然对于这种小事,高手们想必也都有处理的办法(如用byte数组来代替字符串)
  说了这么一大堆Unicode的坏话,还没说到正题呢,由于VB6内置对Unicode的支持,而Unicode里面分别和GBK以及Big5汉字都有对应关系,所以要实现转换也只是一件小事,下面我们就有请本次女主角出场。(哗哗哗哗……掌声不绝。)
  函数strConv!这个美眉大家可能在VB5里面也都见过的,她有一些保镖,可以帮她把字符串在Unicode和本地编码之间转换,而在VB6里面呢,strConv又多了一个保镖!大家请仔细看:
  strConv(string,conversion)`VB5
  StrConv(string,conversion,LCID)`VB6
  string呢,就是预转换的字符串了(提示一下,也可以使用byte数组)。
  conversion:是一个整数,只决定转换方式,VB里定义了一些常量,如VBFromUnicode、VBUnicode等等,这些不用我解释大家应该也明白了吧。
  LCID:哈,这可是VB6新加入的参数了,长整数,可以指定编码方式,如&H404,即Big5码,&H804即GBK码,合理运用这个参数,就可以写出一个非常简单的内码转换工具!
  什么?你还不明白,哎,就把源码给你看看吧。
  DimiReadNumberAsInteger`读文件号
  DimiWriteNumberAsInteger`写文件号
  Dimmem()AsByte`byte数组
  DimstrFileNameAsString`文件名
  DimlLengthAsLong`文件长度

  `将文件内容读入membyte数组
  iReadNumber=FreeFile
  strFileName=TextFileName.Text
  lLength=FileLen(strFileName)
  ReDimmem(lLength)AsByte
  OpenstrFileNameForBinaryAs#iReadNumber
  Get#iReadNumber,,mem
  Close#iReadNumber

  `将mem数组转换为Big5码所对应的Unicode码
  mem=StrConv(mem,vbUnicode,&H404)
  `再将Unicode码转换为GBK编码
  mem=StrConv(mem,vbFromUnicode,&H804)

  `写到源文件里去
  iWriteNumber=FreeFile
  KillstrFileName
  OpenstrFileNameForBinaryAs#iWriteNumber
  Put#iWriteNumber,,mem
  Close#iWriteNumber
  `结束
  (笔者用的是中文VB6PRofessional版+servicepack3。)
  怎么样,方便吧?短短几行就把Big5码转换到GBK了。
  不过方便是方便了,但是呢,也有它自己的缺陷,老实说,用这种方法来转换GB/GBK到Big5码是非常好的,可是把Big5码转过来的话,结果居然是繁体的!看起来真的是很不爽,哎,这也没有办法,Unicode里面就是这个对应关系;此外呢,这样转换毕竟是走了两步路,所以呢,从理论上来说,比别的转码软件慢了一倍!
  但是这样转过来可是有两大好处的,一,不会有错误的码,这可是国际标准哟,你想什么?二,不会有缺字,就像现在的很多转码软件都是从Big5转到GB码,想想看15000字转到六七千字,一一映射,没有缺字才怪!->


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表