首页 > 编程 > C > 正文

C语言中判断一个char*是不是utf8编码

2020-01-26 14:04:12
字体:
来源:转载
供稿:网友

C语言中判断一个char*是不是utf8编码

里我修改了一下, 纯ASCII编码的字符串也返回true, 因为UTF8和ASCII兼容

实例代码:

int utf8_check(const char* str, size_t length) {   size_t i;   int nBytes;   unsigned char chr;    i = 0;   nBytes = 0;   while (i < length) {     chr = *(str + i);      if (nBytes == 0) { //计算字节数       if ((chr & 0x80) != 0) {         while ((chr & 0x80) != 0) {           chr <<= 1;           nBytes++;         }         if ((nBytes < 2) || (nBytes > 6)) {           return 0; //第一个字节最少为110x xxxx         }         nBytes--; //减去自身占的一个字节       }     } else { //多字节除了第一个字节外剩下的字节       if ((chr & 0xC0) != 0x80) {         return 0; //剩下的字节都是10xx xxxx的形式       }       nBytes--;     }     i++;   }   return (nBytes == 0); } 

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

图片精选