首页 > 开发 > PHP > 正文

详谈PHP编码转换问题

2024-05-04 23:38:07
字体:
来源:转载
供稿:网友
本文给大家分享的是个人对于PHP编码转换问题的理解以及处理方法,非常的简单实用,有需要的小伙伴可以参考下。
 

最近恰好要用到unicode编码的转换,就去查了一下php的库函数,居然没找到一个函数可以对字符串进行Unicode的编码和解码!也罢,找不到的话就自己实现一下了。。。

Unicode和Utf-8编码的区别

Unicode是一个字符集,而UTF-8是Unicode的其中一种,Unicode是定长的都为双字节,而UTF-8是可变的,对于汉字来说Unicode占有的字节比UTF-8占用的字节少1个字节。Unicode为双字节,而UTF-8中汉字占三个字节。

UTF-8编码字符理论上可以最多到6个字节长,然而16位BMP(Basic Multilingual Plane)字符最多只用到3字节长。下面看一下

UTF-8编码表:
 

  1. U-00000000 - U-0000007F: 0xxxxxxx  
  2. U-00000080 - U-000007FF: 110xxxxx 10xxxxxx  
  3. U-00000800 - U-0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx  
  4. U-00010000 - U-001FFFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx  
  5. U-00200000 - U-03FFFFFF: 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx  
  6. U-04000000 - U-7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx  
?
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表