首页 > 语言 > PHP > 正文

php实现中文字符截取防乱码方法汇总

2024-09-04 11:42:43
字体:
来源:转载
供稿:网友

直接使用PHP函数substr截取中文字符可能会出现乱码,主要是substr可能硬生生的将一个中文字符“锯”成两半。那么我们来看看如何解决这个问题呢。

大家在自己的程序中相信都会经常用到截取字符串吧,但是往往遇到截取中文字符串的时候会遇到乱码的问题。很是让人头疼,接下来介绍两种方法防止截取中文字符串的时候出现乱码的问题。

首先第一种,自己写好的一个函数方便使用

利用这个函数截取就不会出现乱码了。

  1. /**  
  2.  * 支持中文字符串截取  
  3.  */ 
  4. function msubstr($str$start=0, $length$charset="utf-8"$suffix=true){  
  5.   switch($charset){  
  6.     case 'utf-8':$char_len=3;break;  
  7.     case 'UTF8':$char_len=3;break;  
  8.     default:$char_len=2;  
  9.   }  
  10.   //小于指定长度,直接返回  
  11.   if(strlen($str)<=($length*$char_len)){    
  12.     return $str;  
  13.   }  
  14.   if(function_exists("mb_substr")){   
  15.     $slice= mb_substr($str$start$length$charset);  
  16.   }else if(function_exists('iconv_substr')){  
  17.     $slice=iconv_substr($str,$start,$length,$charset);  
  18.   }else{  
  19.     $re['utf-8']  = "/[/x01-/x7f]|[/xc2-/xdf][/x80-/xbf]|[/xe0-/xef][/x80-/xbf]{2}|[/xf0-/xff][/x80-/xbf]{3}/";  
  20.     $re['gb2312'] = "/[/x01-/x7f]|[/xb0-/xf7][/xa0-/xfe]/";  
  21.     $re['gbk']  = "/[/x01-/x7f]|[/x81-/xfe][/x40-/xfe]/";  
  22.     $re['big5']  = "/[/x01-/x7f]|[/x81-/xfe]([/x40-/x7e]|/xa1-/xfe])/";  
  23.     preg_match_all($re[$charset], $str$match);  
  24.     $slice = join("",array_slice($match[0], $start$length));  
  25.   }  
  26.   if($suffix)  
  27.     return $slice;  
  28.   return $slice;  
  29. }  

第二种是php内置的一个函数mb_substr函数

指定要截取的字符串的编码格式,就能有效的防止出现乱码了。

说明:

  1. string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] )  
  2. <?php  
  3.  function substr_unicode($str$s$l = null) {  
  4.    return join(""array_slice(  
  5.      preg_split("//u"$str, -1, PREG_SPLIT_NO_EMPTY), $s$l));  
  6.  }  
  7.    
  8. $str = "Büyük";  
  9.  $s = 0; // start from "0" (nth) char  
  10.  $l = 3; // get "3" chars  
  11.  echo substr($str$s$l) ."/n";   
  12.  echo mb_substr($str$s$l) ."/n";  
  13.  echo substr_unicode($str$s$l);  
  14.  ?>

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表