博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
PHP获取中英文混合字符串长度及截取
阅读量:5136 次
发布时间:2019-06-13

本文共 2102 字,大约阅读时间需要 7 分钟。

1.字符串长度

PHP获取中英文混合字符串长度的实现代码如下,1中文=1位,2英文=1位,可自行修改

[php]
 
  1. /** 
  2. * PHP获取字符串中英文混合长度  
  3. * @param $str string 字符串 
  4. * @param $$charset string 编码 
  5. * @return 返回长度,1中文=1位,2英文=1位 
  6. */  
  7. function strLength($str,$charset='utf-8'){  
  8. if($charset=='utf-8') $str = iconv('utf-8','gb2312',$str);  
  9. $num = strlen($str);  
  10. $cnNum = 0;  
  11. for($i=0;$i<$num;$i++){  
  12. if(ord(substr($str,$i+1,1))>127){  
  13. $cnNum++;  
  14. $i++;  
  15. }  
  16. }  
  17. $enNum = $num-($cnNum*2);  
  18. $number = ($enNum/2)+$cnNum;  
  19. return ceil($number);  
  20. }  
  21.   
  22. //测试输出长度都为15  
  23. $str1 = '测试测试测试测试测试测试测试测';  
  24. $str2 = 'aaaaaaaaaaaaaaaaaaaaaaaaaaaaaa';  
  25. $str3 = 'aa测试aa测试aa测试aa测试aaaaaa';  
  26. echo strLength($str1,'gb2312');  
  27. echo strLength($str2,'gb2312');  
  28. echo strLength($str3,'gb2312');  

 

2.截取字符串函数

UTF8编码,在UTF8中,一个中文字符占3个字节

[php]
function msubstr($str, $start, $len) {  
  1.     $tmpstr = "";  
  2.     $strlen = $start + $len;  
  3.     for($i = 0; $i < $strlen; $i++){  
  4.         if(ord(substr($str, $i, 1)) > 127){  
  5.             $tmpstr.=substr($str, $i, 3);  
  6.             $i+=2;  
  7.         }else  
  8.             $tmpstr.= substr($str, $i, 1);  
  9.     }  
  10.     return $tmpstr;  
  11. }  
  12. echo msubstr("一二三天下致公english",0,10);  

 

GB2312编码,在gb2312中,一个中文字符占2个字节

 

[php]
<?php  
  1. function msubstr($str, $start, $len) {   //ȡ  
  2.    $tmpstr = "";  
  3.    $strlen = $start + $len;  
  4.    if(preg_match('/[/d/s]{2,}/',$str)){
    $strlen=$strlen-2;}  
  5.    for($i = 0; $i < $strlen; $i++) {  
  6.        if(ord(substr($str, $i, 1)) > 0xa0) {  
  7.            $tmpstr .= substr($str, $i, 2);  
  8.            $i++;  
  9.        } else  
  10.            $tmpstr .= substr($str, $i, 1);  
  11.      }  
  12.    return $tmpstr;  
  13.  }  
  14.     
  15. ?>  

 

编码兼容性良好的函数

[php]
function cc_msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)  
    1. {  
    2.     if(function_exists("mb_substr"))  
    3.         return mb_substr($str, $start, $length, $charset);  
    4.     elseif(function_exists('iconv_substr')) {  
    5.         return iconv_substr($str,$start,$length,$charset);  
    6.     }  
    7.     $re['utf-8']   = "/[/x01-/x7f]|[/xc2-/xdf][/x80-/xbf]|[/xe0-/xef][/x80-/xbf]{2}|[/xf0-/xff][/x80-/xbf]{3}/";  
    8.     $re['gb2312'] = "/[/x01-/x7f]|[/xb0-/xf7][/xa0-/xfe]/";  
    9.     $re['gbk']    = "/[/x01-/x7f]|[/x81-/xfe][/x40-/xfe]/";  
    10.     $re['big5']   = "/[/x01-/x7f]|[/x81-/xfe]([/x40-/x7e]|/xa1-/xfe])/";  
    11.     preg_match_all($re[$charset], $str, $match);  
    12.     $slice = join("",array_slice($match[0], $start, $length));  
    13.     if($suffix) return $slice."…";  
    14.     return $slice;  
    15. }  

转载于:https://www.cnblogs.com/lovezbs/p/4497487.html

你可能感兴趣的文章
由级别和性格特征将程序员分类 ---看看你属于哪一种
查看>>
HDU 6370(并查集)
查看>>
BZOJ 1207(dp)
查看>>
对我来说,只有一件事情是重要的
查看>>
完整的Socket代码
查看>>
PE知识复习之PE的导入表
查看>>
POJ 3280 Cheapest Palindrome
查看>>
HDU 2076 夹角有多大(题目已修改,注意读题)
查看>>
Objective-C非正式协议与正式协议
查看>>
洛谷P3676 小清新数据结构题(动态点分治)
查看>>
SPOJ DQUERY D-query(主席树 区间不同数个数)
查看>>
八 Civil3d常用显示样式的编辑与创建 ----点标签样式2
查看>>
九校联考-DL24凉心模拟Day2T1 锻造(forging)
查看>>
生产阶段Webpack打包【基础打包】
查看>>
Cortex M3/M4 学习摘要(二)
查看>>
C#时间的味道——任时光匆匆我只在乎你
查看>>
(1)数据结构——线性表(数组)实现
查看>>
SpringMyBatis解析2-SqlSessionFactoryBean
查看>>
按照excel文档中的内容在当前cad图纸中自动排布实体
查看>>
Winform开发框架之图表报表在线设计器2-图表-SNF.EasyQuery项目--SNF快速开发平台3.3-Spring.Net.Framework...
查看>>