PHP substr 截取字符串出现乱码问题解决方法[utf8与gb2312]
2015-01-24信息快讯网
在PHP中,使substr函数截取字符串末位会出现乱码,因为中文UTF-8编码,每个汉字占3字节,而GB2312占2字节,英文占1字节,截取位不准确,造成断开的字符会把其后的..拉过来一起做一个字,所以出现了乱码。
substr --- 取得部份字符串语法 : string substr (string string, int start [, int length])
说明 :
substr( )传回 string的一部份字符串,由参数 start和 length指定。
如果 start是正数,传回的字符串将会从 string的第 start个字元开始。
Example :
<?php $rest = substr ("abcdef", 1); // returns "bcdef" $rest = substr ("abcdef", 1, 3); // returns "bcd" ?>
如果 start是负数,传回的字符串将会从 string结尾的第 start个字开始。
Example :
<?php $rest = substr ("abcdef", -1); // returns "f" $rest = substr ("abcdef", -2); // returns "ef" $rest = substr ("abcdef", -3, 1); // returns "d" ?>
如果有给予参数 length而且是正数时,传回的字符串将会从 start传回 length个字元。
如果有给予参数 length而且是负数时,传回的字符串将会结束于 string结尾的第 length个字元。
Example :
<?php $rest = substr ("abcdef", 1, -1); // returns "bcde" ?>
dongyue,2005-01-07 11:10:41
substr --- 取得部份字符串
语法 : string substr (string string, int start [, int length])
说明 :
substr( )传回 string的一部份字符串,由参数 start和 length指定。
如果 start是正数,传回的字符串将会从 string的第 start个字元开始。
Example :
<?php $rest = substr ("abcdef", 1); // returns "bcdef" $rest = substr ("abcdef", 1, 3); // returns "bcd" ?>
如果 start是负数,传回的字符串将会从 string结尾的第 start个字开始。
Example :
<?php $rest = substr ("abcdef", -1); // returns "f" $rest = substr ("abcdef", -2); // returns "ef" $rest = substr ("abcdef", -3, 1); // returns "d" ?>
如果有给予参数 length而且是正数时,传回的字符串将会从 start传回 length个字元。
如果有给予参数 length而且是负数时,传回的字符串将会结束于 string结尾的第 length个字元。
Example :
<?php $rest = substr ("abcdef", 1, -1); // returns "bcde" ?>
Utf-8、gb2312都支持的汉字截取函数
//截取中文字符串 /* Utf-8、gb2312都支持的汉字截取函数 cut_str(字符串, 截取长度, 开始长度, 编码); 编码默认为 utf-8 开始长度默认为 0 */function cut_str($string, $sublen, $start = 0, $code = 'UTF-8') { if($code == 'UTF-8') { $pa ="/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/"; preg_match_all($pa, $string, $t_string); if(count($t_string[0]) - $start > $sublen) return join('', array_slice($t_string[0], $start, $sublen)); return join('', array_slice($t_string[0], $start, $sublen)); } else { $start = $start*2; $sublen = $sublen*2; $strlen = strlen($string); $tmpstr = ''; for($i=0; $i<$strlen; $i++) { if($i>=$start && $i<($start+$sublen)) { if(ord(substr($string, $i, 1))>129) { $tmpstr.= substr($string, $i, 2); } else { $tmpstr.= substr($string, $i, 1); } } if(ord(substr($string, $i, 1))>129) $i++; } if(strlen($tmpstr)<$strlen ) $tmpstr.= ""; return $tmpstr; } } $str="脚本之家一个不错的网站"; echo cut_str($str, 8, 5, 'gb2312');
深入php list()函数的详解
PHP register_shutdown_function函数的深入解析
基于session_unset与session_destroy的区别详解
spl_autoload_register与autoload的区别详解
基于Linux调试工具strace与gdb的常用命令总结
linux命令之调试工具strace的深入分析
如何使用Strace调试工具
php 深入理解strtotime函数的使用详解
『PHP』PHP截断函数mb_substr()使用介绍
真正根据utf8编码的规律来进行截取字符串的函数(utf8版sub_str )
php安全配置 如何配置使其更安全
php中使用DOM类读取XML文件的实现代码
PHP spl_autoload_register实现自动加载研究
PHPWind与Discuz截取字符函数substrs与cutstr性能比较
PHP循环语句笔记(foreach,list)
PHP中strtotime函数使用方法详解
php中XMLHttpRequest(Ajax)不能设置自定义的Referer的解决方法
PHP中文处理 中文字符串截取(mb_substr)和获取中文字符串字数
PHP中的strtr函数使用介绍(str_replace)
php设计模式 Strategy(策略模式)
PHP的substr_replace将指定两位置之间的字符替换为*号
php去掉字符串的最后一个字符附substr()的用法
php提交表单时判断 if($_POST[submit])与 if(isset($_POST[submit])) 的区别
PHP中利用substr_replace将指定两位置之间的字符替换为*号