PHP substr 截取字符串出现乱码问题解决方法[utf8与gb2312]
2015-01-24信息快讯网
在PHP中,使substr函数截取字符串末位会出现乱码,因为中文UTF-8编码,每个汉字占3字节,而GB2312占2字节,英文占1字节,截取位不准确,造成断开的字符会把其后的..拉过来一起做一个字,所以出现了乱码。
substr --- 取得部份字符串语法 : string substr (string string, int start [, int length])
说明 :
substr( )传回 string的一部份字符串,由参数 start和 length指定。
如果 start是正数,传回的字符串将会从 string的第 start个字元开始。
Example :
<?php
$rest = substr ("abcdef", 1); // returns "bcdef"
$rest = substr ("abcdef", 1, 3); // returns "bcd"
?>
如果 start是负数,传回的字符串将会从 string结尾的第 start个字开始。
Example :
<?php
$rest = substr ("abcdef", -1); // returns "f"
$rest = substr ("abcdef", -2); // returns "ef"
$rest = substr ("abcdef", -3, 1); // returns "d"
?>
如果有给予参数 length而且是正数时,传回的字符串将会从 start传回 length个字元。
如果有给予参数 length而且是负数时,传回的字符串将会结束于 string结尾的第 length个字元。
Example :
<?php
$rest = substr ("abcdef", 1, -1); // returns "bcde"
?>
dongyue,2005-01-07 11:10:41
substr --- 取得部份字符串
语法 : string substr (string string, int start [, int length])
说明 :
substr( )传回 string的一部份字符串,由参数 start和 length指定。
如果 start是正数,传回的字符串将会从 string的第 start个字元开始。
Example :
<?php
$rest = substr ("abcdef", 1); // returns "bcdef"
$rest = substr ("abcdef", 1, 3); // returns "bcd"
?>
如果 start是负数,传回的字符串将会从 string结尾的第 start个字开始。
Example :
<?php
$rest = substr ("abcdef", -1); // returns "f"
$rest = substr ("abcdef", -2); // returns "ef"
$rest = substr ("abcdef", -3, 1); // returns "d"
?>
如果有给予参数 length而且是正数时,传回的字符串将会从 start传回 length个字元。
如果有给予参数 length而且是负数时,传回的字符串将会结束于 string结尾的第 length个字元。
Example :
<?php
$rest = substr ("abcdef", 1, -1); // returns "bcde"
?>
Utf-8、gb2312都支持的汉字截取函数
//截取中文字符串
/*
Utf-8、gb2312都支持的汉字截取函数
cut_str(字符串, 截取长度, 开始长度, 编码);
编码默认为 utf-8
开始长度默认为 0
*/function cut_str($string, $sublen, $start = 0, $code = 'UTF-8')
{
if($code == 'UTF-8')
{
$pa ="/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";
preg_match_all($pa, $string, $t_string); if(count($t_string[0]) - $start > $sublen) return join('', array_slice($t_string[0], $start, $sublen));
return join('', array_slice($t_string[0], $start, $sublen));
}
else
{
$start = $start*2;
$sublen = $sublen*2;
$strlen = strlen($string);
$tmpstr = ''; for($i=0; $i<$strlen; $i++)
{
if($i>=$start && $i<($start+$sublen))
{
if(ord(substr($string, $i, 1))>129)
{
$tmpstr.= substr($string, $i, 2);
}
else
{
$tmpstr.= substr($string, $i, 1);
}
}
if(ord(substr($string, $i, 1))>129) $i++;
}
if(strlen($tmpstr)<$strlen ) $tmpstr.= "";
return $tmpstr;
}
}
$str="脚本之家一个不错的网站";
echo cut_str($str, 8, 5, 'gb2312');
深入php list()函数的详解
PHP register_shutdown_function函数的深入解析
基于session_unset与session_destroy的区别详解
spl_autoload_register与autoload的区别详解
基于Linux调试工具strace与gdb的常用命令总结
linux命令之调试工具strace的深入分析
如何使用Strace调试工具
php 深入理解strtotime函数的使用详解
『PHP』PHP截断函数mb_substr()使用介绍
真正根据utf8编码的规律来进行截取字符串的函数(utf8版sub_str )
php安全配置 如何配置使其更安全
php中使用DOM类读取XML文件的实现代码
PHP spl_autoload_register实现自动加载研究
PHPWind与Discuz截取字符函数substrs与cutstr性能比较
PHP循环语句笔记(foreach,list)
PHP中strtotime函数使用方法详解
php中XMLHttpRequest(Ajax)不能设置自定义的Referer的解决方法
PHP中文处理 中文字符串截取(mb_substr)和获取中文字符串字数
PHP中的strtr函数使用介绍(str_replace)
php设计模式 Strategy(策略模式)
PHP的substr_replace将指定两位置之间的字符替换为*号
php去掉字符串的最后一个字符附substr()的用法
php提交表单时判断 if($_POST[submit])与 if(isset($_POST[submit])) 的区别
PHP中利用substr_replace将指定两位置之间的字符替换为*号