分割GBK中文遭遇乱码的解决方法

2015-01-24信息快讯网

以下是对分割GBK中文遭遇乱码的解决方法进行了详细的分析介绍，需要的朋友可以过来参考下

类似如下的字符串(GBK), explode不能得到正确结果:

1.$result = explode("|", "滕华||海青"); 究其原因, 对于”|”字(读tao,不认识没关系,我也不认识), 因为他的GBK编码值为: 8f7c, 不巧的是, “|”的ASCII值也是7c.

这样的问题, 还有很多 : 因为GBK编码的编码范围是: 0×8140-0xfefe, 所以, 理论上来说, 任何低字节是7c的字都会有这个问题, 比如:

1.|(827c), |(837c), |(b17c), |(e57c).......等等等等对于这样的情况,

1.第一, 可以采用转码到utf8, 然后explode, 再转回来, 这是比较麻烦的方法.
2.第二, 我们可以采用正则拿"匹配出"来代替"分离出":
3.preg_match_all("/([/x81-/xfe][/x40-/xfe])+/", $gbk_str, $matches);//写死编码这样, $matches中0号索引对应的数组就是结果词的数组了..

yii框架builder、update、delete使用方法

php检测文件编码的方法示例

windows服务器中检测PHP SSL是否开启以及开启SSL的方法

在PHP模板引擎smarty生成随机数的方法和math函数详解

php过滤html中的其他网站链接的方法(域名白名单功能)

自己写了一个php检测文件编码的函数

php验证是否是md5编码的简单代码

php5.2 Json不能正确处理中文、GB编码的解决方法

使用PHP生成二维码的两种方法(带logo图像)

php截取字符串之截取utf8或gbk编码的中英文字符串示例

PHP 正则判断中文UTF-8或GBK的思路及具体实现

php防注入及开发安全详细解析