PHP实现通过中文字符比率来判断垃圾评论的方法
2015-01-24信息快讯网
这篇文章主要介绍了PHP实现通过中文字符比率来判断垃圾评论的方法,是一个比较实用的技巧,对于进行PHP应用程序开发来说有一定的参考借鉴价值,需要的朋友可以参考下
本文实例讲述了PHP实现通过中文字符比率来判断垃圾评论的方法。分享给大家供大家参考。具体实现方法如下:
一、需求:
最近一段时间常常出现这类垃圾评论:一大段英文字符里夹杂一两个生僻汉字,包含了中文字符,而且又没包含啥中文的敏感词,所以就堂而皇之的通过了评论过滤。对这类评论的处理可以采取判断中文字符的比率来确认,但是也会存在一定的误判。
二、解决方案:
要用到php的两个函数strlen和mb_strlen,strlen会把单个汉字长度认定为3,mb_strlen单个汉字长度为1。同一段字符通过两个函数取得的长度之差就是实际汉字字符数的二倍,除以二就得到实际的字符数,在与mb_strlen取得的长度求比值就得到汉字占总字符数的比率。
三、实现代码:
$len_all = strlen($comment['text']); $len_st = mb_strlen($comment['text'], 'UTF-8'); if(($len_all-$len_st)/(2*$len_st) < 0.5){ $error = "中文字符少于百分之五十"; }
如果在评论中贴代码的话,就会造成中文字符比率低,需要过滤掉代码字段再来判断。
希望本文所述对大家的PHP程序设计有所帮助。
php截取html字符串及自动补全html标签的方法
php5.4以下版本json不支持不转义内容中文的解决方法
给ECShop添加最新评论
PHP中文编码小技巧
php匹配字符中链接地址的方法
php生成二维码时出现中文乱码的解决方法
PHP中使用file_get_contents抓取网页中文乱码问题解决方法
php中最简单的字符串匹配算法
PHP实现将科学计数法转换为原始数字字符串的方法
分享一段PHP制作的中文拼音首字母工具类
php表单敏感字符过滤类
利用PHP函数计算中英文字符串长度的方法
ThinkPHP上使用多说评论插件的方法
php中的字符编码转换函数用法示例
php的ZipArchive类用法实例
PHP清除数组中所有字符串两端空格的方法
php中字符集转换iconv函数使用总结
php中文字符串截取方法实例总结
php中json_encode UTF-8中文乱码的更好解决方法
Drupal简体中文语言包安装教程
PHP常用编译参数中文说明
php实现的替换敏感字符串类实例
php实现根据字符串生成对应数组的方法
访问编码后的中文URL返回404错误的解决方法
PHP解码unicode编码的中文字符代码分享
php mb_substr()函数截取中文字符串应用示例
取得单条网站评论以数组形式进行输出
destoon实现公司新闻详细页添加评论功能的方法
可以保证单词完整性的PHP英文字符串截取代码分享