php不用正则采集速度探究总结
2015-01-24信息快讯网
这个以前有人发帖子研究过了采集速度,但是之后只是说出了哪个函数快并没有总结,研究问题的目的是要总结方法。
注意:下面的所有函数都没有用正则。
以上为取出第一个匹配的三个函数,实现相同的目的
function str_cut($str ,$start, $end) {//取出第一个匹配,效率最高,先分割再替换 $content = strstr( $str, $start ); $content = substr( $content, strlen( $start ), strpos( $content, $end ) - strlen( $start ) ); return $content; } function str_cut1($str ,$start, $end) {//取出第一个匹配,效率中,直接查找替换 $x = strpos($str, $start); return substr($str, $x+strlen($start), strpos($str, $end)-$x+strlen($end)); } function str_cut3($content,$start,$end){//取出第一个匹配,字符串越大,速度越慢! $my = explode($start,$content); $my = explode($end,$my[1]); return $my[0]; }
以下为取出所有匹配的3个函数(全部原创),实现相同的采集目的
function strcut($str ,$start, $end) //先搜个数,速度中等 { if( strpos( $str , $start ) ) { $sum = substr_count($str,$start); $carr = array(); for($i=0;$i<$sum;$i++){ $str = strstr( $str, $start ); $str = substr( $str, strlen($start)); $carr[] = substr( $str, 0, strpos( $str, $end ) ); } } return $carr; } function str_cut_all($str ,$start, $end,$carr=array()) //递归,运行效率最慢! { if( strpos( $str , $start ) ) { $str = strstr( $str, $start ); $str = substr( $str, strlen($start)); $carr[] = substr( $str, 0, strpos( $str, $end ) ); if( strpos( $str , $start ) ) { return str_cut_all($str ,$start, $end ,$carr ); } } return $carr; } function my_Ca($content,$start,$end){//取出所有匹配,效率最快,因为只读一次,字符串越大越明显 $m = explode($start,$content); $a = array(); for( $i = 1;$i < count($m);$i++ ) { $my = explode($end,$m[$i]); $a[] = $my[0]; unset($my); } return $a; }
注意my-Ca比较
如果这样写:
function my_Ca($content,$start,$end){//取出所有匹配 $m = explode($start,$content); $a = array(); $sum = count($m); for( $i = 1;$i < $sum;$i++ ) { $my = explode($end,$m[$i]); $a[] = $my[0]; unset($my); } return $a; }
速度又快了一些!
由上可以看出,并不是数组处理函数(explode)比字符串处理函数(substr等)慢,也不是那个比这个快,因为在匹配多个数据的时候匹配的越多数组函数的优势越大,处理字符串就象切蛋糕一样越切越小。匹配单个字符串运用切的思路去做也是一样的效果(str_cut)。关键还是在---算法!算法写的好,什么函数都是一样哦!
PHP采集相关教程之一 CURL函数库
php 处理上百万条的数据库如何提高处理查询速度
用js进行url编码后用php反解以及用php实现js的escape功能函数总结
PHP 采集获取指定网址的内容
php 文章采集正则代码
PHP simple_html_dom.php+正则 采集文章代码
PHP 采集程序中常用的函数
php 运行效率总结(提示程序速度)
PHP 中文乱码解决办法总结分析
PHP 页面跳转到另一个页面的多种方法方法总结
phpMyAdmin 安装及问题总结
追求程序速度,而不是编程的速度
php采集速度探究总结(原创)
非常不错的MySQL优化的8条经验
php木马攻击防御之道
php 常用字符串函数总结
利用PHP制作简单的内容采集器的代码
56.com视频采集接口程序(PHP)
PHP下几种删除目录的方法总结
中国站长站 For Dede4.0 采集规则
MySQL授权问题总结
php 中的str_replace 函数总结
如何提高MYSQL数据库的查询统计速度 select 索引应用
手把手教你使用DedeCms V3的在线采集图文教程
dede3.1分页文字采集过滤规则详说(图文教程)续四
用PHP实现的生成静态HTML速度快类库
dedecms中常见问题修改方法总结
用PHP生成静态HTML速度快类库
Dedecms V3.1 生成HTML速度的优化办法
如何提高PHP速度第1/3页