PHP 超链接 抓取实现代码
2015-01-24信息快讯网
因为最近要做一个类似专业搜索引擎的东西,需要抓取网页的所有超链接。
大家帮忙测试一下子,下面的代码是否可以针对所有的标准超链接。
测试代码如下:
<?php // -------------------------------------------------------------------------- // File name : Noname1.php // Description : 通用链接参数获取正则表达式测试 // Requirement : PHP4 (http://www.php.net) // Copyright(C), HonestQiao, 2005, All Rights Reserved. // Author: HonestQiao ([email protected]) // 参数说明: // $strSource: 包含标准链接的HTML网页 // $strResult: 处理的结果 // 附加说明: // 标准链接,使用<a></a>形势包含的链接 // -------------------------------------------------------------------------- $strSource = <<<HTML <a href=1.htm>t1</a> <a href='2.htm'>t2</a> <a href="3.htm">t3</a> <a href=4.htm class=link>t4</a> HTML; preg_match_all('/<a.*?(?: \\t\\r\\n)?href=[\'"]?(.+?)[\'"]?(?:(?: \\t\\r\\n)+.*?)?>(.+?)<\/a.*?>/sim', $strSource, $strResult, PREG_PATTERN_ORDER); for($i = 0; $i < count($strResult[1]); $i++) { printf("%d href=(%s) title=(%s) \n", $i, $strResult[1][$i], $strResult[2][$i]); } ?>
如果您的测试数据,符合标准链接,但是此处没有被处理出来,请告诉我测试数据,以及你的测试环境。
谢谢。
一些php技巧与注意事项分析
PHP数组对比函数,存在交集则返回真,否则返回假
用PHP读取和编写XML DOM的实现代码
javascript,php获取函数参数对象的代码
php下将多个数组合并成一个数组的方法与实例代码
php做下载文件的实现代码及文件名中乱码解决方法
仿AS3实现PHP 事件机制实现代码
解决PHP在DOS命令行下却无法链接MySQL的技术笔记
phpMyAdmin 链接表的附加功能尚未激活的问题
用PHP将网址字符串转换成超链接(网址或email)
DW中链接mysql数据库时,建立字符集中文出现乱码的解决方法
检查url链接是否已经有参数的php代码 添加 ? 或 &
php 自写函数代码 获取关键字 去超链接
连接到txt文本的超链接,不直接打开而是点击后下载的处理方法
PHP 网页过期时间的控制代码
PHP 文件上传功能实现代码
php addslashes 函数详细分析说明
PHP n个不重复的随机数生成代码
PHP 七大优势分析
php 404错误页面实现代码
PHP写MySQL数据 实现代码
php 分页类 扩展代码
php 正则 过滤html 的超链接
增加反向链接的101个方法 站长推荐