php小经验:解析preg_match与preg_match_all 函数
2015-01-24信息快讯网
本篇文章是对php中的preg_match函数与preg_match_all函数进行了详细的分析介绍,需要的朋友参考下
正则表达式在 PHP 中的应用在 PHP 应用中,正则表达式主要用于:
•正则匹配:根据正则表达式匹配相应的内容
•正则替换:根据正则表达式匹配内容并替换
•正则分割:根据正则表达式分割字符串
在 PHP 中有两类正则表达式函数,一类是 Perl 兼容正则表达式函数,一类是 POSIX 扩展正则表达式函数。二者差别不大,而且推荐使用Perl 兼容正则表达式函数,因此下文都是以 Perl 兼容正则表达式函数为例子说明。
定界符
Perl 兼容模式的正则表达式函数,其正则表达式需要写在定界符中。任何不是字母、数字或反斜线()的字符都可以作为定界符,通常我们使用 / 作为定界符。具体使用见下面的例子。
提示
尽管正则表达式功能非常强大,但如果用普通字符串处理函数能完成的,就尽量不要用正则表达式函数,因为正则表达式效率会低得多。关于普通字符串处理函数。
preg_match()
preg_match() 函数用于进行正则表达式匹配,成功返回 1 ,否则返回 0 。
语法:
int preg_match( string pattern, string subject [, array matches ] )
参数说明:
参数 | 说明 |
---|---|
pattern | 正则表达式 |
subject | 需要匹配检索的对象 |
matches | 可选,存储匹配结果的数组, $matches[0] 将包含与整个模式匹配的文本,$matches[1] 将包含与第一个捕获的括号中的子模式所匹配的文本,以此类推 |
<?php if(preg_match("/php/i", "PHP is the web scripting language of choice.", $matches)){ print "A match was found:". $matches[0]; } else { print "A match was not found."; } ?>
浏览器输出:
A match was found: PHP
在该例子中,由于使用了 i 修正符,因此会不区分大小写去文本中匹配 php 。
提示
preg_match() 第一次匹配成功后就会停止匹配,如果要实现全部结果的匹配,即搜索到subject结尾处,则需使用 preg_match_all() 函数。
例子 2 ,从一个 URL 中取得主机域名 :
<?php // 从 URL 中取得主机名 preg_match("/^(http://)?([^/]+)/i","http://www.jb51.net/index.html", $matches); $host = $matches[2]; // 从主机名中取得后面两段 preg_match("/[^./]+.[^./]+$/", $host, $matches); echo "域名为:{$matches[0]}"; ?>
浏览器输出:
域名为:jb51.net
preg_match_all()
preg_match_all() 函数用于进行正则表达式全局匹配,成功返回整个模式匹配的次数(可能为零),如果出错返回 FALSE 。
语法:
int preg_match_all( string pattern, string subject, array matches [, int flags ] )
参数说明:
参数 | 说明 |
---|---|
pattern | 正则表达式 |
subject | 需要匹配检索的对象 |
matches | 存储匹配结果的数组 |
flags | 可选,指定匹配结果放入 matches 中的顺序,可供选择的标记有:
|
<?php $str = "<pre>学习php是一件快乐的事。</pre><pre>所有的phper需要共同努力!</pre>"; $kw = "php"; preg_match_all('/<pre>([sS]*?)</pre>/',$str,$mat); for($i=0;$i<count($mat[0]);$i++){ $mat[0][$i] = $mat[1][$i]; $mat[0][$i] = str_replace($kw, '<span style="color:#ff0000">'.$kw.'</span>', $mat[0][$i]); $str = str_replace($mat[1][$i], $mat[0][$i], $str); } echo $str; ?>
正则匹配中文汉字
正则匹配中文汉字根据页面编码不同而略有区别:
•GBK/GB2312编码:[x80-xff>]+ 或 [xa1-xff]+
•UTF-8编码:[x{4e00}-x{9fa5}]+/u
例子:
<?php $str = "学习php是一件快乐的事。"; preg_match_all("/[x80-xff]+/", $str, $match); //UTF-8 使用: //preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match); print_r($match); ?>
输出:
Array ( [0] => Array ( [0] => 学习 [1] => 是一件快乐的事。 ) )
php function用法如何递归及return和echo区别
php switch语句多个值匹配同一代码块的实现
PHP static局部静态变量和全局静态变量总结
thinkphp路由规则使用示例详解和伪静态功能实现(apache重写)
jQuery中的RadioButton,input,CheckBox取值赋值实现代码
php将session放入memcached的设置方法
php中的路径问题与set_include_path使用介绍
PHP下获取上个月、下个月、本月的日期(strtotime,date)
preg_match_all使用心得分享
基于preg_match_all采集后数据处理的一点心得笔记(编码转换和正则匹配)
PHP函数preg_match_all正则表达式的基本使用详细解析
完美解决PHP中的Cannot modify header information 问题
php number_format() 函数通过千位分组来格式化数字的实现代码
php selectradio和checkbox默认选择的实现方法详解
解析php session_set_save_handler 函数的用法(mysql)
php setcookie(name, value, expires, path, domain, secure) 参数详解
win7下memCache的安装过程(具体操作步骤)
浅析memcache启动以及telnet命令详解
深入apache配置文件httpd.conf的部分参数说明
浅析php变量修饰符static的使用
解析linux下安装memcacheq(mcq)全过程笔记
Memcached常用命令以及使用说明详解
解析PHP中DIRECTORY_SEPARATOR,PATH_SEPARATOR两个常量的作用
探讨GDFONTPATH能否被winxp下的php支持
Function eregi is deprecated (解决方法)
setcookie中Cannot modify header information-headers already sent by错误的解决方法详解
基于curl数据采集之正则处理函数get_matches的使用
php中使用preg_match_all匹配文章中的图片