PHP cdata 处理(详细介绍)
2015-01-24信息快讯网
之前为项目赶进度用php 的simplexml来解析 xml, 当时发现 simplexml不支持<![CDATA标签, 所有处于这个标签内的值都没有办法取到
当时在网上找了一个CDATA的转换器, 修改之后, 将CDATA标签给过滤掉。如下
// States:
//
// 'out'
// '<'
// '<!'
// '<!['
// '<![C'
// '<![CD'
// '<![CDAT'
// '<![CDATA'
// 'in'
// ']'
// ']]'
//
// (Yes, the states a represented by strings.)
//
$state = 'out';
$a = str_split($xml);
$new_xml = '';
foreach ($a AS $k => $v) {
// Deal with "state".
switch ( $state ) {
case 'out':
if ( '<' == $v ) {
$state = $v;
} else {
$new_xml .= $v;
}
break;
case '<':
if ( '!' == $v ) {
$state = $state . $v;
} else {
$new_xml .= $state . $v;
$state = 'out';
}
break;
case '<!':
if ( '[' == $v ) {
$state = $state . $v;
} else {
$new_xml .= $state . $v;
$state = 'out';
}
break;
case '<![':
if ( 'C' == $v ) {
$state = $state . $v;
} else {
$new_xml .= $state . $v;
$state = 'out';
}
break;
case '<![C':
if ( 'D' == $v ) {
$state = $state . $v;
} else {
$new_xml .= $state . $v;
$state = 'out';
}
break;
case '<![CD':
if ( 'A' == $v ) {
$state = $state . $v;
} else {
$new_xml .= $state . $v;
$state = 'out';
}
break;
case '<![CDA':
if ( 'T' == $v ) {
$state = $state . $v;
} else {
$new_xml .= $state . $v;
$state = 'out';
}
break;
case '<![CDAT':
if ( 'A' == $v ) {
$state = $state . $v;
} else {
$new_xml .= $state . $v;
$state = 'out';
}
break;
case '<![CDATA':
if ( '[' == $v ) {
$cdata = '';
$state = 'in';
} else {
$new_xml .= $state . $v;
$state = 'out';
}
break;
case 'in':
if ( ']' == $v ) {
$state = $v;
} else {
$cdata .= $v;
}
break;
case ']':
if ( ']' == $v ) {
$state = $state . $v;
} else {
$cdata .= $state . $v;
$state = 'in';
}
break;
case ']]':
if ( '>' == $v ) {
$new_xml .= htmlentities($cdata);
# $new_xml.= $cdata;
// $new_xml .= str_replace('>','>',
// str_replace('>','<',
// str_replace('"','"',
// str_replace('&','&',
// $cdata))));
$state = 'out';
} else {
$cdata .= $state . $v;
$state = 'in';
}
break;
} // switch
}
//
// Return.
//
return $new_xml;
最近发现,总是有alert发出来, 说是simplexml解析出错。
发现是原来有xml的数据是<![CDATA[domain[test]]] >. 出现了连续的3个], 造成上面的解析函数不能处理。
而且这个问题很难修正, 你不知道下次会不会有4, 5个]出现。
所以决定还是将这段解析 的代码换成DOM XML,本身 DOM的处理还是比较简单的,
包含DOMElement, DOMDocument, DOMNodeList, DOMNode几个 component.
对于 DOMNode有nodeValue, nodeType, nodeName的成员函数。
首先先用loadXML将string转化为DOMDocument对像, 再用getElementsByTagName转化为DOMNodeList对像, 再使用->item(0)转化为DOMNOde, 然后就可以使用上面的三种方法了。
对于 <aa color='red'>test</aa>这种xml标签, 要使用 attribute函数。
php生成xml时添加CDATA标签的方法
php警告Creating default object from empty value 问题的解决方法
php5.2 Json不能正确处理中文、GB编码的解决方法
easyui的tabs update正确用法分享
一个显示效果非常不错的PHP错误、异常处理类
PHP处理SQL脚本文件导入到MySQL的代码实例
php多功能图片处理类分享(php图片缩放类)
PHP错误和异长常处理总结
PHP static局部静态变量和全局静态变量总结
php检测iis环境是否支持htaccess的方法
PHP strip_tags()去除HTML、XML以及PHP的标签介绍
php中hashtable实现示例分享
php中的路径问题与set_include_path使用介绍
PHP下获取上个月、下个月、本月的日期(strtotime,date)
利用php+mcDropdown实现文件路径可在下拉框选择
PHP仿博客园 个人博客(1) 数据库与界面设计
PHP的基本常识小结
解决PHP mysql_query执行超时(Fatal error: Maximum execution time …)
处理(php-cgi.exe - FastCGI 进程超过了配置的请求超时时限)的问题
浅析php插件 Simple HTML DOM 用DOM方式处理HTML
mongo Table类文件 获取MongoCursor(游标)的实现方法分析
浅析php面向对象public private protected 访问修饰符
php小经验:解析preg_match与preg_match_all 函数
php setcookie(name, value, expires, path, domain, secure) 参数详解
浅析php变量修饰符static的使用
php 去除html标记--strip_tags与htmlspecialchars的区别详解
执行、获取远程代码返回:file_get_contents 超时处理的问题详解
解析Ubuntu下crontab命令的用法
解析关于java,php以及html的所有文件编码与乱码的处理方法汇总
hadoop常见错误以及处理方法详解
做了CDN获取用户真实IP的函数代码(PHP与Asp设置方式)