如何使用PHP批量去除文件UTF8 BOM信息

2015-01-24信息快讯网

如果PHP文件头部包含BOM信息,就会输出一个空白,在很多时候会带来问题,比如我们session无法工作、cookie无法设置等等问题

原理:
UTF8文件,微软为了增加一个识别信息,有了BOM这个东西:BOM ―― Byte Order Mark,缺省在Windows等平台上编辑的UTF8文件会在头部增加3个字节的标记信息,我们PHP引擎在处理的时候会完整读取整个PHP代码文档, 如果PHP文件头部包含BOM信息,就会输出一个空白,在很多时候会带来问题,比如我们session无法工作、cookie无法设置等等问题。

解决方法:
把头部BOM的3个字节信息识别出来,然后剔除掉。不过一般情况我们不知道哪个文件有BOM,或者是有很多文件,这个时候,就需要进行批量处理了,下面代码主要就是展现了批量处理的情况,应该会对大家工作中有帮助。

执行方法:
设置一个路径,然后直接执行就行。

<?php 
// 设定你要清除BOM的根目录(会自动扫描所有子目录和文件)
$HOME = dirname(__FILE__);
// 如果是Windows系统,修改为:$WIN = 1;
$WIN = 0;
?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>UTF8 BOM 清除器</title>
<style>
body { font-size: 10px; font-family: Arial, Helvetica, sans-serif; background: #FFF; color: #000; }
.FOUND { color: #F30; font-size: 14px; font-weight: bold; }
</style>
</head>
<body>
<?php
$BOMBED = array();
RecursiveFolder($HOME);
echo '<h2>These files had UTF8 BOM, but i cleaned them:</h2><p class="FOUND">';
foreach ($BOMBED as $utf) { echo $utf ."<br />\n"; }
echo '</p>';
// 递归扫描
function RecursiveFolder($sHOME) {
 global $BOMBED, $WIN;
 $win32 = ($WIN == 1) ? "\\" : "/";
 $folder = dir($sHOME);
 $foundfolders = array();
 while ($file = $folder->read()) {
  if($file != "." and $file != "..") {
   if(filetype($sHOME . $win32 . $file) == "dir"){
    $foundfolders[count($foundfolders)] = $sHOME . $win32 . $file;
   } else {
    $content = file_get_contents($sHOME . $win32 . $file);
    $BOM = SearchBOM($content);
    if ($BOM) {
     $BOMBED[count($BOMBED)] = $sHOME . $win32 . $file;
     // 移出BOM信息
     $content = substr($content,3);
     // 写回到原始文件
     file_put_contents($sHOME . $win32 . $file, $content);
    }
   }
  }
 }
 $folder->close();
 if(count($foundfolders) > 0) {
  foreach ($foundfolders as $folder) {
   RecursiveFolder($folder, $win32);
  }
 }
}
// 搜索当前文件是否有BOM
function SearchBOM($string) { 
  if(substr($string,0,3) == pack("CCC",0xef,0xbb,0xbf)) return true;
  return false; 
}
?>
</body>
</html>

Windows下的PHP安装文件线程安全和非线程安全的区别
自己写了一个php检测文件编码的函数
利用php下载xls文件(自己动手写的)
php文件服务实现虚拟挂载其他目录示例
PHP批量删除、清除UTF-8文件BOM头的代码实例
php警告Creating default object from empty value 问题的解决方法
PHP调用VC编写的COM组件实例
使用php清除bom示例
jQuery中的RadioButton,input,CheckBox取值赋值实现代码
分享下页面关键字抓取components.arrow.com站点代码
网页上facebook分享功能具体实现
PHP 下载文件时自动添加bom头的方法实例
JoshChen_web格式编码UTF8-无BOM的小细节分析
php读取csv文件后,uft8 bom导致在页面上显示出现问题的解决方法
php addslashes 利用递归实现使用反斜线引用字符串
深入解析PHP中逗号与点号的区别
php 读取文件头判断文件类型的实现代码
PHP取二进制文件头快速判断文件类型的实现代码
js限制checkbox勾选的个数以及php获取多个checkbbox的方法深入解析
实测在class的function中include的文件中非php的global全局环境
php的$_FILES的临时储存文件与回收机制实测过程
PHP 获取远程文件大小的3种解决方法
php解析html类库simple_html_dom(详细介绍)
浅析php插件 Simple HTML DOM 用DOM方式处理HTML
基于simple_html_dom的使用小结
PHP 过滤页面中的BOM(实现代码)
php selectradio和checkbox默认选择的实现方法详解
php setcookie(name, value, expires, path, domain, secure) 参数详解
©2014-2024 dbsqp.com