Http 1.1 Etag 与 Last-Modified提高php效率

2015-01-24信息快讯网

在 Blog 盛行的今天,一些 Web 应用需要解析大量的 RSS Feed .如何提高效率是个非常重要的问题.在 MagpieRSS 的 Features 中列举了这样的一条: HTTP Conditional GETs Save bandwidth and speed up download times with intelligent use of Last-Modified and ETag.. 这里的 Etag 引起了我的注意.

什么是 Etag ?

通过阅读 RFC 2616 ,得到了对 Etag 的一点印象:

The ETag response-header field provides the current value of the entity tag for the requested variant......Entity tags are normally "strong validators," but the protocol provides a mechanism to tag an entity tag as "weak." One can think of a strong validator as one that changes whenever the bits of an entity changes, while a weak value changes whenever the meaning of an entity changes. Alternatively, one can think of a strong validator as part of an identifier for a specific entity, while a weak validator is part of an identifier for a set of semantically equivalent entities.

从上我们可以大致得知,Entity tags 本质上说是一种"强校验器",但是 HTTP 协议提供了一种通过给 Entity tags 打标签的"弱"的机制(类似于内容的校验码).虽然这段话后面通过两种方式进行了解释,但是还是有些晦涩.我看了这段话之后只是得出了 Etag 的 "E" 代表 "Entity" 而已.

Magpie 首页上提到了一篇文章: HTTP Conditional Get for RSS Hackers ,拜读之后清晰了许多.要先说说 HTTP Conditional GETs 的基本原理,很简单,就是说,从 Web 服务器取数据的时候,如果文件变化了,给我新的文件,如果文件没有变化,只需告诉客户端没有变化即可,不必再把文件取回来.这样就可节省大量的网络带宽和资源.

Etag 与 Last-Modified 是从 HTTP 1.0 到 HTTP 1.1 才有的概念.当我们从 Web 服务器获取文件的时候,只需要读取 HTTP 响应头的 Etag 与 Last-Modified 字段即可,这两个字段里面的具体内容是什么可以不管(可能会千奇百怪,RFC 2616 对 Etag 没有具体值的定义),把这两个值 Cache 在本地,下次检查文件是否更新的时候比对这两个值即可.如果没有变化,服务器的响应代码不是 HTTP 200 (OK) , 而是 304.

Http 1.1 Etag 与 Last-Modified提高php效率_信息快讯网

如上图.目前 OpenRSS 虽然订阅了40 多个 Feed,但是响应速度很不错.在使用 Gregarius 的过程中(Lilina 也应用了 ETag),发现了 FeedBurnrer 烧录的 Feed ,几乎都是用了 Etag 的(否则估计服务器要瘫痪,Hoho).我们再测试一下 HTTP header 的响应情况:

$ curl -I http://feeds.feedburner.com/dbanotes
HTTP/1.1 200 OK
Date: Tue, 25 Oct 2005 11:34:15 GMT
Server: Apache
Last-Modified: Tue, 25 Oct 2005 04:30:12 GMT
ETag: U4q478bDKLqZ8UMMC8A5afZuHug
Content-Type: text/xml;charset=utf-8

$ curl -I http://feeds.feedburner.com/dbanotes
HTTP/1.1 200 OK
Date: Tue, 25 Oct 2005 11:34:21 GMT
Server: Apache
Last-Modified: Tue, 25 Oct 2005 04:30:12 GMT 
ETag: U4q478bDKLqZ8UMMC8A5afZuHug
Content-Type: text/xml;charset=utf-8

在这个期间,我的 Blog 没有更新.所以 Last-Modified 和 ETag 返回的都是相同的值.这样 Gregarius 就不必重新解析了. 国内的 GreatNews 是支持 HTTP Conditional GETs 的,更棒的是还支持 gzip/deflate encoding.而另一个 RSS 阅读工具 POPU (周博通) 就不知道了.

以上是我的笔记,如有理解错误,请指正!

Zend framework处理一个http请求的流程分析
PHP has encountered an Access Violation 错误的解决方法
Asp.net 文本框全选的实现
PHP MYSQL乱码问题,使用SET NAMES utf8校正
phplock(php进程锁) v1.0 beta1
PHP 配置open_basedir 让各虚拟站点独立运行
PHP CKEditor 上传图片实现代码
基于HTTP长连接的"服务器推"技术的php 简易聊天室
dedecms 批量提取第一张图片最为缩略图的代码(文章+软件)
php面向对象全攻略 (六)__set() __get() __isset() __unset()的用法
php getsiteurl()函数
PHP 内存缓存加速功能memcached安装与用法
PHP DataGrid 实现代码
php_xmlhttp 乱码问题解决方法
AspNetAjaxPager,Asp.Net通用无刷新Ajax分页控件,支持多样式多数据绑定
php Http_Template_IT类库进行模板替换
php auth_http类库进行身份效验
PHP通用分页类page.php[仿google分页]
php magic_quotes_gpc的一点认识与分析
优化使用mysql存储session的php代码
使用ETags减少Web应用带宽和负载第1/2页
wordpress之wp-settings.php
在普通HTTP上安全地传输密码
中国站长站 For Dede4.0 采集规则
dede全站URL静态化改造[070414更正]
动易数据转成dedecms的php程序
手把手教你使用DedeCms V3的在线采集图文教程
dedecms系统常用术语汇总
实现了一个PHP5的getter/setter基类的代码
发布一个用PHP fsockopen写的HTTP下载的类
PHP中HTTP方式下的Gzip压缩传输方法举偶
mysql_fetch_assoc和mysql_fetch_row的功能加起来就是mysql_fetch_array
isset和empty的区别
PR值查询 | PageRank 查询
一周学会PHP(视频)Http下载
Apache2 httpd.conf 中文版
在php中取得image按钮传递的name值
©2014-2024 dbsqp.com