获取任意网站的全文RSS的方法很多,比如手动抓取的Yahoo pipes,自动的fullrss.sinaapp.com等服务。这些免费服务提供都来源于他人。不知道什么时候就不能用了,与fullrss.sinaapp.com同样基于Readability的Full-Text RSS,除了提供免费在全文RSS输出外,还提供了PHP程序供下载使用。
搭建Full-Text RSS
http://fivefilters.org/content-only/
FiveFilters的Full-Text RSS基于PHP 5.2以上版本,不要求数据库支持,基本各种免费虚拟主机都支持。程序本身包含了兼容性检测操作,也可以事先下载官方检测程序。
Full-Text RSS最新版是收费的,但旧版会开源的,官方提供了下载地址:
http://code.fivefilters.org/full-text-rss
安装步骤:
- 复制config.php为custom_config.php,按需修改参数;
- 复制index.php为custom_index.php,按需修改参数;
- 上传服务器。
前面2步都是非必须的,可以完全直接上传zip文件,按官方默认设置和显示就行。
Full-Text RSS的执行说起来也简单:输入网站RSS地址——后台自动分析RSS所有文章链接——自动提取连接到Readability——Readability返回每个链接的全文内容——自动将所有全文内容按原始RSS顺序烧录成一个新的全文RSS地址。
只要承载Full-Text RSS程序的网站地址可以访问,则烧录的全文RSS可以在任意RSS阅读器正常访问。
Full-Text RSS弥补了Readability不支持自动识别整个网站的缺憾,但也继承了Readability的兼容性问题。完美的全文RSS还是Yahoo pipes好使。
评论
《 “Full-Text RSS,获取任意网站全文RSS的PHP程序” 》 有 6 条评论
你好,请问如何修改输出内容?例如我要在每篇文章后都增加版权信息,该修改哪个文件?
不如改WordPress主题,将版权代码调整到正文里面。
[…] Full-Text RSS,获取任意网站全文RSS的PHP程序 | 沙丘. […]
[…] 从效果上看,Readability和Yahoo pipes或者Full Text Rss类等第三方工具是差不多的,Readability省略了Yahoo pipes的复杂操作,弥补了Full Text Rss类网站的持久性问题。 不方便的是,Readability目前只支持自动识别文章页,不支持自动识别整个网站。如果想一劳永逸的识别整个网站,还是得借助Full-Text RSS,又回到RSS的方法了。 此条目发表在 翻越 分类目录。将固定链接加入收藏夹。 ← 大陆网友秀创意 英文讽时事 […]
Yahoo pipes 这个还是不懂怎么使用..唉..
Yahoo pipes很强大,就是时不时抽风,RSS抓取不及时。而且很多判断需要正则表达式,太折腾了。