为任意网站制作RSS,尤其是没有提供RSS源的网站制作RSS,在线的工具也不少。其中有完全免费(免费账户功能齐全)和支持自定义设置的貌似只有Feed43、Yahoo Pipes和Feed Creator。Page2RSS虽然免费,但没有自定义,而且抓取时间间隔太长。其他一般都是收费,或者是强制广告链接跳转。
Feed43
http://feed43.com
Feed43不需要懂任何代码,只是简单的替换即可。
- 输入网址,填写网站编码;
- 设定需要抓取的内容范围——Global Search Pattern,{%}代表保留内容;
- 设定替换规则——Item (repeatable) Search Pattern,{%}代表保留内容,,{*}代表省略;
- 根据以上获取的({%N},设定RSS的title,link和Content。
两个问题:
- 2014年以来,Feed43的服务器极其不稳定,RSS需要多次刷新;
- 有时,部分Feed43制作的RSS不能被RSS阅读器或者是全文RSS工具识别。
Feed43里面抓取的网页源代码和浏览器直接查看的源代码有时会由于JS等因素而不一致,以Feed43的为标准。
Yahoo Pipes
- XPATH Fetch Page,设定抓取范围Cut ccontent和分割标识delimiter;
- Rename——item.content——Copy As——link
- Rename——item.content——Rename——title;
- Regex,通过正则表达式删减内容;
- Pipe Output。
两个问题:
- Yahoo Pipes服务器不稳定,时不时不能访问,而且不少网站禁止了Yahoo Pipes抓取;
- path需要使用正则表达式(Xpath不需要正则)。
当然可以继续用Yahoo Pipes生成全文RSS、RSS合并、分割和过滤等相关制作。
Feed Creator
http://createfeed.fivefilters.org/
来自全文RSS工具FiveFilters的Feed Creator是其中最简单的,只需要简单指定url的id标识和匹配限定,即可自动生成RSS,并可自动调用FiveFilters的全文RSS输出。
如图所示,输入网址 —— 指定rss需要的标题和链接在原html网页中标识(class and id attributes)—— 链接再匹配过滤。
详细介绍见官方说明:
http://blog.fivefilters.org/post/64483323020/feed-creator-our-new-tool-to-monitor-web-pages-using