Google通常保存的网页抓取记录时间很长,有些时候搜索一些非热门的关键字,可能出现的结果大量是n年前的陈旧网页。当然现在Google的搜索技术越来越先进,这个出现陈旧网页的事情也大量减少。不过由于SEO和抄袭等行为的存在,陈旧网页获得较高排名的现象依然存在。
集成“几年内”到Google搜索代码中
Google本身就提供了筛选搜索结果时间段的功能,在Google搜索结果页面左侧的“更多搜索工具”中就有如下的选择:时间不限、最新结果、一天内、一周内、一个月内、一年内和自定日期范围。
如有特殊需要,也可以直接将这个“时间限制”集成到Google的搜索代码中,不用每次都点击“更多搜索工具”。
这个应该是google官方的搜索代码,好像是很久以前就出现的。
只需要在原有的搜索代码后面加上&as_qdr=yn
。
其中n=1-15,代表1-15年内。google搜索抓取最长时间保存15年,不知道现在还是不是。
比如,原来的搜索代码是:
http://www.google.com.hk/search?q=%s
需要2年内的结果,则可以改为:
http://www.google.com.hk/search?q=%s&as_qdr=y2
2个说明:
- 这个代码筛选的是“几年内”的数据,不是指“几年前”的数据;
- 这个时间指的是google抓取的时间,不是指网页实际发布的时间。