2、动态模板。
采集都是通过制定好饿规则,所以如果让被采集页面没有规则,那么依然可以防采集。可以事先做好N套模板,最终效果都挺相似,但是HTML代码结构却不同。比如有一些用<strong>有一些用<B>,有一些用div,有一些用table。每次显示或者输出时随机调用模板。一旦这样,除了“人肉”,基本上可以防住绝大部分的采集程序。
3、利用客户端状态。
利用客户端状态来防止采集也是一种方法。比如要求网有登录之后才能浏览,判断浏览器是否是IE或者firefox,判断是否在1分钟内浏览了超过20或者30页等 。不过现在比较好的程序都能模拟客户端状态,而且本身对很多大站来说是不切实际的。所以一般在论坛中使用的比较多。 字串1
由于我的网站核心信息仅仅是联系方式和发布ip地址。所以最终我采用了第一种,直接输出图片并打上域名标记。事实证明效果非常好。由于在程序中做了优化,实际运行时对性能的影响微乎其微。可以到http://www.i0514.cn(如果认为AD,可以不点击)看看最终页面的效果。刷新后会发现图片的微小变化。 (责编:admin03) 字串5