WordPress防采集小提示
日期:
标签:WordPress教程,经验
如需帮忙改代码,或者WordPress二次开发、PHP网站建设等需求,可联系我购买付费服务: 点此联系我
想必做过网站的人都听说过采集这个词,大概意思就是通过某些程序,点点鼠标,填几项内容就可以自动将别的网站上的文章轻松地弄到自己的网站上,而不需要去一篇篇地去复制粘贴,其实用剽窃更恰当一些吧,当然采集好听点。
采集算是充实网站内容的一个捷径,但是对被采集的网站来说并不是什么好事,我辛辛苦苦写的文章就这么被你轻松弄过去,还去除了我的版权信息,你叫我怎么咽得下这口气!!本文要给WordPress用户的友情提示就是,如何在一定程度上阻止他人采集你的文章。方法很简单:进入WordPress管理后台 - 设置 - 阅读,将 对于 feed 中的每篇文章,显示 设置成 摘要 。
其实大多数采集程序都是通过采集网站的feed来实现,如果你往feed中输出了全文,正和了他们的意,不费吹灰之力就可以把你文章的全部内容,连带图片都给采集过去了。如果feed中只有摘要,随便他们采集吧,随带帮我做做宣传也可以啊,呵呵!当然你可能会说,订阅用户就看不到全文了,其实让订阅用户直接点击文章链接进入你的网站阅读,可以给订阅用户更好的阅读体验。为了弥补用户无法看到全文的缺憾,可以在feed中给每篇文章添加阅读全文链接,这样用户就清楚他看到的是摘要,想要看全文,点链接就可以了,具体方法是,在你当前主题的functions.php的 <?php 和 ?> 之间添加以下代码,最后用UTF-8编码另存为就可以了:
/** RSS 中添加查看全文链接 */
function feed_read_more($content) {
return $content . '<p><a rel="bookmark" href="'.get_permalink().'" target="_blank">查看全文</a></p>';
}
add_filter ('the_excerpt_rss', 'feed_read_more');
当然,以上方法只针对采集feed的自动采集程序,对于更高级的直接采集文章页面的程序就无能为力了。
-- 完 --
本文采用 「CC BY-NC-SA 4.0」创作共享协议,转载请标注以下信息:
原文出处:露兜即刻 https://www.ludou.org/wordpress-prevent-autoblogging-robot.html
另外,IE6下,此主题侧边栏错位
多谢分享啦
上有政策,下有对策,博主的这个方法其实根本没用。。
@jinglong 我也没说完全杜绝啊
感谢分享
这个方法治标不治本啊
@magento800 难道你有治本的好方法,说出来大家学习下咯
有点用
还有个办法就是加上一些隐藏的文字(隐藏的文字为站点名称等),这样他一采集隐藏的文字也采集上去了
有的还是手动复制粘贴的,有隐藏文字也复制过来了
不能彻底杜绝,就增加他采集或复制的成本
不知我的这个想法对不对,wordpress有没有这方面的插件呢?!
唉,本人的博客内容也是被人复制了,版权啥也不留
@盆盆罐罐 没有完美的防采集方法
弄成摘要的话,用户订阅查看很不方便的
其实还可以使用随机的div id来有效防止采集,目前很多采集程序是通过div 中的 id来判断内容的位置的,只有少数采集程序可以通过css判断文章位置。或者在文章中加入版权信息等文字并用css隐藏,不过不知道这样会不会被搜索引擎视为作弊。
有人想采集你的网站说明你还是有价值的,让他们采集吧
像winhttrack这样的软件太盛行了,就算小白都能轻轻松松把你的网站直接全部内容(注意是全部内容)爬去到本地,做个镜像站,还可以把这个镜像站发布到网络上来。其实预防方法很简单,在本地搭个环境,放个网页,把ua打印出来,用这个软件去爬你的本地网站,把ua记录下来,抓关键词,在线上网站入口文件用stripos判断,如果ua中有关键词在黑名单里,直接发一个404的header然后exit,这样这种软件就会因为无法找到网站入口文件而无法工作了。
痛恨那些剽窃的