使用七牛的镜像存储功能可能会导致网站被K
日期:
标签:经验
如需帮忙改代码,或者WordPress二次开发、PHP网站建设等需求,可联系我购买付费服务: 点此联系我
博客被K
一个月前的今天,突然发现露兜博客的访问量降了一大半,看了网站统计才发现是被百度K了,收录量倒是没变,但是百度权重从2降到了0,每天从百度来的访问量也降到了不到10,入口还全都是首页。
回想一下,我的网站也没做过什么大的更改啊,我也不是那种整天闲着做SEO的人,莫非是博客好久没更新了?但是我基本每个月都有1-2篇的更新,百度不会因为这个原因K我吧?这个月我也持续更新了两篇文章,但是未见任何变化。于是又清理了几个久未更新的友情链接,情况依然没有好转。
偶然发现
因为我三个月前使用了七牛云存储,昨晚我登录了一下,偶然翻到了镜像设置页面,回想起之前的发现:七牛的镜像存储可以把你的网站镜像到他的服务器,如使用七牛的二级域名 up.ludou.org 做镜像到 www.ludou.org 后:
- 打开 up.ludou.org 看到的内容实际就是 www.ludou.org
- 内页也逃不了,up.ludou.org/contact 实际上就是 www.ludou.org/contact
- 总之,七牛的镜像复制了一个跟你一模一样的网站,只是域名变成七牛的二级域名而已
三个月前我也跟七牛的客服咨询这个会不会影响SEO,客服的答复是不会,所以当时对这个问题也不是很在意。昨晚,从百度百科了解了一下网站镜像相关知识,发现了以下触目惊心的描述:
最常见的当属镜象站点(Mirror Sites)。通过复制网站或网页的内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引。大多数搜索引擎都提供有能够检测镜象站点的适当的过滤系统,一旦发觉镜象站点,则源站点和镜象站点都会被从索引数据库中删除。
解决办法
看来被百度K站,跟七牛的镜像存储可能有很大的关系。不管有没有关系,反正一定要注意!但是,七牛的镜像存储功能不错,况且还有免费额度,放弃不用不是好办法,那么有没有更好的解决办法呢?我找到的方法有下面三种:
- 可以给镜像空间独立上传一个 robots.txt 禁止搜索引擎索引。可使用七牛提供的:robots.txt模板文件。robots.txt模板文件中禁用了搜索引擎爬虫,来确保你的网站不会因为开启镜像存储功能而被降权。
- 新建一个二级域名,如img.ludou.org,把要CDN的文件放到这个二级域名下,然后将这个二级域名镜像到七牛。这样就不会镜像到主站,被搜索引擎误会了。
- 这是由千与琥珀提供的方法:只要把镜像源改成wp-content这一级的地址即可,这样就不会镜像网站正常的网页了。
参考资料
-- 完 --
本文采用 「CC BY-NC-SA 4.0」创作共享协议,转载请标注以下信息:
原文出处:露兜即刻 https://www.ludou.org/qiniu-robots-seo.html
居然还会出现这么严重的情况?这段时间得关注下
好久没来逛露兜兄这里了,祝露兜兄圣诞快乐哈
因为主机商自带国内的oss了,用不着七牛,况且我不用靠搜索引擎吃饭
其实只要把镜像填到wp-content这一级就行了,这样再怎么访问都不会有正常的页面出现了,就是不能用偷懒的用插件替换链接了
此外,七牛貌似不带来路,抓取的服务器貌似也不是固定的ip,不然判断下再用302转向正确的地址就好
@千与琥珀 镜像填到wp-content这一级,还没试过。多谢提醒。
额,这个东西貌似早就知道的,我用的是又拍,专员一直提醒我尽量不要用镜像,没什么必要。而且还是专员让我在又拍存储根目录新建robots,如你所写一样的。
@kn007 手动还是比较容易控制。
还有这么一说。
好方法。用了水煮鱼的插件,采用的是robots的文件屏蔽镜像的!哈哈~
如何更改以前图片的路径啊
@柴 https://www.ludou.org/wordpress-search-replace.html
我用robots的文件屏蔽镜像的!
@李明 请问具体如何做的呢?麻烦赐教。
请教下,你博客文章页面中间的广告是怎么添加的?如何在发表评论前面添加个QQ邮件列表订阅?谢谢
@linda 在single.php中加。具体网上都有教程。
不用镜像功能,只用图片外链是不是不会受到影响啊?
问问兜哥:用了第二种方法,现在站点图片都是img.xxx.com 是不是就可以不用添加他的robots.txt的规则了??? 我发现用了他的robots规则用百度搜索自己的网站名字出现了:由于该网站的robots.txt文件存在限制指令,系统无法提供该页面的内容描述 。。。我觉得这个可能会影响很大~!
@lucifer 随意
露兜你的意思是,这个镜像网站,是完全复制了一个站点,存在了七牛上导致百度k站。我还没接触过七牛,看见很多人说的把图片和js放在七牛,就指的是这个镜像是吗?
@Eden 是的
知道了这个事情后,我去七牛的空间搜索了下,已经存在这个文件了,而且内容和文章里提供的内容一样,难道是七牛已经做了这个优化?
@ivan 是的。发布这篇文章后,七牛已经注意到了这个问题!
@露兜 感谢博主哈 刚开始使用七牛 一看到这个问题心揪了一下,瞬间得到解决了,赞!关注露兜已经2年多咯
想用第二种,不知道怎么弄,有没有教程呀?
我的网站也是因为这个问题,新站一个月还是一个首页,后来一查发现收录了二级CDN域名,
但问题是,七牛空间有robots.txt,但不知道为什么还被收录了。
现在七牛没有镜像存储了
虽然考古,但是最近才发现,可能自己太佛系了~收录的居然是七牛云的域名~