WordPress重复内容处理(有必要么?)
看到一篇日志Wordpress Duplicate Content Issues & Solutions,文中提到 了在WordPress的Blog中会有很多内容重复的页面,而这些重复内容不利于搜索引擎的索引。
比如单篇日志和分类或者是时间存档页面的内容重复,网站链接域名前是否有www的页面重复,链接结尾是否有“/”时搜索引擎的不同对待,单篇日志链接加/feed/后的内容重复等等。并且其提供了一些处理方法,比如修改robots.txt,使用www强制插件,链接重定向的插件,或者是使用避免搜索引擎抓取重复内容(分类,时间存档等)的插件等等。
像我使用Tag,便会有相当多的内容重复在tag存档页面中,而且如果一篇日志添加多个Tag,则重复得更厉害。此外,还有像/page/数字,/作者/,这种分页同样更是N多内容重复。
所以我挺困惑,难道真的需要把所有这种存档页面内容都做到让搜索引擎忽视,而只保留单篇日志来让其索引么?工程不小,但有必要么?而且像sitemap插件,还特意生成了存档和Tag等的索引,这不是冲突么?
我以”site:e-spacy.com“查了下,在baidu里,展示的几乎全是单篇日志的搜索结果,很理想。而在Google中则先是些Page,然后便全是关键字的Tag存档页面,相当不理想,不过也充分体现了google对关键字的重视。
但想想,google挺弱,至少相同的关键字在baidu中我的日志能排第一时,而在google下要翻几页。



关于最后一点,应该说是因为google对于这个关键字的收录量比baidu大,或者排序算法不同的缘故吧?
[Reply]
感觉上google是把链接和被链接多的网页排在前面了,排在前面的都是频道页和tags
[Reply]
这个插件比较垃圾, 我之前用过一段时间, 害我的很多文章都不被Google收录了, 但实际上根本没有重复, 禁用以后第二天再Google搜索就已经收录了.
[Reply]
“至少相同的关键字在baidu中我的日志能排第一”
这个可是主观评论,你的页面排在后面并不说明算法不好啊。
[Reply]
WOW! 你的网站不接收pingback了.
[Reply]
接受的,不过晚上一直我的服务器无法被国外访问
[Reply]
貌似是的, 每天固定的时间这里是Not Found.
[Reply]
[…] 恰好昨天看到E-Space上的WordPress重复内容处理(有必要么?), 今天又看到Ozh的WordPress, Duplicate Content, and Wrong SEO Plugins, 顿时解开了对这款神秘的SEO插件的疑惑. […]
[Reply]
其实不是有意为之都无所谓了,wp本身的结构就会出现重复,补充材料也不是那么可怕。
[Reply]
关键google把我的存档页面当成主要抓取对像。
我已经在header里加入针对搜索引擎的meta信息了,等过几天便应该能出现效果,到时会总结一下。
[Reply]
遇到个新问题, 我昨天升级WP到2.2.1, 记得2.2的时候在类似 http://hellobmw.com/page/2 这样的页面中meta是noindex的, 为什么现在是index了? 莫非2.2.1中把这个page跟类似http://hellobmw.com/links 这样的页面等同起来了吗?
[Reply]
不好办了, 搞清楚了, 其实是WP2.1以后就把首页和page/2这样的都统一为is_home了…. 想想还是你这样的设计合理…
[Reply]
google的tags是个麻烦事, 我的tags被占了整整有10页.
偶爱偶家’s last blog post..Yupoo收费的破事儿
[Reply]
为什么要怕tas呢.
我的blog在google大部分还是通过tag进来的
jxmoon’s last blog post..Google地球浏览器插件
[Reply]
我那个博客太惨了,过去的6个月里一直不能被百度好好地收录(只收录了几页),昨天才发现有可能是noindex的问题,我把noindex的meta删了,马上百度又正常收录了!
Poshi’s last blog post..我处理垃圾留言的方式
[Reply]