无锡SEO:如何处理网站里的重复内容
时间:2018-06-03 17:13来源:无锡做网站公司
在我们做无锡SEO优化过程中,可能会遇到网站内部的重复内容,这些重复的内容可能造成网站被K。当然,重复内容也不仅仅是网站本身出现雷同的文章,还包括多个方面问题。下面,无锡SEO网站优化中心就带大家一起了解一下网站内容重复的原因和处理办法。
“重复内容”一词将恐惧纳入许多网站管理员和搜索引擎优化的心中。但事实是,并不是所有的重复内容都是平等的。
重复的内容的三个类别:完全重复,近似重复和跨域重复。
确切的重复:两个URL具有相同的内容。
近重复:两件内容有小差异。
跨域重复:多个域上存在精确或近乎重复的内容。
重复的内容可能来自各种不同的因素。在某些情况下,网站许可内容用于其他地方; 糟糕的网站架构缺陷也可以发挥作用。剽窃导致重复的内容。
网站内重复内容产生的原因:
1、网站改版过程中,特别是Url重构,最易产生多Url对应单页面情况,这属于网站内部重复页面
2、大量采集其它网站内容,也容易被搜索引擎视为重复页面,也牵涉到搜索引擎对原创文章的识别,这属于广域的重复页面
3、很多网站在投放外部广告之后,带回含?带参的链接,在搜索引擎看来这是两个链接
一、网站内容重复的情况:
1、同样一篇文章出现多个URL,即使这篇文章属于原创,也会被百度给予惩罚。
2、网站内容多为采集,这种网站内容重复会被当做采集站直接被百度处理掉,百度新的绿萝算法就是专门打击采集站点的。
3、网站的固定版块出现次数太多,很多网站的右侧总是固定放一些版块或栏目,这些栏目的内容从来不进行更新,或者各个页面的右侧都是前篇一律的内容,就会造成页面重复度高。
4、未设置404错误页面,当我们删除某一个页面的时候,一定要用404状态码给予用户和蜘蛛一定的提示,如果代码设置错误,那么删除的页面在蜘蛛那里是假想存在的,由此一来就会多次收录。
5、动态页面和静态并存,百度爬去目录时收录了大量动态页面
6、网站内容以图片为主,文字很少,很多图片都是共用一个URL地址,这样一来蜘蛛在索引的时候很难保证不被重复收录。
重复内容是指不同的URL链接内容却是相同的,同时收录多个重复页面,设置多个页面进行介绍,但是网页的大体内容是相同的,这样处理的方法是错误的。
二、重复内容的检测方法
1、对于检测一篇文章是否重复内容,title:+文章标题可找出相同的文章。
2、从文中摘取一段话,在百度搜一下,出现大量红字,表明这篇文章的重复度高
3、站内搜索,可以找到出现多次的内容。
4、利用一些页面相似度检查工具,判断一些相邻页面的相似度,80%以上相似度就需要对一些固定栏目进行处理。
常规的重复页面解决办法:
1、例网址A、B、C,同时指向页面P,其中正常优化的是A页面,B、C为重复页面
2、网址规范化、301跳转,将多余的网址B、C301重定向到网址A
3、robots屏蔽;在robots.txt文件中添加对网址B、C的访问屏蔽,如果是一类页面,则可以使用规则屏蔽,Disallow: (B|C)
4、使用Canonial 标签;搜索引擎在处理重复页面方面考虑得比较周到,可以使用Canonial标签指定某网页的标准页,具体使用方法:将<link rel=”canonical” href=”网站网址 “/>添加到该网站的<Head>标签之间
三、如何消除重复内容
1、原创内容的增加
对于网站内容多为采集或简单伪原创的网站,小编建议增加原创文章的内容,宁可百度收录少一些,也不要让百度把之前收录的文章吐出来。
2、网站固定栏目内容随机展示
可以根据正文的关键词,随机调用右侧栏目的文章内容,让每一个页面都有不一样的内容,避免大量页面相似度高的情况出现。
3、设置404页面
告知用户和搜索引擎某些页面不存在了,防止搜索引擎收录大量死链。
4、页面设置独立的Meta标签
关键词、标签、描述,每一个页面都需要不同,可以采用手动修改,或者根据一定的规则设置。
声明:除非注明,本站内容由无锡网站建设马氪软件原创发布©,转载请联系我们授权合作。