当前位置:首页 >  站长 >  搜索优化 >  正文

百度原创星火计划 搜索引擎如何识别重复内容

 2013-07-09 15:33  来源: 娄底人才网   我来投稿 撤稿纠错

  域名预订/竞价,好“米”不错过

百度搜索引擎为了整顿互联网的信息内容,大尺度推出“百度原创星火计划”,为了此计划能高力度执行,建立了相应的专题页,更是邀请高质量的站点加入星火计划。我们现在面对的正是一个充斥着“重复内容”、“大量垃圾内容”的时代,星火计划中搜索引擎又是如何识别重复内容的?

搜索引擎为给用户提供高质量的内容,在用户搜索相关内容时,会通过一些过滤机制过滤掉重复的内容,而不是展示出大量重复相同的结果,如果网站存在大量重复内容,在搜索引擎过滤过程中可能会给网站带来影响。

搜索引擎来站点抓取内容之前,已经有爬行页面预计,如果网站存在大量的重复页面,蜘蛛会对这些页面进行一一检索,虽然在返回的结果被过滤,但是却浪费了蜘蛛对站点页面抓取的预算,减少了蜘蛛抓取其他高质量页面的机会,重复页面一样的也会分散网站的整体权重,这样并导致蜘蛛中能获取到的有意义的页面减少。

站长无法判断搜索蜘蛛会抓取重复页面中那个版本,搜索引擎自己也无法清除说明,用户不同的搜索,蜘蛛返回的页面可能是不同的,存在的重复页面可能也有不同的偏向,用户搜索时返回的页面是否是你最喜欢返回的页面,是否能给你带来最高的流量转化率?这些都是不得而知的,要想减少重复页面的权重分散,可以在robots文件中屏蔽收录,或者添加canonical标签转移权重。

像上面分析到的情况,重复内容会影响蜘蛛的抓取。同时,搜素引擎为了互联网生态公平健康发展及优质原创网站的集体利益,减少原创价值被采集站所得,会对重复、装载、垃圾信息站点进行惩罚。搜素引擎提出这样的申明,它又是怎么去识别重复内容的呢?

重复内容可以发生在不同的站点,也可以发生在同一个网站上,非优化的SEO优化CMS系统,导致网站存在多个URL地址可访问同一个页面,这样的情况也是重复内容,蜘蛛遇到这样的情况时会判断哪个页面才是重要的页面,会先从robots文件中检测,是否有禁止抓取的地址,如果有则停止对重复页面地址的抓取,如果没有就会继续抓取内容,在抓取时于遇到meta标签,注明noindex这些页面并不是为蜘蛛准备的,这种情况蜘蛛也同样不会继续抓取重复,减少蜘蛛的抓取难度,即使是重复的内容,蜘蛛也只会抓取有价值的那个版本。

百度的星火计划邀请站长参与原创站点,如果您的网站是本网站首创,非抄袭模仿的、内容和形式都具有独特个性的资源;且具有社会共识价值的资源,符合国家相关规定;不在第二次装载及伪原创之内;您并可提交您的站点到百度原创星火计划站点。这种方法可减少因为站点权重不高,网站内容在被高权重网站转载后,蜘蛛会认为转载的站点是原创的内容,你的站反而是转载采集站点。

搜索引擎到底如何判断网站内容是否原创,重复内容页面中到底哪个页面才是原创页面,这是任何一个搜索引擎都未曾公布的算法。但娄底人才网()从百度官方的数据了解到,具有“原创”标签的网站,原创星火计划上线前后的同期流量对比显示,原创url流量增长明显。同时,原创星火计划上线后一段时间内原创url流量增长明显并逐渐趋于平稳,可见如果网站能加入百度原创计划,网站在流量提升方面还是有很大帮助的。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • 百度原创保护功能正式关闭

    百度原创保护功能上线的那一刻,我没有抱任何幻想,百度原创保护功能下线的那一刻,我不曾有失落的心情,面对百度,面对SEO,早已淡然,与其纠结,不如放下。我们需要做的不是怎么迎合百度,而是怎么满足用户,提升用户体验。

    标签:
    百度原创
  • 百度原创标识新阶段网站内容如何做

    百度之前一直呼吁站长应该重视,文章质量度特别是原创文章。从百度之前推出的星火计划开始,一直到现在都在提醒站长对于网站内容建设问题。不在仅仅是抄袭和转载别人文章,应该从用户本身出发来做内容。最近一两月,很多站长都在反馈网站降权,排名全无情况出现。小编在查看朋友网站出现排名下降的文章,发现很多站长内容都

  • 谈谈百度原创算法的致命失误

    起这么一个标题,不是为了做标题榜,而是从自己作为一个小站长的角度来思考,百度目前的原创算法是存在致命缺陷的。先从我的经历聊起最近在检查自己所做的两个网站时发现了这样的事。这两个网站都是自己原创内容的网站,弄了好几个编辑写内容。网站无论从用户体验还是从内容原创角度,都不差。但近一年了流量一直是半死不活

  • 百度是如何保护原创的?谈百度原创那点事

    原创一直是大问题,往大了说,互联网生态环境日趋恶劣,采集伪原创低质量内容泛滥,严重挤占了优质原创资源的生存空间。导致互联网资源整体质量大幅下降,网民受损、优质站长受损、搜索引擎亦受损。往小了说,很多站长一直在进行原创建设,而得不到应有的保护。如何加大对站点原创的保护以及如何衡量原创是否能满足用户需求

    标签:
    百度原创
  • 百度原创算法——必死!

    作为新生,我也问过一些前辈“菜鸟怎么做seo”他们会说:多原创,多外链收录自然就有了,有了权重有了pr渐渐的排名就会上去了。但是原创真的有用么?答案绝对是肯定的!但是你写的原创有效果么?答案是模糊的!原因有如下几点:

    标签:
    百度原创

热门排行

信息推荐