<source id="48mse"><pre id="48mse"></pre></source>
  • <noscript id="48mse"></noscript>
  • <source id="48mse"><tr id="48mse"></tr></source>
    <source id="48mse"><tr id="48mse"></tr></source>
    <noscript id="48mse"><object id="48mse"></object></noscript>

    等風(fēng)也等你

    如何避免搜索引擎蜘蛛抓取重復(fù)頁(yè)面的方法

    墨殤 101 ℃ 0 條

    如何避免搜索引擎蜘蛛抓取重復(fù)頁(yè)面的方法

      搜索引擎面對(duì)的是互聯(lián)網(wǎng)萬(wàn)億網(wǎng)頁(yè),如何高效抓取這么多網(wǎng)頁(yè)?這便是網(wǎng)絡(luò)爬蟲(chóng)的工作。我們也叫它網(wǎng)絡(luò)蜘蛛,做為站長(zhǎng),我們每天都在與它親密接觸。做SEO要充分了解SEO的抓取情況,同時(shí)要做好哪些頁(yè)面應(yīng)該被抓取,和哪些頁(yè)面不希望被抓取的篩選。例如,今天需要和大家講的,如何避免搜索引擎蜘蛛抓取重復(fù)頁(yè)面。

      針對(duì)每一位SEO從業(yè)者而言,爬蟲(chóng)每天來(lái)我們的網(wǎng)站進(jìn)行網(wǎng)頁(yè)的抓取,是十分寶貴的資源。但在這中間由于爬蟲(chóng)無(wú)序的抓取,勢(shì)必會(huì)浪費(fèi)一些爬蟲(chóng)的抓取資源。這中間我們就需要解決搜索引擎爬蟲(chóng)對(duì)我們的網(wǎng)頁(yè)重復(fù)抓取的問(wèn)題。

      在聊這個(gè)問(wèn)題之前,我們需要理解一個(gè)概念。首先爬蟲(chóng)本身是無(wú)序的抓取,他不知道先抓什么再抓什么,只知道看到了什么,且計(jì)算后認(rèn)為有價(jià)值就進(jìn)行抓取。

      而對(duì)于我們而言,抓取的整個(gè)過(guò)程中,我們最要解決是如下幾類

      1、新產(chǎn)生的頁(yè)面,沒(méi)有被抓取過(guò)的

      2、產(chǎn)生了一段時(shí)間,遲遲不被抓取的

      3、產(chǎn)生了一段時(shí)間,卻一直沒(méi)收錄的

      4、產(chǎn)生很久的頁(yè)面,但最近更新了

      5、包含內(nèi)容更多的聚合頁(yè)面,如首頁(yè)、列表頁(yè)

      6、如上幾類,按照順序我們定義哪一類最需要被爬蟲(chóng)抓取。

      針對(duì)大型網(wǎng)站,搜索引擎爬蟲(chóng)抓取資源過(guò)剩,而針對(duì)小網(wǎng)站,抓取資源稀缺。所以在這里我們強(qiáng)調(diào)一下,我們不是要解決搜索引起爬蟲(chóng)重復(fù)抓取的問(wèn)題,而是要解決搜索引擎爬蟲(chóng)最快的抓取我們希望抓取的頁(yè)面。要把這個(gè)思路糾正!

      下面,我們聊一下怎么讓搜索引擎爬蟲(chóng)最快的抓取我們希望被抓取的頁(yè)面。

      爬蟲(chóng)是抓取到一個(gè)網(wǎng)頁(yè),從這個(gè)網(wǎng)頁(yè)在找到更多的鏈接,周而復(fù)始的過(guò)程,那么這個(gè)時(shí)候我們就要知道要想被爬蟲(chóng)更大概率抓取,就要給更多的鏈接,讓搜索引擎爬蟲(chóng)發(fā)現(xiàn)我們希望被抓取的網(wǎng)頁(yè)。這里我拿上述的第一種情況舉例說(shuō)明一下:

      新產(chǎn)生的頁(yè)面,沒(méi)有被抓取過(guò)的

      這類一般都會(huì)是文章頁(yè),針對(duì)于這類我們的網(wǎng)站每天都會(huì)大量產(chǎn)生,所以我們就要在更多的網(wǎng)頁(yè)給予這部分鏈接。例如首頁(yè)、頻道頁(yè)、欄目/列表頁(yè)、專題聚合頁(yè)、甚至文章頁(yè)本身,都需要具備一個(gè)最新文章板塊,以此等待爬蟲(chóng)抓取到我們的任何網(wǎng)頁(yè)時(shí),都能發(fā)現(xiàn)最新的文章。

      同時(shí),試想一下,這么多頁(yè)面都有新文章的鏈接,連接傳遞權(quán)重,那這新文章,既被抓取了,權(quán)重也不低。被收錄的速度會(huì)明顯提升。

      那針對(duì)那些長(zhǎng)時(shí)間不收錄的,也可以考慮是不是權(quán)重太低了,我多給一些內(nèi)鏈支持,傳遞一些權(quán)重。應(yīng)該會(huì)有收錄的可能。當(dāng)然也有可能不收錄,那你就要靠?jī)?nèi)容本身的質(zhì)量了。之前有一篇文章是專門說(shuō)內(nèi)容質(zhì)量的也歡迎大家閱讀:什么內(nèi)容容易被搜索引擎判斷為優(yōu)質(zhì)內(nèi)容?。

      所以,我們?yōu)榱私鉀Q搜索引擎爬蟲(chóng)重復(fù)抓取問(wèn)題不是我們最終要解決的。因?yàn)楸举|(zhì)上搜索引擎爬蟲(chóng)是無(wú)序的,我們只能通過(guò)針對(duì)網(wǎng)站的架構(gòu)、推薦算法、運(yùn)營(yíng)策略等進(jìn)行干預(yù)。使爬蟲(chóng)給予我們更理想的抓取效果。

      以上就是《如何避免搜索引擎蜘蛛抓取重復(fù)頁(yè)面的方法》的全部?jī)?nèi)容,僅供站長(zhǎng)朋友們互動(dòng)交流學(xué)習(xí),SEO優(yōu)化是一個(gè)需要堅(jiān)持的過(guò)程,希望大家一起共同進(jìn)步。


    墨殤SEO

    發(fā)表評(píng)論 (已有0條評(píng)論)

    快來(lái)評(píng)論,快來(lái)?yè)屔嘲l(fā)吧~

    主站蜘蛛池模板: 国产成人综合久久精品尤物| 久久综合香蕉国产蜜臀AV| 久久综合亚洲鲁鲁五月天| 久久综合亚洲鲁鲁五月天| 亚洲综合激情五月色一区| 国产成人综合日韩精品婷婷九月| 99久久国产综合精品麻豆| 亚洲综合激情五月色一区| 国产成人综合亚洲AV第一页| 激情综合婷婷色五月蜜桃| 中文字幕乱码人妻综合二区三区| 综合在线免费视频| 亚洲AV综合色区无码一区爱AV| 亚洲综合欧美色五月俺也去| 国产精品亚洲综合专区片高清久久久| 色与欲影视天天看综合网| 91精品国产综合久久精品| 思思91精品国产综合在线 | 一本久久综合亚洲鲁鲁五月天| 亚洲综合无码AV一区二区| 亚洲av综合av一区二区三区| 久久精品综合电影| 亚洲人成伊人成综合网久久久| 狠狠色综合网久久久久久| 色综久久天天综合绕视看| 伊人情人综合成人久久网小说| 青青热久久综合网伊人| 亚洲综合国产精品| 国产精品国色综合久久| 狠狠色噜噜狠狠狠狠狠色综合久久| 精品久久久久久亚洲综合网| 婷婷丁香五月天综合东京热| 色综合蜜桃视频在线观看| 亚洲色偷偷狠狠综合网| 五月丁香六月综合av| 激情五月婷婷综合网站| 伊人丁香狠狠色综合久久| 亚洲综合校园春色| 色综合久久久无码网中文| 国产成人综合日韩精品无码| 亚洲国产成人五月综合网|