百度搜索Spider3.0升級對(duì)站(zhàn)點有什(shén)麽好(hǎo)處?
時(shí)間:2022-06-25 11:40:16 來(lái)源:本站(zhàn) 分享到(dào):
近期百度搜索最大(dà)的動作(zuò)應該就是百度Spider3.0升級了(le),簡單的概括下(xià)升級的特點就是:抓取更實時(shí),收錄效率更快(kuài),對(duì)原創優質内容更青睐。
此次升級是把當前離線、全量計(jì)算(suàn)爲主的系統,改造成實時(shí)、增量計(jì)算(suàn)的全實時(shí)調度系統,萬億規模的數據進行實時(shí)讀寫,可以收錄90%的網頁,速度提升80%!
『抓取、建庫更快(kuài)—提交的内容更容易被抓取』
鏈接發現(xiàn)方面:如今sipder每天發現(xiàn)的新鏈接在500億左右的量級,說明(míng)啥?你(nǐ)的站(zhàn)點内容越來(lái)越容易被Spider發現(xiàn)和(hé)抓取,而在百度站(zhàn)長平台提交鏈接是最爲高(gāo)效的,但(dàn)是百度工(gōng)程師建議(yì)站(zhàn)長,不要過度提交鏈接,尤其是低(dī)質鏈接,這(zhè)樣才能(néng)達到(dào)更好(hǎo)更及時(shí)的收錄效果。
鏈接抓取和(hé)建庫方面,開(kāi)發了(le)更強大(dà)的機器學習模型,來(lái)進行鏈接的質量預測,對(duì)庫中所有的鏈接進行全局排序,對(duì)有價值鏈接的召回率提高(gāo)95%!索引展現(xiàn)時(shí)效性提升,原來(lái)是10天左右,現(xiàn)在提升40%~80%不等!我們都知(zhī)道(dào),搜索引擎從(cóng)用(yòng)戶搜索到(dào)最終搜索結果展現(xiàn)的步驟是:抓取、建庫、排序、展現(xiàn),抓取和(hé)建庫速度大(dà)幅提升意味着站(zhàn)點的内容可以比原來(lái)更快(kuài)的展現(xiàn)給最終搜索用(yòng)戶。
『時(shí)效性内容更多—有内容站(zhàn)點的更多機遇』
在對(duì)時(shí)效性頁面收錄方面,在之前的2.0搜索時(shí)代,很(hěn)多中小(xiǎo)站(zhàn)長寫出的高(gāo)質量文(wén)章,一旦被高(gāo)權重的站(zhàn)點轉載,那麽幾乎自(zì)己的原創文(wén)章還不如大(dà)站(zhàn)轉載後來(lái)的流量多,而在3.0時(shí)代,這(zhè)樣的情況将大(dà)有好(hǎo)轉,配合使用(yòng)百度的主動提交等鏈接提交方式,文(wén)章發布後第一時(shí)間提交給百度,那麽一旦被收錄,哪怕其他(tā)的大(dà)站(zhàn)轉載了(le)你(nǐ)的文(wén)章,你(nǐ)的文(wén)章在搜索結果中仍然排名更好(hǎo)。這(zhè)樣,更多的高(gāo)質量内容展示給搜索用(yòng)戶,就是一個更加健康的互聯網生态。
關于時(shí)效性方面,我們現(xiàn)在其實可以自(zì)己搜索某個關鍵詞,在搜索結果中可以發現(xiàn),收錄時(shí)間越近的排名會(huì)越靠前,當然主要集中在新聞類的文(wén)章,這(zhè)就是時(shí)效性,這(zhè)就對(duì)站(zhàn)點的更新頻率提出了(le)更高(gāo)的要求,當然排名不可能(néng)簡單的跟發布時(shí)間有關,還有很(hěn)多維度,但(dàn)是針對(duì)新聞類的文(wén)章,随時(shí)跟進新聞的進度很(hěn)重要。
在這(zhè)我們不得不再提一下(xià)百度站(zhàn)長平台鏈接提交中的主動推送功能(néng),要想時(shí)效性頁面更好(hǎo)的被百度收錄,主動推送功能(néng)時(shí)效性内容提交的是唯一的入口!
『死鏈處理(lǐ)更及時(shí)—被黑低(dī)質頁面全屏蔽』
在死鏈處理(lǐ)方面,Spider3.0啓用(yòng)了(le)全新的死鏈識别模型,能(néng)識别協議(yì)死鏈,以及大(dà)多數内容死鏈、跳轉死鏈等低(dī)質網頁,簡單點說就是在之前的版本,站(zhàn)點通過站(zhàn)長平台提交死鏈,處理(lǐ)速度可能(néng)非常慢,甚至快(kuài)照在一段時(shí)間内仍然存在,但(dàn)是Spider3.0更新後,大(dà)約幾天内就可以處理(lǐ)掉了(le)。當然,如果你(nǐ)要追求最佳處理(lǐ)效果,協議(yì)死鏈是最好(hǎo)的選擇。
『鏈接提交最好(hǎo)用(yòng)—站(zhàn)點提交鏈接會(huì)更易收錄』
主動推送通過工(gōng)具原理(lǐ)是什(shén)麽呢(ne)?主動推送工(gōng)具獲取16個英文(wén)數字組合的字符串,制作(zuò)數據推送接口,實現(xiàn)最快(kuài)速度的數據推送。該功能(néng)自(zì)開(kāi)放(fàng)半年來(lái)參與提交站(zhàn)點近10W,日提交數據5000W,提交數據平均被抓取時(shí)間早于爬蟲發現(xiàn)時(shí)間4個小(xiǎo)時(shí);提交數據當天收錄量60%--100%,這(zhè)說明(míng),大(dà)多數站(zhàn)點使用(yòng)此功能(néng)收效都是不錯的。