搜索引擎推廣

聊聊搜索引擎的幾個重要概念詞匯

來源：上海網(wǎng)站制作發(fā)布日期： 2017-10-20 15:33 點擊量： 15076

今天我們上海網(wǎng)站制作公司聊聊關于搜索引擎搜錄網(wǎng)頁的幾個相關概念，希望能夠讓大家更好理解搜索引擎的工作原理，幫助大家提升網(wǎng)站優(yōu)化方面的技能。搜索引擎相關的幾個詞是：爬行，抓取，索引，收錄。

關于爬行與抓取

爬行是指搜索引擎蜘蛛在頁面上沿著鏈接發(fā)現(xiàn)新頁面，然后“爬”過去抓取新頁面。抓取是指蜘蛛發(fā)現(xiàn)新頁面后，打開頁面，把頁面HTML代碼存入自己的數(shù)據(jù)庫。通常引文是用crawl或spider（這里是動詞）表示搜索引擎的爬行的工作。

顯然，爬行和抓取是相互交織的。抓取是實際發(fā)生的我們能夠觀察到的過程，在原始日志中，蜘蛛的抓取是有完整記錄的，比如：抓取確切時間、狀態(tài)碼、抓取的文件是哪個、抓取了多大文件等等。蜘蛛對頁面的抓取就和瀏覽器讀取文件是完全一樣的。

這里，人們使用爬行這個詞來形容搜索引擎對網(wǎng)站的訪問，很形象，這里我們上海網(wǎng)站制作公司需要說明的是，實際上并不存在蜘蛛抓取文件時發(fā)現(xiàn)鏈接然后立即跟蹤過去這樣一個過程。蜘蛛抓取文件后存入數(shù)據(jù)庫，程序解析出文件中的鏈接后將 URL存入頁面地址庫，然后蜘蛛從地址庫中按一定規(guī)則選取URL進行抓取。蜘蛛不是真的訪問頁面時看到一個URL就爬過去。

關于索引與收錄

索引指的是將一個URL的信息進行各種整理，如去重、分詞等等，然后將關于這個URL的信息存入數(shù)據(jù)庫，被稱為索引庫。真正用于搜索的是倒排索引，以后如果有機會的話，我們上海網(wǎng)站制作公司再為大家講講這方面的內(nèi)容。要注意的是，索引庫中關于URL的信息不僅是組成頁面內(nèi)容的關鍵詞及其特征（位置、格式等），還有鏈接、更新情況等信息。英文索引這個詞是 index。

收錄也是很多網(wǎng)站制作與優(yōu)化技術人員關心也最常用的詞，其實也是4個概念中最不明確的。被收錄指的是我們能查到頁面被搜索引擎存入了索引庫。但后面我們會看到，進入索引庫的URL并不一定被抓取過，這和SEO們的直覺可能是不一樣的。

理解了搜索引擎的這幾個概念，我們上海網(wǎng)站制作公司認為，以后大家在網(wǎng)站制作的時候就清楚怎么做才能讓搜索引擎喜歡我們的網(wǎng)站了。

本文由上海藝覺網(wǎng)絡科技有限公司（http://11y57l.cn）原創(chuàng)編輯轉(zhuǎn)載請注明

上一篇：穩(wěn)定的搜索引擎排名要技術全面不要作弊下一篇：關鍵詞搜索引擎排名下降該如何應對

搜索引擎推廣

聊聊搜索引擎的幾個重要概念詞匯

相關新聞

專業(yè)分類

了解藝覺

優(yōu)質(zhì)服務

聯(lián)系我們

網(wǎng)站建設

網(wǎng)絡推廣

網(wǎng)站方案

網(wǎng)站案例

技術支持

熱點專題

網(wǎng)站建設

網(wǎng)站改版

網(wǎng)站維護

網(wǎng)站推廣

電子商務平臺搭建

域名/空間/郵局

400電話辦理

備案咨詢