網頁信噪比

信噪比SNR(Signal to Noise Ratio)又稱為訊噪比,是一個聲學概念,狹義來講是指放大器的輸出信號的電壓與同時輸出的噪聲電壓的比。

網頁信噪比是指一個網頁上的文字內容與html代碼的比率。從搜尋引擎的原理來講,其抓取系統首先是將整個網頁下載下來,然後將裡面的文字內容提取出來,經過分析去除html格式,清除噪音,然後分詞,最後存入索引庫。在這個過程中,搜尋引擎也會經過去噪的過程,很明顯,網頁信噪比越高,搜尋引擎抓取的效率就會越高,搜尋引擎蜘蛛每天需要處理很多的數據,如何能夠快速的提取網頁的主題信息是個十分重要的任務。

基本介紹

  • 中文名:網頁信噪比
  • 外文名:Signal to Noise Ratio
  • 簡稱:SNR
  • 別稱:訊噪比
  • 領域:IT
  • 合理比率:大於30%
作用,最佳化方式,信噪比怎么查詢,

作用

在網頁最佳化中,搜尋引擎主要抓取除去html標籤後的文本內容,這部分內容可以認為是不失真聲音信號,而同時產生的那部分html標籤內容,可以被認為是噪聲。因此,網頁信噪音比,可以這樣理解:指網頁中的文本內容部分與生成這些文本而產生的html標籤內容的比率。聲學中,信噪比越高,說明聲音信號越清晰,同理,網頁信噪比越高,說明頁面中純文本內容相對越多,搜尋引擎抓取頁面也越容易。
對於一個網頁也分為有用信息和無用信息,搜尋引擎的工作原理一般是通過對網站的標題,描述,關鍵字和外部連結等因素的整合,判斷出來你的網站類型,然後按照這個類型來識別你網頁上面的文字,如果文字和網站類型沾上邊的,說明有用信息就多,如果網頁上面的內容和網站類型相差十萬八千里,那自然就是無用信息了,然後再將這個有用信息和無用信息進行比值,比值越大說明內容相關度就越高,反之則越低,而且現在搜尋引擎更為智慧型化,如果你在一大段和網站類型無關的文字中插入網站的關鍵字,這樣看起來是在增加網站相關性,實際上這是很影響用戶的體驗的,所以搜尋引擎會認為你在作弊!也會把這個關鍵字當成噪音的!

最佳化方式

減少網頁中的圖片、flash,將html頁面內的css樣式轉換成外部調用的css樣式表,封裝css、js等,能大幅度提高網頁信噪比。有用信息除以總代碼長度。其實就是純文本,除以代碼長度。任何一種計算方法,都以讀取最少數據獲得最多有用信息為依據,這個原則是對搜尋引擎最友好的原則。一般而言,網頁信噪比大於30%比較合理,網頁的相關性是非常重要的。

信噪比怎么查詢

一般人工去計算頁面信噪比這是不現實的,大家可以利用信噪比查詢工具去查詢,網上提供的信噪比查詢工具不多,推薦大家使用站長工具箱提供的信噪比查詢功能。一般來說,網頁信噪比大於30%是比較合理的,建議大家提高網頁內容相關性。剛剛使用了該工具查詢了本部落格首頁,查詢結果是55.8%,工具表示本部落格首頁的信噪比還是不錯的,不過,希望大家明白,工具只是一個參考,不能全信它,合理的使用工具可以讓工作更加方便。

相關詞條

熱門詞條

聯絡我們