sitemap

sitemap

Sitemap 可方便網站管理員通知搜尋引擎他們網站上有哪些可供抓取的網頁。最簡單的 Sitemap 形式,就是XML 檔案,在其中列出網站中的網址以及關於每個網址的其他元數據(上次更新的時間、更改的頻率以及相對於網站上其他網址的重要程度為何等),以便搜尋引擎可以更加智慧型地抓取網站。

基本介紹

  • 中文名:網頁地圖
  • 外文名:sitemap
  • 形式:XML,html,建站工具
  • 釋義:n.網站地圖
解釋,最佳化步驟,格式,Google SiteMap,百度sitemap,XML標籤,作用,介紹,套用,生成,使用方法,注意要點,

解釋

Google雅虎、和微軟都支持一個被稱為xml網站地圖(xml Sitemaps)的協定,而百度Sitemap是指百度支持的收錄標準,在原有協定上做出了擴展。百度sitemap的作用是通過Sitemap告訴百度蜘蛛全面的站點連結,最佳化自己的網站。百度Sitemap分為三種格式:txt文本格式、xml格式、Sitemap索引格式。

最佳化步驟

1,我們需要為每一個頁面連結介紹一段簡短的文字,這樣可以提示這部分內容是關於哪方面的。
2,要為谷歌,百度這樣的搜尋引擎提供一條"綠色的通道"為蜘蛛提供可以瀏覽整個網站的連結,使搜尋引擎能迅速收錄網站的主要的網頁,例如首頁,詳細頁及幫助等頁面。
3,如果用戶已經在你網站上搜尋過某些文章或信息,此時就需要有一個關於已經查看過的頁面或列表.如果沒有這些程式,那么你需要做一個文字連結到某個頁面並且這個頁面是可以得到所有想查詢的內容連結以便告訴用戶如何去查找他們需要查找的信息。
4,如果你網站的連結因為某些原因例如連結失效過無法獲得原來連結的話,此時你就需要做一個錯誤頁面的轉向,這個錯誤的轉向頁面你也可以充分發揮你的想像力以便做的更加漂亮。
5,這一點很重要,你可以在網站地圖的文本和超級連結里提到你要最佳化的主要的關鍵字,以便幫助搜尋引擎來識別。
6,間接的幫助搜尋引擎能夠輕輕鬆鬆索引到一些動態的頁面,最好此時的動態頁面你將其為偽靜態化,當然靜態化是最好的了,因為搜尋引擎最喜歡靜態化的頁面。

格式

Google SiteMap

Google SiteMap Protocol是Google自己推出的一種站點地圖協定,此協定檔案基於早期的robots.txt檔案協定,並有所升級。在Google官方指南中指出加入了Google SiteMap檔案的網站將更有利於Google網頁爬行機器人的爬行索引,這樣將提高索引網站內容的效率和準確度。檔案協定套用了簡單的XML格式,一共用到6個標籤,其中關鍵標籤包括連結地址、更新時間、更新頻率和索引優先權。
<urlset xmlns=“網頁列表地址”>
<url>
<loc>網址</loc>
<lastmod>2005-06-03T04:20-08:00</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>網址</loc>
<lastmod>2005-06-02T20:20:36Z</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>

百度sitemap

<?xml version="1.0" encoding="UTF-8"?>
<urlset>
<url>
<loc>網頁地址</loc>
<lastmod>2010-01-01</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
</urlset>

XML標籤

changefreq:頁面內容更新頻率。
lastmod:頁面最後修改時間
loc:頁面永久連結地址
priority:相對於其他頁面的優先權
url:相對於前4個標籤的父標籤
urlset:相對於前5個標籤的父標籤
我將一句一句分解講解這個xml檔案的每一個標籤:
<urlset xmlns="
這一行定義了此xml檔案的命名空間,相當於網頁檔案中的<html>標籤一樣的作用。
<url>
這是具體某一個連結的定義入口,你所希望展示在SiteMap檔案中的每一個連結都要用<url>和</url>包含在裡面,這是必須的。
<loc></loc>
用<loc>描述出具體的連結地址,這裡需要注意的是連結地址中的一些特殊字元必須轉換為XML(HTML)定義的轉義字元,如下表: 字元 轉義後的字元
HTML字元 字元編碼
& 符號 & &amp;
單引號 ' &apos;
雙引號 " "
大於 > &gt;
小於 < &lt;
<lastmod>2005-06-03T04:20:32-08:00</lastmod>
<lastmod>是用來指定該連結的最後更新時間,這個很重要。Google的機器人會在索引此連結前先和上次索引記錄的最後更新時間進行比較,如果時間一樣就會跳過不再索引。所以如果你的連結內容基於上次Google索引時的內容有所改變,應該更新該時間,讓Google下次索引時會重新對該連結內容進行分析和提取關鍵字。這裡必須用ISO 8601中指定的時間格式進行描述,格式化的時間格式如下:
年:YYYY(2005)
年和月:YYYY-MM(2005-06)
年月日:YYYY-MM-DD(2005-06-04)
年月日小時分鐘:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37+08:00)
年月日小時分鐘秒:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37:30+08:00)
這裡需注意的是TZD,TZD指定就是本地時間區域標記,像中國就是+08:00了
<changefreq>always</changefreq>
用這個標籤告訴Google此連結可能會出現的更新頻率,比如首頁肯定就要用always(經常),而對於很久前的連結或者不再更新內容的連結就可以用yearly(每年)。這裡可以用來描述的單詞共這幾個:"always", "hourly", "daily", "weekly", "monthly", "yearly", "never",具體含義我就不用解釋了吧,光看單詞的意思就明白了。
<priority>1.0</priority>
<priority>是用來指定此連結相對於其他連結的優先權比值,此值定於0.0 - 1.0之間
還有</url>和</urlset>,這兩個就是來關閉xml標籤的,這和HTML中的</body>和</html>是一個道理
另外需要注意的是,這個xml檔案必須是utf-8的編碼格式,不管你是手動生成還是通過代碼生成,建議最好檢查一下xml檔案是否是utf-8編碼,最簡單的方法就是用記事本打開xml然後另外儲存為時選擇編碼(或轉換器)為UTF-8。
登入Google提交你的SiteMap檔案,連結,如果還沒有註冊或者登入Google,就先用自己的帳號登入Google,登入後轉到Your Sitemaps狀態頁面,可以點擊那個Add a Sitemap + 跳轉到提交頁面進行Sitemap檔案的提交。建議檔案放在你的站點根目錄下。給Google提交你的Sitemap URL後可以看見在列表里已存在,不過這時候還沒有生效,必須過幾個小時後Status欄變成OK表示正式生效,如果不是OK,可以查看Google給出的狀態標示解釋看看是什麼原因。

作用

介紹

網路抓取工具通常會通過網站內部和其他網站上的連結查找網頁。Sitemap 會提供此數據以便允許支持 Sitemap 的抓取工具抓取 Sitemap 提供的所有網址,並了解使用相關元數據的網址。使用 Sitemap協定並不能保證網頁會包含在搜尋引擎中,但可向網路抓取工具提供一些提示以便它們更有效地抓取網站。
sitemap

套用

Sitemap 0.90 是依據創意公用授權-相同方式共享(Attribution-ShareAlike Creative Commons License) 的條款提供的,並被廣泛採用,受 Google、Yahoo! 和 Microsoft 在內的眾多廠商的支持。

生成

步驟
方法一:
1.打開瀏覽器輸入線上生成Sitemap網站的網址;
2.在表單裡面填入要生成sitemap的網頁的網址,然後點擊提交;
3.打開了生成的數據結果頁面,複製文本框裡面的代碼;
4.新建一個文本檔案把代碼貼上進去,然後另外儲存為utf-8格式的檔案,檔案名稱為sitemap.xml,然後把這個檔案上傳到自己網站的對應的根目錄下面;
5.打開瀏覽器輸入網址 ,點擊右上角的登入,用自己的google帳戶登入,還沒有 Google 帳戶? 創建一個帳戶 ,註冊帳戶然後登入帳戶;
6.登入成功以後,點擊進入用戶管理中心,然後點擊:網站管理員工具;
7.首先添加你的網址連結 ,添加成功以後,在網址的對應項後麵點擊添加,打開sitemap的添加頁面,選擇下拉選單,選擇普通網站地圖,下面出現文本表單,在空白表單後面添加sitemap.xml,然後點擊提交;
8.好了!sitemap提交成功,等待5個小時之內google收錄你的網站!
方法二:
1.到線上生成sitemap網站下載軟體:
此類工具需要下載到本地生成地圖,生成速度較快。
2.運行軟體生成sitemap檔案:工程還有新建那兩欄隨便寫,例如"sitemapx" "hongdex" 都行,確認後,顯示基本信息,直接默認,點擊下一步,接著點擊抓取網頁。網頁抓取完直接點擊生成,接著點複製檔案,選取路徑。sitemap的檔案就這樣製作完成了;
3.通過FTP提交sitemap檔案到網站根目錄:這個應該都會的了,不懂的可以直接百度搜尋”如何通過ftp工具提交檔案“等類似關鍵字;
4.登入Google網站管理員工具提交網站地圖sitemap檔案:前提已經有註冊google賬號跟添加了網站,控制台首頁那顯示sitemaps一欄,直接點擊,提交網站前輸入”sitemap.xml“ ,最後直接點擊提交網站。步驟完成!最後等著谷歌收錄網站頁面了。
至於百度蜘蛛則是html格式
Sitemap的使用和登入google
使用Google sitemap能提高網站/網頁在SERP中的排名(或提高SEO效果) Sitemaps只是在一定程度上提高網站頁面被收錄、索引的效率,從這個意義上說,對網站的整體SEO效果當然是有所助益的。
但是,Sitemaps與網站/網頁最終出現在SERP中的排名則沒有任何直接意義上的聯繫,這是兩個雖有聯繫但實現過程中交叉部分很少的兩個機制。——當然,如果非要強辯說,隨著網站內頁面收錄數量增加,站內的交叉連結權值會相應提高,而這會對最終的排名產生影響,倒也能在某種程度上說得過去,不過,影響多大就難說了。

使用方法

第一步:添加網站,驗證網站歸屬,等待審核
·登錄後點擊“添加網站”。若網站刪除或更換域名,則需重新提交;
·點擊“驗證此網站”,選擇驗證方式並獲取驗證檔案,完成驗證;
· 驗證方式一:檔案驗證;
· 驗證方式二:HTML標籤驗證;
·等待管理員審核。主要審核網站屬性、網站內容質量等。審核最長可能需要一天時間。
第二步:通過點擊“數據管理”,添加新數據
如何添加新數據
·選擇數據的類型,根據類型對應的xml格式規範部署您的數據檔案;
·為您的數據指定更新周期;
·按照xml格式規範部署好檔案後,在地址欄填寫檔案存放地址,點擊提交即可。
我們對檔案的處理時間長短將視檔案大小而定。
如何手動更新已提交的數據
·如果您想在指定更新周期以外,手動通知我們數據有更新,可以在“數據管理”頁面選中要手動更新的檔案並點擊“更新所選”即可;
·如果數據存在錯誤或不符合協定格式,則狀態欄會顯示為錯誤,請參考平台提示修改並更新;
·您可通過平台查看數據的統計信息,包括已抓取數量,最新處理時間等。
註:百度對已提交的數據,不保證一定會抓取及索引所有網址,並且不保證其排名。

注意要點

全部連結真實有效
地圖的主要目的是方便搜尋引擎蜘蛛抓取的,如果地圖存在死鏈或壞鏈,會影響網站在搜尋引擎中網站權重的,所以要仔細檢查有無錯誤的連結地址,提交前通過站長工具,檢查網站的連結是否有效。
簡化網站地圖
網站地圖不要出現重複的連結,要採用標準W3格式的地圖檔案,布局要簡潔,清晰,如果地圖是內容式地圖,每頁不要超過100內容個連結,採用分頁的行式,逐一開來,這樣方便搜尋引擎蜘蛛逐頁爬行。
更新網站地圖
建議經常更新網站地圖,經常的更新地圖,便於培養搜尋引擎蜘蛛爬行的粘度。經常有新的地圖內容生成,長期以來,蜘蛛就會更關注,培養蜘蛛的爬行規則,這樣網站內容能更快的被搜尋引擎抓取收錄。
百度sitemap工具升級改名公告
新連結提交工具將功能整體分為兩部分:自動提交和手動提交;自動提交里又分實時推送和sitemap。
百度三種連結提交方式的區別
1.主動推送的收錄速度是最快的,我們建議您定期將網站內新增高質連結通過此方式推送給百度,以保證該連結及時被百度發現。注意是新增高質連結喔,如果多次提交歷史連結、低質連結,會導致我們不再信任您提交的數據。
2.sitemap功能可以用來向百度提交歷史數據和重要數據,或者將一些定期例行更新的網頁通過sitemap提交給百度。
3.在實時推送和sitemap出現問題時,或者新製作的專題頁無法通過實時推送提交時,手工提交也是值得信任的工具喔。

相關詞條

熱門詞條

聯絡我們