搜索引擎在抓取并解釋網(wǎng)頁內容的時候存在諸多限制,使得搜索引擎看到的網(wǎng)頁內容與人類看到的并不完全一致。本篇內容主要介紹構建網(wǎng)頁方面的技術,以便網(wǎng)頁能讓搜索引擎和人類看到的內容保持一致。同時,本篇內容也建議分享給網(wǎng)頁設計人員和開發(fā)人員,以保證大家理解一致。
構建對搜索引擎友好網(wǎng)站的主要內容包括:
內容可索引
鏈接可爬行
關鍵詞布局策略
URL構建指南
重復內容官方化
結構化內容的運用
1、內容可被索引
網(wǎng)頁中最重要的內容保證為HTML格式。盡管爬蟲技術一直在進步,但是搜素引擎還是會降低圖片、flash、js等非文本內容的權重。確保搜索引擎可以看到內容的最簡單方式就是把他們放到HTML代碼中。同時,對于要求更多可視化高級樣式的用戶,可以有其他替代辦法:
為圖像提供描述性文字,所有圖片格式增加Alt;描述。
提供帶有鏈接可以供抓取的搜索框。
為flash、js、視頻等提供描述性文字內容。
像搜索引擎一樣重新理解你的網(wǎng)站
許多網(wǎng)站被索引的內容存在很嚴重的問題,可以通過谷歌/百度快照或者站長平臺的模擬抓取等方式進行檢查,來判斷哪些內容是可以被搜索引擎索引的。
例如以下這個網(wǎng)頁,完全由flash構建(或者現(xiàn)在很多官網(wǎng)用js構建),內容可讀性很差,可能在人來看內容豐富的頁面,搜素引擎什么都看不到,更別談給予索引和排名了。
2、可供爬行的鏈接結構
搜索引擎主要通過鏈接來發(fā)現(xiàn)新的網(wǎng)頁內容,所以一個爬行流暢的鏈接結構至關重要。
例如以下結構,Google可以很順利的抓取A、B、E網(wǎng)頁的內容,卻無法發(fā)現(xiàn)C、D網(wǎng)頁的內容,盡管C、D頁面是網(wǎng)站的重要頁面,有好的內容和關鍵詞布局,但是在搜索引擎中,它們是不存在的。
幾種常見的頁面無法被索引的原因:
在線表單格式,例如登錄后才能查看內容;
無法解析JS中的鏈接;
頁面被robots.txt或者meta robot形式屏蔽;
Frames or iframes結構。
有數(shù)百個甚至上千個鏈接的頁面上的鏈接。
3、關鍵詞策略
關鍵詞是搜索過程的基礎,它們是自然語言搜索的基石。事實上,信息檢索的整個科學(包括像谷歌這樣的搜索引擎)都是基于關鍵詞的。當搜索引擎對網(wǎng)頁內容進行爬行和索引時,它們會在基于關鍵詞索引跟蹤這些網(wǎng)頁,從而能在短短的一秒鐘內檢索所需的數(shù)據(jù)。
因此,如果你想讓你的頁面有機會在搜索結果中排名為dog;,那么一定要確保dog;這個詞是你網(wǎng)頁中可爬行內容的一部分。
搜索引擎會檢測頁面上如何使用關鍵詞,以幫助確定特定文檔與搜索詞的相關性。優(yōu)化頁面排名的好方法之一是確保要排名的關鍵詞在標題、正文和元數(shù)據(jù)中多次被提及。
另外,關鍵詞密度的神話一直廣為流傳,有科學實驗證明:關鍵字密度與內容、質量、語義和相關性無關,所以不要過分追求關鍵詞堆砌,影響用戶體驗。
關鍵詞在頁面上的使用技巧
關鍵詞使用位置仍然是搜索引擎排名算法的一部分,我們可以應用一些有效的關鍵詞使用技巧來優(yōu)化頁面。Moz研究人員進行了大量測試,并根據(jù)關鍵詞使用策略觀察了大量的搜索結果和變化。推薦這樣來操作:
在標題標簽中至少出現(xiàn)一次。盡量使關鍵詞短語靠近標題標記的開頭。
在頁面頂部附近出現(xiàn)一次。
在正文中,至少兩到三次,包括變體(同義詞等)。如果內容很長,可能還要多幾次。在使用關鍵字或變體時,可能認為出現(xiàn)越多越好,但在我們的經驗中,添加更多的術語或短語往往對排名幾乎沒有影響。
頁面上圖像的alt屬性中至少有一次。這不僅有助于網(wǎng)絡搜索,也有助于圖像搜索,偶爾會帶來寶貴的流量。
在URL中出現(xiàn)一次。
在元描述(description)標記中至少出現(xiàn)一次。請注意,元描述標簽不會被搜索引擎用于排名,而是有助于吸引閱讀結果頁面的搜索者點擊,因為元描述變成了搜索引擎使用的文本片段。
在鏈接錨文本中通常不應該使用指向站點上其他頁面的相同關鍵字,這被稱為關鍵字同化。
4、URL構造指南
1、URL便于用戶理解。讓用戶能夠看到URL,就能猜到網(wǎng)頁大致內容。
2、URL長度越短越好。便于用戶復制分享,同時便于搜索引擎存庫。
3、URL中出現(xiàn)關鍵詞。
4、URL靜態(tài)化。最好的URL是人類可讀的,沒有很多參數(shù)、數(shù)字和符號。使用諸如mod-rewrite for apache和isapi-rewrite for microsoft之類的技術,您可以輕松地轉換動態(tài)URL,比如https://moz.com/blog?將id=123轉換成更可讀的靜態(tài)版本,如:https://moz.com/blog/google-fresh-factor。即使是URL中的單個動態(tài)參數(shù)也可能導致整體排名和索引降低。
5、URL中使用連字符(-)分隔單詞。并非所有的Web應用程序都能準確地解釋分隔符,如下劃線(uu)、加號(+)或空格(%20),因此使用連字符(-)來分隔URL中的單詞,如上面的Google Fresh Factor;URL示例中所示。
5、重復內容規(guī)范化
重復內容是任何網(wǎng)站都會遇到的重要問題之一。搜索引擎一直致力于打擊空短內容和重復內容問題。
但是,隨著網(wǎng)站規(guī)模的擴大,難免會出現(xiàn)相同內容的不同版本,搜索引擎很難判斷其權重,所以一般會給予最早被發(fā)現(xiàn)的頁面高權重,而其他內容被判斷重復會降低權重,甚至不予收錄。
在這里,一般會有兩種處理辦法:
一是將多個版本的重復內容進行內容合并。例如UGC為主的社區(qū)內容,很容易出現(xiàn)用戶重復發(fā)帖的情況,可以對同類型的主題進行合并處理后,舊版本頁面進行301跳轉指向新生成的合并頁面,可以有效提升合并內容的權重,從而獲得好排名。(知乎的部分帖子就是這樣的處理規(guī)則)。
二是運用規(guī)范化標簽(canonical),指向你想獲得排名的主URL,但是這個方法效果不如以上第一種辦法,可以作為備選方案。
6、富摘要的運用
百度阿拉丁主打結構化內容,谷歌也有第0位搜索結果的特殊樣式呈現(xiàn),這些都屬于富摘要形式。盡管富摘要不是網(wǎng)站標配選項,但是如果網(wǎng)站能夠提供不錯的結構化內容,可以在與搜索引擎的合作中收到不少紅利。(薄荷個人經歷過的幾次百度阿拉丁合作都是我方網(wǎng)站可以提供行業(yè)好的結構化內容)。
本文名稱:如何設計開發(fā)對搜索引擎友好的網(wǎng)站
當前URL:http://www.ekvhdxd.cn/news/33471.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站制作、微信小程序、定制開發(fā)、云服務器、企業(yè)網(wǎng)站制作、電子商務
廣告
聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源:
創(chuàng)新互聯(lián)