搜索引擎友好的HTML

1.HTML結構化單元
通常HTML提供的結構化單元可以幫助搜索引擎從全局上了解文件內容,以及定位邏輯分區和重要部分,
例如<h1>和<h2>標籤,<b>標籤等。如果在HTML代碼中沒有給出此類結構化單元,搜索引擎將完全根據自己的判斷工作。


2.內容衝突和表格
搜索引擎對越靠近HTML文檔頂端的內容越重視,所以要儘量避免在頁面的初始內容中設置重複和不相關的內容。
通常的內容格式中,最沒有必要設置在HTML文件頂端的是JavaScript代碼。最好將位於HTML文檔頂端的JavaScript
代碼移到底端,或者移到單獨的文件中,因爲JavaScript包含爬蟲難以檢索的大量腳本。
這個問題的另一種常見表現形式就是,由於很多基於表格的站點將導航單元置於網頁左邊,也會出現上述問題。因爲
以這種方式使用表格,將會把主要內容的物理位置向下推,從而導致網頁在搜索引擎中的排名更加靠後。由於導航單元在文檔中的物理位置
很靠前,如果導航單元設置過多,還將導致搜索引擎將無法判斷頁面的主要內容。搜索引擎會檢測頁面上的重複單元,例如
物理位置在主要內容之前的導航單元,然後儘可能多地忽略這些單元。現代搜索引擎不只看源文檔中內容的物理位置,
而是檢查出內容實際顯示出現的位置。儘管如此,避免出現導航單元帶來的問題,總會帶來好處。
要解決這個問題,通常用這三種方法:
(1)使用純CSS類替代表格排版
(2)在使用表格排版時,可以將導航單元放置在頁面的一側
(3)將表格單元在文檔中的物理位置倒置
如果在網頁中使用了表格,可以將其中一部分表格轉換爲CSS版式。由於表格一般佔有很大一片覆蓋區,所以要
縮減HTML代碼規模,最好從代碼中的重複單元(通常由循環生成,例如導航單元和重複區)下手。
表格內容輸出倒置:
<table>
<tr>
<td valign="top">Navigation</td>
<td valign="top">Content</td>
</tr>
</table>
此時,可以通過重寫HTML代碼,在不改變外觀順序的同時,將文檔中的相關內容前置,代碼如下所示:
<table>
<tr>
<td><!-- empty table cell --></td>
<td rowspan="2" valign="top">Content</td>
</tr>
<tr>
<td valign="top">Navigation</td>
</tr>
</table>
通過這個辦法,可以使文檔中導航代碼的物理位置在內容的物理位置之下,而且當代嗎載入瀏覽器時,導航仍會出現在頁面左邊。


3.framework
由於在使用framework時會出現很多問題,以致有很多設計者都對爲什麼要使用framework感到困惑。搜索引擎在搜索含有framework的網站時
,會出現很多問題。當一個頁面中包含與上下文相關的framework時,搜索引擎不能爲該頁面創建索引,只有單個framework
頁面才能被索引。但在經常用導航framework將這些framework關聯起來這樣一來,即使一些單個framework頁面被索引了,也有
可能使得用戶收到不帶導航的孤立頁面。對這個問題也有一個解決方法(與彈出導航頁面中介紹的方法相似),然而此方法又會導致其他問題;
noframes標籤試圖處理這個問題,但它只是個不可見的頁面因素,並且被垃圾網站濫用。任何使用framework的網頁都會存在上述的
問題,因此建議設計網頁時不要使用framework
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章