(SEO優化)現身說法教你如何優化百度的收錄,權重,關鍵詞排名 SEO優化(一)

    俗話說,"不懂得實踐的學生,就是紙上談兵"。

    前序

    所以作爲做Java Web開發的高手,我也不想做一個只會紙上談兵的趙括。於是乎開始動手,使用比較開放的框架Spring MVC, Spring Shiro + Maven + Myibatis自己開發了一個網站,本以爲做完一個網站,買一個服務器域名,上線後,就可以萬事大吉了,網站就可以被別人看到,我就能想做自己想做的事情了。結果卻是很例外的,原來萬事纔是開了一個頭,更大困難和挑戰還在後面等着我,這個就是我這次要講的SEO優化了。

    初步瞭解

    現在的網絡很發達,本人也沒有具體統計過,但是起碼也得有幾千萬個網站已經在萬維網上運行起來了,那麼既然有那麼多網絡,怎麼樣才能更快的被人瞭解,被人找到了,這時候大家腦袋裏面都會浮現一個詞語 "百度一下,你就知道", 是的,百度已經是一門大家上網必不可少的工具了,甚至很多人,都把百度設置爲自己的主頁,方便查詢內容和消息。

    很明顯了,作爲一個新站,基本上是沒人來訪問了,除了自己整天沒事在那裏點,不做推廣,不上搜索,基本上是很難被人發現的,SEO優化已經漸入我的腦袋。

    問題來了,如何做SEO呢?

    作爲一個程序員的思維,先百度一下找找方法。搜索的結果很多很雜,什麼算法,關鍵詞,權重,長尾詞,原創,定時更新文章,收費培訓班等等,SEO已經是很多培訓結構的一門課程了,信息量很大,非常大。就算是電腦,也得需要時間整理問題,何況我們這些腦容量本來就有限的人啊。還好,有一個朋友,他參加過SEO優化的培訓,算是幫了我一個大忙。

    這個階段,總結一下,總算有一個初步的瞭解,有了一個大概的方向:

1 文章必須是原創的,有一定的質量,這個是網站最基本的要求(其實這個說了也是白說,很多網站都是用爬取工具得到的結果,真正的所有的,都原創,難度太大)

2 網站定時更新,百度爬蟲能夠定時去爬取到最新的內容(這個簡單了,對於我們這些程序員來講,小CASE一個了)

3 網站排版佈局友好,允許百度爬蟲正常訪問,可以很容易抓取到自己需要的內容 (這個跟第二條差不多了)

4 利用百度現有工具,讓百度快速收錄(百度是有很多專門給站長提供的工具的了,下來我會細細跟大家說是哪些工具了,很重要奧~)

5 網站需要有一定的流量,有一定的外鏈,保證每日有正常的訪問量(網站推廣的必須步驟了,具體怎麼實施,的確,非常的繁瑣了,不過,當然是有方法的了)

6 網站必須要有網站地圖頁面

7 網站的網頁必須是靜態的HTML的,方便百度抓取(就是說,不能有jsp類型的動態網頁啦,動態網頁,蜘蛛是很難抓取到內容的,基本是被淘汰)

8 網站訪問速度要快,網站性能提升,爬蟲抓取不要超過3秒

9 設置靜態資源和頁面緩存的過期時間等

10 網站權重提升(攻略還在實踐中。。。)

11 進一步提升網站收錄

12 (其實還有很多很多方法了,這個等,我會進一步補充的,絕對不放鴿子)

      初步優化

第一: 文章必須是原創的,有一定的質量:

    原創,對於一個小博客,或者小網站來講,站長自己發佈一些小文章,其實並不難了,那對於一個大型的網站,原創怎麼來呢,找人寫嗎,對於一般個人來講,成本太高了,想做大網站,不花成本怎麼行?

    其實,當然是可以的了,對於程序員來講,這些都是小問題了,不用自己寫,也能天天原創。具體怎麼來做呢?  估計很多人都想知道吧,其實有很多方法,就現在比較實用的,起碼有3種方法。這些方法,說的太明白了,就會有很多人使用,百度也不傻,幾天就會封殺個乾乾淨淨。

    但是好在,中國的語言很強大,語法,詞彙都很豐富,我這裏先透露一種方法,供大家來參考使用,具體其他方法呢,我會在自己的博客上寫另外一篇專門來介紹這些方法的文章,希望能被百度手下留情別封殺了,如果期待這個介紹方法的文章,記得看更新額!!

    百度原創方法之一: 僞原創算法;

    原創很難,僞原創呢,那就簡單了啊,什麼是僞原創呢? 說白了,他就是把別人的文章複製過來,經過一系列的處理轉化,生成另外一篇文章,這兩篇的文章,意思基本是一樣的,但是百度爬蟲算法,對比後,卻發現是一片原創文章,這就要多靠中國語言的強大性了。僞原創,其實會有一些算法進行創作,比如同義詞替換,語法切換,段落重排等,經過一系列的算法處理後,出來的文章,和原來的文章,文字差異就很大了,但是內容確實一致的。我自己也設計了一個僞原創的算法,有想需要的,可以共同探討額。

    基本上抄襲的文章,肯定會被百度爬蟲算法鄙視的,保持原創,創造原創,是一個不可缺少的部分。

第二: 網站定時更新

    這個就簡單了,我在網站的後臺增加了一個定時發佈文章的功能,每日把需要發佈的文章放進去,網站就會定時發佈,並且重新生成主頁,各個子頁面等,這樣就可以實現了網站的定時更新功能。

    讓百度爬蟲定時來爬取頁面,並且讓爬蟲形成定時爬取並且收錄習慣,時間久了,它到點就會自己來了,不用再去提醒了。

第三:網站排版佈局友好,允許百度爬蟲正常訪問,可以很容易抓取到自己需要的內容

    網站佈局,涉及幾個方面,做網站的人都知道,百度爬蟲,基本上是從頭部來讀取需要的內容的,首先頁面,得有以下幾個標籤:

    標籤:<meta name="description" itemprop="description" content=""/>

    標籤:<meta name="keywords" itemprop="description" content=""/>

    標籤:<title>

    標籤:<meta itemprop="name"  content=""/>

    百度顯示的標題,就是爬蟲從<title>標籤裏面讀取的;

    百度顯示的快照,就是爬蟲從<meta name="description"標籤裏面讀取的;

    爬蟲讀取的關鍵字,是從<meta name="keywords"標籤裏面讀取的,關鍵字裏面的分割,是英文的逗號,記得不要是其他的啊,不然無法識別的;

    主體部分的內容,一定要顯示正常,佈局統一,容易被爬蟲讀取到;

    允許被百度爬蟲正常訪問,這個可不要按字面意思理解了,他涉及到一個配置,就算,你沒有禁止任何目錄或者訪問者,這個配置也必須,一定要有:robots.txt

User-agent:*
Allow:*.html
Allow:/department/*
Allow:/detail/*
Allow:*.txt

    不要問爲什麼了,哪裏有那麼多爲什麼呢,現身實踐後告訴你,事實就是這樣的,必須要有!

 

第四:利用百度現有工具,讓百度快速收錄

    百度的工具有很多,可以保證我們快速收錄的,我現在列舉如下:

    1 百度站內搜索: 很多人要問,站內搜索,好像已經不維護了,不經營了,很多年都沒有更新了,還要用嗎?答案是肯定的,需要有,這個網站,看起來已經不用了,其實,他還有用,用戶還不少,我的第一批收錄文章,就來源於站內搜索;有個小訣竅,叫做,愛哭的孩子有奶喝,不理你,不收錄你,你就需要發揮自己的能動性了。

    2 百度統計: 在網站的代碼中植入百度統計,其實也是給百度提供了收錄你的文章的機會,而且百度統計,會提供給你一些很準確的數據,做SEO,不加百度統計,就是跟自己過不去;

    3 百度搜索資源平臺: 這個平臺是專門給站長提供的,他的功能很全面,有新站保護鏈接提交,關鍵詞查看,抓取頻次等;

對於我們來講,新站保護和鏈接提交,是最合適不過的了;

    新站保護:新站保護的網站,可以總共提交300條鏈接,保證會被爬蟲爬取,會實惠的;

    鏈接提交:可以在自己的網站上加自動推送,對於每日的原創文章,還可以加主動推送,同時,還可以設置網站的sitemap;

    在連接提交這裏,我是繞了很大一個圈子,後面會有一篇很仔細的鏈接提交,推送和百度收錄量分析的文章,有時候,你感覺是你在揣摩百度,其實百度也在試探你,相互間的揣度讓我感慨很大,對新站長提高收錄量有很大幫助奧。

    4 百度熊掌賬號: 現在百度的熊掌賬號,是可以提交手機站的頁面的,但是對於非手機站的,要不要申請熊掌賬號呢?這裏賣個關子,想知道的,留言吧!

第五:網站需要有一定的流量,有一定的外鏈,保證每日有正常的訪問量

    網站沒有流量,就是一個死站,就算你優化再好,加了再多的百度平臺,工具,也不會有很好的展示,怎麼提高網站流量呢?

    最常規的方法:去百度貼吧,百度知道,天涯論壇,各個論壇發帖增加外鏈

    最花錢的方法: 找幾個大網站,花點錢,做一個友情鏈接,最好的外鏈

    最麻煩的方法: 加刷流量的微信羣,發紅包,刷流量,點擊

    最程序員的方法:寫一個刷流量的工具,使用匿名代理IP,自己刷流量

    最後一個方法,很快捷,但是也有很多問題了,關於前期如何刷網站瀏覽量,後期再通過工具刷百度權重,關鍵詞排名,我是默默的走了一遭,彎路走的多了,就知道直路怎麼走,大家懂的。

第六:網站必須要有網站地圖頁面

     網站必須得有一個網站地圖,當然這個地圖是一個網站大體功能分佈的地圖導航,可以讓爬蟲快速找到爬取的主頁面,減少爬蟲迷路的風險,有效提高收錄;

第七:網站的網頁必須的靜態的HTML的,方便百度抓取

    網站必須是靜態HTML的頁面,靜態頁面,可以讓爬蟲很容易讀取到需要的內容,百度資源有限,不會花太多時間和精力去對一個新站做特殊處理的,所以對於一個新站,靜態頁面,很容易被爬蟲爬取和收錄;我也是在這裏掉到坑裏了,我開始做的是動態頁面,後來發現,必須是靜態的,早知道,做一個CSM系統了;

第八:網站訪問速度要快,網站性能提升,爬蟲抓取不要超過3秒

    網站部署的機器合理,網速夠快,爬蟲爬取不超過3秒,其實最好是1秒以內了;

    我開始I部署的時候,網站第一個加載用了14秒,很慢,靜態資源非常多,這裏必須要優化的,我專門做了研究,經過多次優化和處理,現在網站加載2秒以內,爬蟲爬取1秒以內;

    這裏有一些方法和技巧在裏面,我後續會考慮更新一篇關於網站加載速度優化的文章,希望對大家建站有所幫助。

第九:設置靜態資源和頁面緩存的過期時間等

    設置靜態資源,頁面緩存,設置頁面過期的時間,對於爬蟲來講,每次來爬取,頁面返回的狀態都是200,爬蟲就不知道你的網站到底有沒有更新,需不需要來爬取了。所以,我們需要設置max-age="864000"等一些網站緩存的屬性,讓靜態資源可以在客戶端緩存;

    這樣在網站更新後,頁面返回的狀態是200,沒有更新的時候,返回的狀態,會是其他狀態,可以區分開來;爬蟲會在網站更新後,才進行真正的更新,收錄;

第十:網站權重提升

    網站權重的持續提升,收錄的持續增加,是我們SEO的主要目的,持續提升方面的攻略也比較複雜,我再進一步的實踐和提升,後面會持續更新出來實踐出來比較好的方法,給大家建站,優化網站提供幫助。

    在這裏,我貼一個網站收錄的曲線圖,你就能看到,在跟百度鬥智鬥勇的這些日子裏,是多麼艱難的過程,好在一切都是值得的。

    關注我的博客,我會不定期的推送一些現身的說法,今天就到此爲止了,我的網站上線3-4周了,這個曲線就是現身說法的最好證明,希望大家喜歡,謝謝!

有問題留言了,我後續會開通一個自己的博客,歡迎來訪。

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章