HTTP協議之URL

概念:
——URI統一資源標識符(Uniform Resource Identifier)是抽象的定義了URI用戶對網絡中(一般指萬維網)的資源通過特定的協議進行交互操作。包含了URL和URN。是一個用於標識某一互聯網資源名稱的字符串。
——URL統一資源定位符(Uniform Resource Locator)是標識一個互聯網資源,並指定對其進行操作或取得該資源的方法的同意資源標識符。
——URN統一資源名稱 (Uniform Resource Name, URN)
唯一標識一個實體的標識符,但是不能給出實體的位置。

protocol(協議類型):
file 資源是本地計算機上的文件。格式file://
ftp 通過 FTP訪問資源。格式 FTP://
gopher 通過 Gopher 協議訪問該資源。
http 通過 HTTP 訪問該資源。 格式 HTTP://
https 通過安全的 HTTPS 訪問該資源。 格式 HTTPS://
mailto 資源爲電子郵件地址,通過 SMTP 訪問。 格式 mailto:
MMS 通過 支持MMS(流媒體)協議的播放該資源。(代表軟件:Windows Media Player)格式 MMS://
ed2k 通過 支持ed2k(專用下載鏈接)協議的P2P軟件訪問該資源。(代表軟件:電驢) 格式 ed2k://
Flashget 通過 支持Flashget:(專用下載鏈接)協議的P2P軟件訪問該資源。(代表軟件:快車) 格式 Flashget://
thunder 通過 支持thunder(專用下載鏈接)協議的P2P軟件訪問該資源。(代表軟件:迅雷) 格式 thunder://
news 通過 NNTP 訪問該資源。

hostname(主機名):
是指存放資源的服務器的域名系統(DNS) 主機名或 IP 地址。有時,在主機名前也可以包含連接到服務器所需的用戶名和密碼(格式:username:password@hostname)。

port(端口號):
整數,可選,省略時使用方案的默認端口,各種傳輸協議都有默認的端口號,如http的默認端口爲80。如果輸入時省略,則使用默認端口號。有時候出於安全或其他考慮,可以在服務器上對端口進行重定義,即採用非標準端口號,此時,URL中就不能省略端口號這一項。

path(路徑):
由零或多個“/”符號隔開的字符串,一般用來表示主機上的一個目錄或文件地址。

parameters(參數):
這是用於指定特殊參數的可選項。

query(查詢):
可選,用於給動態網頁(如使用CGI、ISAPI、PHP/JSP/ASP/ASP。NET等技術製作的網頁)傳遞參數,可有多個參數,用“&”符號隔開,每個參數的名和值用“=”符號隔開。

fragment(信息片斷):
字符串,用於指定網絡資源中的片斷。例如一個網頁中有多個名詞解釋,可使用fragment直接定位到某一名詞解釋。

示例:在百度搜索框搜索 bs rev_pq&tn= ,點擊百度一下後,地址欄改變如下:

http://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=98759660_hao_pg&wd=bs%20%20rev_pq%26tn%3D
&rsv_pq=dcff157d00007108&rsv_t=5137a95FE09Tn9n2i5j1KGD8tWnSBkr240KCLxCwZvtKpIZfnvzkwDBkDtHf2dbGoHbnULLw
&rsv_enter=1&rsv_sug3=4&rsv_sug2=0&inputT=8394&rsv_sug4=8394

下面是對地址欄的分析:
http——使用的協議;
://——分隔符;
www.baidu.com——主機名;
/s*——請求資源所在的位置;
?——分隔符,後面是用戶提交時的參數;
Ie——頁面編碼格式;
&——分隔符;
F——搜索判斷,f=8(用戶自主搜索),f=3(下拉框推薦),f=1(相關搜索);
rsv_bp——判斷是第幾次搜索,0爲第一次搜索,1爲第二次或者多次搜索;
tn——紀錄搜索來自哪裏,當你使用賬戶登錄後,就會有此項紀錄,比如,你登錄百度空間或者登錄了遨遊瀏覽器;
wd——當前搜索的關鍵詞或者內容;
bs——上一次搜索的詞或者內容,百度競價的展現的關鍵詞;
rsv_spt——識別瀏覽器,IE內核的瀏覽器是3,火狐是1;
inputT——從在搜索框中輸入/修改字符到點擊百度一下的時間,單位是毫秒;
oq——相關搜索的主詞,例如,搜索seo時,出現的相關搜索,它的oq=seo;
rsp——第n+1個相關搜索,例如rsp=4,它就是第5個相關搜索;
rsv_sug3——鍵盤重複速度(Keyboard Repeat Speed),取決於輸入字符的速率;
dsp——表示訪問所使用的設備;

這些是網站中GET傳參,而inputT、rsv_sug3是需要傳參的名,等號後面的字符是值,每個傳參的名之間&分割,與頁面地址之間用英文狀態下的?分割。一般常用表單提交,程序會把這個參數及值寫進數據庫。這些參數名是百度程序員定義的,具體是什麼作用就只有百度程序員自己知道了。

發佈了38 篇原創文章 · 獲贊 14 · 訪問量 6萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章