爬蟲基礎————ip地址和url詳解

(學習慕課網bobby老師的課程從零起步 系統入門Python爬蟲工程師時做的筆記,有興趣的同學可以去慕課網觀看視頻。)

 

 

1.ip地址

  •  整個網絡傳輸可以比作快遞,數據就是快遞包裹

  會經過一系列中轉站,分包撿包等操作,最後才送到客戶手中

  •  Ip地址就是門牌號

  對整個互聯網來說,只認ip地址,所以在訪問url時,要先轉化成ip地址。再通過ip地址在互聯網上任意傳輸。

2.動態ip和靜態ip

   ———————爲什麼服務器不會隨便封ip和通過ip段封ip

  Ipv4地址格式: xxx.xxx.xxx.xxx(10進制), 總長度是32位(2進制),長度是有限的,怎麼才能接入更多的聯網設備呢?

在cmd中輸入ipconfig可以查看自己電腦的Windows IP 配置:

裏面的 192.168.43.175 是本地局域網的ip地址,出了路由器之外的網都無法連接,相當於這個地址只被我的電腦連接的路由器識別,在我路由器連接的所有電腦之間是可以識別的。在連接外網時,會動用路由器對外的ip。

很多網段,特別是家庭路由器網段都是默認的192.168網段,這就可以使得更多的聯網設備可以連接到網絡上,而不會使用過多的ip地址。

  動態IP:若分配一個ip後不變化,這樣ip地址很快就會用完,動態ip就是分配一個ip地址後,還會回收這個ip地址,再用的時候再分配,是根據需要動態分配的過程,ip地址不穩定,做不了服務器。

靜態ip:穩定的ip地址,需要購買,可以搭建服務器。

所以是不會隨便封ip的,因爲大多數人使用的是動態ip來訪問的。

3.url是什麼

  uniform resource locator:統一資源定位符

  每一個url指向一個獨特的資源,可以是一個html頁面、一個css文檔、一個圖片、文件、js文件等。

4.url協議

  • 幾個url地址

    https://developer.mozilla.org

    https://developer.mozilla.org/en-US/docs/Learn/

    https://developer.mozilla.org/en-US/search?q=URL

  • url格式

    http://www.example.com:80/path/to/myfile.html?key1=v1&key2=v2#maodian

   

實現的協議;哪個ip地址上;ip地址對應的哪個應用程序;訪問具體哪個資源;訪問參數;訪問錨點

協議:常用協議:http、https、file、ftp

域名:可以看做是ip地址的別名,此處也可以直接填寫ip地址

端口::80端口指的就是http協議默認的應用,也可以啓動到別的端口上,不寫的時候是80端口,如果是其他的端口就必須要有端口號

路徑:想要訪問myfile.html頁面

?:?之前都可以定位到想要訪問的資源

想要做一些過濾的話,通過參數來及進行:

參數:兩個參數:key1=v1,key2=v2,用&連接

錨點:在同一頁面內可跳轉到想要查看的內容的地方(比如一個頁面內的目錄)

相對url 與絕對url絕對URL和相對URL

把協議去掉,從後面部分來看就是相對url,直接輸入瀏覽器裏也可以訪問,瀏覽器會默認分配協議;

如果協議、域名、端口都不要,在瀏覽器裏輸入後面部分是沒法訪問的;

但若在html裏做跳轉的話:href裏不是完整的url(path路徑),但依然可以訪問,瀏覽器會自動將域名加上,如果href裏url前面沒有“\”時,會在當前的url後面加,而不是在本該放域名的地方加。

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章