台部落你的莽莽没我的好吃

常用的文件查看命令： cat 由第一行開始顯示檔案內容 tac 從最後一行開始顯示，可以看出tac 是cat 的倒着寫！ nl 顯示的時候，順道輸出行號！ more 一頁一頁的顯示檔案內容 less 與more 類似，但是比more 更

2019-10-25 17:45:19

從數據庫裏讀取記錄我們要創建一個DataFrame來存儲從數據庫裏讀取的表。首先要創建Spark的入口–SparkSession對象。需要引入的包： import org.apache.spark.sql.SparkSess

2019-10-25 17:45:08

原文鏈接：https://www.cnblogs.com/wangzh1guo/p/9723062.html 在POM.XML 中使用快捷鍵 ALT+INSERT 這樣就可以搜索包，選

2019-10-25 17:45:07

目錄的相關操作 . 代表此層目錄 .. 代表上一層目錄 - 代表前一個工作目錄 ~ 代表『目前使用者身份』所在的家目錄 ~account 代表account這個用戶的home目錄(account是個帳號名稱) cd（變換目錄）不再贅述

2019-10-25 17:45:06

常見的打包/壓縮格式因爲Linux 支援的壓縮指令非常多，且不同的指令所用的壓縮技術並不相同，當然彼此之間可能就無法互通壓縮/解壓縮文件。所以，當你下載某個壓縮文件時，自然就需要知道該文件是由哪種壓縮指令所創建出來的，好用來對照着解壓。

2019-10-25 17:45:06

搜狗細胞詞庫：https://pinyin.sogou.com/dict/ 其每個小分類例如【自然科學】下的【物理】都有一個“官方推薦”和若干詞庫。下載其中一個詞庫後，得到的是scel格式文件，需要轉換成txt才能使用，可使用在線轉

2019-10-25 17:45:06

以爬取快代理https://www.kuaidaili.com/free/爲例。 response是整個頁面返回的數據，頁面內容。 response.xpath('//*[@id="list"]/table/tbody/tr')

2019-08-23 03:51:16

雖然自2018年開始，PhantomJS暫停開發，而且新版本Selenium不再支持PhantomJS，而是推薦使用谷歌或者火狐無界面瀏覽器，但是現在仍然可以使用Selenium+PhantomJS，只是warning而已。這裏有篇博客

2019-08-23 03:51:16

r 僅讀，待打開的文件必須存在。w 僅寫，若文件已存在，內容將先被清空。a 僅寫，若文件已存在，內容不會清空。r+ 讀寫，待打開的文件必須存在。w+ 讀寫，若文件已存在，內容將先被清空。a+

2019-08-23 03:51:16

Requests簡介 Requests是Python的一個很實用的HTTP客戶端庫，完全滿足如今網絡爬蟲的需求。與Urllib對比，Requests是在Urllib的基礎上進一步封裝的，具備Urllib的全部功能；在開發使用上，語法簡單易

2019-08-14 03:40:54

正則表達式在線測試器：https://c.runoob.com/front-end/854 .*和.*? <li> <div> <div class="_1-7VV"><a href="javascript:;"> <img style

2019-08-14 03:40:54

Urllib簡介發送請求請求頭請求頭參考我的另一篇博客：https://blog.csdn.net/LOG_IN_ME/article/details/81940205 IP代理 import urllib

2019-08-10 04:42:30

【報錯】 UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 29802: illegal multibyte sequence 【解決】出

2019-08-09 17:21:13

【報錯】 TypeError: memoryview: a bytes-like object is required, not 'int' 【解決】以爲是編碼問題，看報錯追溯報錯行，其實是urllib.request.urlopen(

2019-08-09 17:21:13

安裝Scrapy 在安裝Scrapy之前，需要先安裝Twisted。Twisted可以使用pip安裝，如果直接安裝Scrapy，在安裝過程中就會出現報錯信息。 Windows下安裝Scrapy：有很多種方法，本人直接使用pip安裝。（這篇

2019-08-08 17:16:59