原创 find_element_by_css_selector()的幾種方法

  方式一  後代或平級關係來選擇元素 : 父元素: (#)表示通過  id     屬性來定位元素 (.)表示通過 class  屬性來定位元素 子元素(後代關係)    #choose_car option    含空格的,後

原创 文本的向量化表示總結

文本向量化,顧名思義就是將一段文字(一篇文章,一個段落或者是一個句子)變成一個向量。在儘可能不丟失原始文本信息的情況下,將文本變成可以計算的向量,可以幫助後續的文本聚類、分類、相似度匹配等等的諸多任務。 1.詞集模型:one-

原创 正則表達式

在爬蟲的時候,正則表達式是一個非常好的助手,這篇博文主要記錄下正則表達式中的基本符號。 符號 含義 示例 說明 * 匹配前面的字符0次或更多次 ab 匹配aa或bbb或bbbbbb, + 匹配前面的字符1次或更多

原创 Plot aesthetics學習(seaborn)

學習seaborn庫最好的資料就是它的官網,seaborn官方網站,它的tutorial指南分爲三部分:plotting function(畫圖的函數),multi-plot grid(多圖網格),plot asethetics(

原创 python基礎練習

1.百錢百雞問題。百錢百雞是我國古代數學家張丘建在《算經》一書中提出的數學問題:雞翁一值錢五,雞母一值錢三,雞雛三值錢一。百錢買百雞,問雞翁、雞母、雞雛各幾何? for x in range(0,20): for y in

原创 Numpy函數學習

文章目錄反轉操作連接操作分割操作其他操作 反轉操作 1.np.reshape()函數 np.arange(0,60,10).reshape(-1,1)+np.arange(0,6) a = np.array([[1,2,3,4],