原创 完美解決window10下 python版本的切換 一

  1、學習python必然會遇到這樣的情況:我選擇的IDE是Pycharm,在pycharm中進行不同版本的切換,比如python2.7,python3.6,anaconda-python 2.7、anaconda-python3.6共

原创 爬蟲系列之新浪微博

  提供代碼運行過程的相關諮詢服務,確保代碼成功運行。 本文代碼已同步更新到,下面公衆號。​請大家關注公衆號   【 Python人生之技術實踐】,  近期將推出 豆瓣、知乎、微博、網易雲音樂、拉勾網、知網的爬蟲教程,代碼已經完成,在整理

原创 爬蟲系列之知乎

“ 今天要爬取的目標網站是知乎,獲取知乎上某個(如何看待山東的合村並居政策?)問題的所有回答,並對回答進行文本分析(分詞、詞頻統計、抽取關鍵詞及生成詞雲)” 繼爬蟲系列之大衆點評、爬蟲系列之微博之後,今天繼續推送 有關知乎的爬蟲。仍然採用

原创 找工作 吐槽篇

不知不覺自己也到了研三該找工作的時候,7-10月份在阿迪進行了爲期3個月的實習工作。主要工作是運用python解決電商平臺應收賬款的對賬自動化。真實場景是業務人員需要手動的打開excel,人工的比對兩個表格的數據並將比對合格的數據進行彙總

原创 爬蟲系列之大衆點評

提供代碼運行過程的相關諮詢服務,確保代碼成功運行。 ​本文代碼已同步更新到,下面公衆號。請大家關注公衆號   【 Python人生之技術實踐】,  近期將推出 豆瓣、知乎、微博、網易雲音樂、拉勾網、知網的爬蟲教程,代碼已經完成,在整理階段

原创 百度翻譯爬蟲僅供學習

百度翻譯爬蟲要滿足以下幾點: 1 登錄自己的百度賬號,需要cookie 信息 2 使用chrome手機瀏覽模式   3 熟悉post請求   4 這個是練手的爬蟲訓練,後續後補上面向對象的代碼。 # 第一版本的百度翻譯爬蟲,非面向對象

原创 TypeError: parse() got an unexpected keyword argument 'transport_encoding'

在cmd 中 執行  python3 -m pip install pymysql,報錯。 解決方法:在  https://pypi.org/project/html5lib/#files  下載  html5lib 1.0.1   然後

原创 26歲的年紀

5月連綿不停的下雨天氣讓人心情煩躁,就在剛剛我失去了那個她。曾經一起相伴3年的時光,她說她累了,我倆不合適。掙扎了好幾天結果還是放棄了。心疼呀,26歲的年紀,沒有工作,論文沒有發表,心裏挺着急的。沒了她,我不知道以後我會生活的是好還是壞,

原创 python-兩個list列表元素一一對應拼接

# 功能需求:實現兩個list的拼接,list1是整數部分,list2是小數部分,結果是1.1,2.2 list1 = ['1.','2.'] list2 = ['1','2'] wanzheng = [] for i in rang

原创 python文本分析--停用詞表的使用

之前聽說停用詞表,沒有上手使用過,真正操作的時候發現有很多東西沒有學透徹。這裏總結一下,去停用詞的思想:在原始文本集中去掉不需要的詞彙,字符。雖然有通用的停用詞表,但是如果想提高後續的分詞效果,還是自己建立停用表比較好。 建立停用詞表,實

原创 pandas append() 報錯 'builtin_function_or_method' object is not subscriptable

list列表添加內容的時候,報錯, TypeError: 'builtin_function_or_method' object is not subscriptable   結果是因爲紅色方框內的內容 append(y) 打錯成爲了a

原创 已知生日,求年齡,pandas實現

今天在羣裏遇到個問題,已經知道生日怎麼計算出年齡,注意有個知識點  pandas.Series.dt  可以將serices數據類型與datetime類型進行計算。感謝原文作者https://blog.csdn.net/zhangjy37

原创 完美解決 ubuntu16.04下anaconda python版本的切換(二)

如同完美解決博客一,在ubuntu下我也選擇使用anaconda的python版本。 1 anaconda的安裝, 首先進入到anaconda安裝包所在的位置。我是把安裝包放在了home下 cd /~ bash Anaconda2-

原创 JS學習---如何獲取a標籤的url

<!--如何獲取a標籤的url 本篇內容涉及到的知識點: 1 js的for循環 2 document獲取標籤 首先網頁是這個樣子的,我們要獲取a標籤的網址及文字描述 1發現網址在  body>ul>li>a中, 2 通過 docume

原创 python之正則表達式的學習

  接觸了python後,爬蟲是必不可少的。正則表達式是我們處理爬蟲數據,解析HTML數據的重要工具。由於正則表達式十分複雜,這讓初學者常常感到頭痛。我在查找了大量資料後,發現 畢來生 總結的正則表達式的學習十分適合像我這樣的初學者。因此