原创 【中信卡】數據挖掘分析筆試+面經

中信卡筆試面試一站式,昨天筆試,今天面完,新鮮出爐的筆經面經分享給大家。秋招不易,碼字不易,喜歡請點贊,希望對來着有所幫助。 【筆試】: 筆試考的東西比較多,比較雜,但是整體來說都不難,考的內容包括:Python、SQL、SAS、

原创 【陌陌】數據分析師四面

今年七月份投了,陌陌的數據分析師崗位,然後一站式通過了三面,告訴我回去等結果,回學校之後,過了一個多月,八月底又給我加了一面,然後又過了一個月,今天給offer了,秋招不易,碼字不易,喜歡請點贊,希望對來着有所幫助。 因爲面試時間

原创 【機器學習】十四、AdaBoost算法原理詳解

集成學習主要包括Boosting(提升)和Bagging(袋裝)兩大類,本文主要分享Boosting類集成學習中的AdaBoost算法,會詳細講解AdaBoost的原理。碼字不易,喜歡請點贊!!! 目錄1.提升算法的思路2.Ad

原创 【Python】Selenium爬蟲提取標籤屬性值

之前分享了一個selenium提取屬性值得方法:老方法,這個方法很實用,可以將selenium獲取得網頁源碼轉成常用得BeautifulSoup格式,然後進行解析,今天用的時候看到一個更直接得方法,直接採用selenium自帶得方

原创 【Python】Selenium爬蟲提取文本內容

如下圖: 想使用selenium獲取頁面上的文字內容,非常容易,代碼如下: driver = webdriver.Firefox() driver.get(url) driver.find_element_by_xpath('路

原创 [Python爬蟲]模擬登陸**查網站

這是一篇使用Python模擬登陸##查網站的詳細介紹,##查網站上有許多的企業信息,因此抓取##查數據十分重要,本文使用selenium模擬登陸##查網站。 其實我之前就想寫這個python模擬登錄網站的,因爲之前爬蟲用的時候感覺

原创 【Python】爬取**查公司電話以及地址信息

碼字不易,喜歡請點贊!!! 背景:其實兩年前就爬了##查的很多信息,包括電話、地址等基本信息之外,還有公司的股東、專利以及對外投資等信息,但是當時的電腦沒備份,代碼都沒了。這次山東的某個教育機構有償找我幫爬##查公司電話以及地址信

原创 【Python】logging.basicConfig函數

logging模塊是Python內置的標準模塊,主要用於輸出運行日誌,可以設置輸出日誌的等級、日誌保存路徑、日誌文件回滾等。 logging.basicConfig函數主要參數: logging.basicConfig(level

原创 df.apply函數有多個返回值

目標:將df.apply函數的多個返回值賦值到df的多個列中 代碼: 先看返回值包含多列,如下: df1['RFRV'].apply(get_need) 首先將這些多列放到df的一列中,再拆分爲四列,如下: df1['text

原创 【Python】判斷字符串中是否包含數字

通過正則表達式匹配,當字符串中包含數字時,返回True,否則返回False bool(re.search(r'\d', str))

原创 滬深A股高頻交易數據

本人因研究購買了滬深A股高頻交易數據,原始數據爲毫秒級高頻交易數據,經過處理整合爲包括每分鐘交易數據,每五分鐘交易數據,每日交易數據,以及各類指標等,以上數據時間跨度均爲2014-2018五年。具體如下: 每分鐘交易數據 以深圳平

原创 福昕高級PDF

福昕高級PDF下載鏈接: 鏈接:https://pan.baidu.com/s/1Ls4jMCjCGelt_yWN9WVmBg 提取碼:7sh4 下載完之後,直接安裝,安裝後把以下註冊表下載下來,放入福昕PDF文件夾下,運行即可

原创 【Python畫圖】不顯示x、y座標

代碼如下: import matplotlib.pyplot as plt fig = plt.figure(figsize=(10,6)) x = [1,2,3,4,5,6] y = [10,12,33,45,67,89] pl

原创 【Python畫圖】給柱狀圖添加高度

代碼如下: import matplotlib.pyplot as plt fig = plt.figure(figsize=(10,6)) x = [1,2,3,4,5,6] y = [10,12,33,45,67,89] pl

原创 【Python畫圖】設置橫縱座標字體大小

設置橫座標字體大小代碼: plt.xticks(fontsize=15) 設置縱座標字體大小代碼: plt.yticks(fontsize=15)