原创 python 中字典使用的一些小技巧

本文簡單的記錄了 python中 字典使用的一些技巧 一、從字典中提取子集 prices = { 'ACME': 45.23, 'AAPL': 612.78, 'IBM': 205.55, 'HPQ': 37.20, 'FB': 10

原创 python中 merage函數與concat函數的用法

每次都不能很好的使用merge和concat這兩個函數,本次做一個搬運工從前人那邊搬來一些信息,希望自己熟練掌握其使用方法 一、merage pandas提供了一個類似於關係數據庫的連接(join)操作的方法<Strong>merage<

原创 pandas 一些常用的數據分析技巧

數據類型: 查看數據中各個變量的列名和它們的數據類型:df.dtypes 獲得每個數據類型的列數:df.get_dtype_counts() 數據缺失與重複 統計缺失佔比:df.isna().sum()/len(df) 缺失填補:d

原创 python中字符串和文本的處理技巧

一、使用多個界定符分割字符串 string 對象的split() 方法只適應於非常簡單的字符串分割情形,它並不允許有 多個分隔符或者是分隔符周圍不確定的空格。當你需要更加靈活的切割字符串的時候, 最好使用re.split() 方法: 首

原创 集成學習之Adaboost算法原理小結

本文轉自  劉建平Pinard   原文鏈接http://www.cnblogs.com/pinard/p/6133937.html  在集成學習原理小結中,我們講到了集成學習按照個體學習器之間是否存在依賴關係可以分爲兩類,第一個是

原创 python—pandas中DataFrame類型數據操作函數

Python數據分析工具pandas中DataFrame和Series作爲主要的數據結構. 本文主要是介紹如何對DataFrame數據進行操作並結合一個實例測試操作函數。 1)查看DataFrame數據及屬性 df_obj

原创 集成學習原理小結

 本文轉自 劉建平Pinard  原文鏈接 http://www.cnblogs.com/pinard/p/6131423.html 集成學習(ensemble learning)可以說是現在非常火爆的機器學習方法了。它本身不是一個

原创 scikit-learn Adaboost類庫使用小結

 本文系轉載,原文鏈接爲   http://www.cnblogs.com/pinard/p/6136914.html   在集成學習之Adaboost算法原理小結中,我們對Adaboost的算法原理做了一個總結。這裏我們就從實用