原创 新版mysql5.7.12在win7系統下成功安裝小結

第一大步:下載。 這裏用的是 ZIP Archive 版的,win7 64位的機器支持這個。因爲這個簡單,而且還乾淨。 下載地址爲dev.mysql.com/downloads/mysql 找到64bit ZIP Archive

原创 k-近臨算法及代碼實現

k-近臨算法(KNN)採用測量不同特徵值之間的距離方法進行分類。k-近鄰算法優點是精度高、對異常值不敏感、無數據輸入假定,缺點是計算複雜度高、空間複雜度高,適用數據範圍爲數值型和標稱型。 k-近鄰算法的工作原理:存在一個樣本數據集合(訓

原创 k-means與EM算法小結

        EM算法像是k-means的應用場景,比如雙峯分佈的數據,k-means方法,將其看成2-means聚類的方法處理場景。         k-means算法,也被稱爲k-平均或k-均值,是一種廣泛使用的聚類算法,或者成爲其

原创 輕輕鬆鬆搞定Python基本知識小結

Python是一門具有強類型(即變量類型是強制要求的)、動態性、隱式類型(不需要做變量聲明)、大小寫敏感(var和VAR代表了不同的變量)以及面向對象(一切皆爲對象)等特點的編程語言。python語言簡潔,易學。 語法 P

原创 基於統計學的商務與經濟數據分析知識

以下基於統計學視角,對商務與經濟的數據分析知識進行總結: (1)數據 元素(數據來源的原有實物(體))、變量和觀測值 度量尺度 定性和定量數據 截面數據和時間序列數據   (2)描述性統計 ①表格法和圖形法 彙總定性數據(柱狀圖和餅狀圖)

原创 談互聯網思維

   用戶思維,以用戶爲中心:得屌絲者得天下;提升用戶參與感;用戶體驗至上    簡約思維,產品戰略:專注;簡約即是美    極致思維,從渠道爲王,到產品爲王:打造讓用戶尖叫的產品;服務即營銷    迭代思維,從敏捷開發到精益創業:小處着

原创 如何在命令行模式下查看Python幫助文檔---dir、help、__doc__

1、dir函數式可以查看對象的屬性,使用方法很簡單,舉str類型爲例,在Python命令窗口輸入 dir(str) 即可查看str的屬性,如下圖所

原创 photoshop圖像處理技術(二)

1. PS中的顏色替換工具 打開前景色拾色器,設置Photoshop CS6前景色 1.“模式”選項可以調整替換顏色與底圖的混合模式 選擇模式:色相,塗抹後效果(色相是調整圖像顏色的形式,得到不同顏色圖像) 選擇模式:飽和度,塗抹後

原创 計算機快捷鍵及word的幾個常用技巧

1.繪製三線表 此時,變成二線表 選中表格,單擊設計,繪製表格,光標變成筆形,然後從左到右繪製 2. 在word中,如何使表格、圖片在word文檔中的位置相對固定 選中表格/圖片,右擊、表格屬性/設置對象格式、 3.一不小心把文件

原创 用SPSS做數據分析時遇到的幾個小問題——解決方法!

1.把excel數據導入SPSS中之後總是丟失小數,現在需要保留2位小數 通常spss讀入xls的數據通常第一行是變量名,數據格式都是默認第一條數據(第二行)格式,把第二行的數據小數點設置好,後面就都默認了。 2.在SPSS中做多個因素的

原创 Excel使用技巧

1.在Excel中進行斜線表頭的製作 先在某單元格中輸入“科目”,Alt + Enter鍵強制換行,輸入“姓名” 2.在Excel中,在數字和文字反覆出現的區域,專門複製其中的數字且相對位置不變? 3.在Excel中的幾種拖動單元格

原创 MySQL中操作表的約束問題

對於創建好的表,雖然字段的數據類型決定了所能存儲的數據類型,但是表中所存儲的數據是否合法並沒有進行檢查。在具體使用MySQL軟件時,如果想針對表中的數據做一些完整性檢查操作,可以通過表的約束來完成。 MySQL支持的完整性約束 所謂完整性

原创 數據挖掘中的預處理——以電信客戶流失問題爲例

數據預處理 Step1:數據採樣:由於在建立客戶流失模型過程中,流失客戶往往佔所有客戶人羣的比例很小,這時,最好的辦法是保留真個流失客戶人羣,而對非流失客戶人羣進行採樣,使得客戶流失與非客戶流失人羣在1:1~1:2 Step2:數據探索(

原创 無監督學習中的常用聚類算法總結

聚類是一個把數據對象集劃分成多個組或簇的過程,使得簇內的對象具有很高的相似性,但與其他簇中的對象很不相似。通常涉及距離度量。數據對象的簇可以看做隱含的類。在這種意義下,聚類有時又稱自動分類。聚類可以自動地發現這些分組,這是聚類分析的突出優

原创 數據挖掘中的特徵選擇問題

       特徵工程包括特徵選擇和特徵提取。數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已。通常而言,特徵選擇是指選擇獲得相應模型和算法最好性能的特徵集,工程上常用的方法: ①計算每一個特徵與響應變量的相關性:計算皮爾