原创 Linux之mv

命令格式:mv + [選項]+ 源文件或者目錄 + 目標文件或者目錄 如果目標參數不存在,那麼就是對源參數進行重命名。 如果目標參數是已經的文件或者目錄,那麼就是將源文件或者目錄進行覆蓋或者移動,此時源文件消失。 命令功能:進行文件、目錄

原创 Linux之ls 命令

Ls這個命令估計是新手最常用的命令之一了,因爲Linux系統對所有的內容都是以文件的形式顯示,對於剛接觸Linux系統的人,每每做完一個騷操作就特別想看看發生了什麼奇蹟的事情於是會用這個命令來顯示操作效果。 命令格式:ls + [選項]

原创 Linux之解壓縮常用命令

最近學習Linux搭建LAMP(Linux+Apache+MYSQL+PHP)和LNMP(Linux+Nginx+MYSQL+PHP)環境,在Linux上下載下的都是這些軟件的安裝包,所以需要進行解壓之後再進行安裝,這就需要用到一些解壓縮

原创 fastjson解析json字符串和數組+Scala時間處理

廢話不多說直接上代碼 1.Json解析 package scala.csdn import com.alibaba.fastjson.JSON object ParseJson { def main(args: Array[Stri

原创 Hive初學者常用的一些命令

Hive菜鳥指南 Hive簡介 Hive對我來說就是一個基於HDFS的數據倉庫,它提供了一個種SQL語言,能讓不精通Java語言而熟悉SQL語言的工程師,快速的對HDFS或其他存儲文件系統如Amazon,S3,上的數據進行數據分析,是Ha

原创 機器學習之數據準備

04 | 數據準備 數據準備階段包含從原始數據到形成最終數據集(將要被餵給模型工具的數據)的所有操作。數據準備任務可能要進行多次,沒有規定的固定順序。任務包括:表,記錄和特徵選擇以及爲了模型工具的數據清洗和轉換。 -數據準備是費時間的 紐

原创 機器學習之數據理解

03 | 數據理解 -數據理解 收集原始數據 獲取或者下載數據 從不同的數據源或者有關係的數據合併爲一個數據集 描述數據 數據的描述性統計 數據的特徵機構 挖掘數據(原始數據分/挖掘) 數據挖掘對原始數據提供一個直觀的感受 對數據可視化以

原创 機器學習概覽2

-什麼是機器學習? 機器學習就是一段可以從經驗中學習計算機程序,關於一些任務T和以及程序在任務T中的表現的性能評估P,程序能隨着經驗不斷的提升性能。 -更多關於機器學習的定義 機器學習是一門讓計算機在不被明確編程的情況下行動的科學。-

原创 機器學習概覽之商業理解

02 | 商業理解 -理解商業 要對你要解決的問題有一個清晰的認識,爲了你解決問題的目標它如何影響你的計劃。在這個階段的任務主要包括如下幾點: 明確你的商業目的 評估你的處境 定義你的數據挖掘目標 制定你的項目計劃 -如何開始呢? 問一個

原创 開始機器學習-Getting Started With Machine Learning

        前段時間網上查機器學習相關資料,無意間發現一個文檔,裏面是英文版的機器學習筆記,分爲機器學習基礎和機器學習算法兩部分,該文檔是以爲機器學習愛好者的苦心之作,然後爲了學習,我就想試着翻譯一下,就當是學習一下英文,然後順帶着複

原创 機器學習概覽

第一部分:機器學習基礎 01 | 概覽 -機器學習無處不在 從左至右:自動駕駛,人臉識別,垃圾檢測,信用卡欺詐檢測 從左至右:維護(故障)預測,銷售預測,語音識別,機器人 -計算機視覺正在超越人類能力 左圖上:椅子,餐桌,人。左圖下

原创 手撕貝葉斯之垃圾短信(郵件)識別

基於貝葉斯的垃圾短信分類 利用貝葉斯對垃圾短信(郵件)分類想必是入門機器學習的首選排行前三的一個實例,對於一個算法原理的瞭解和手撕這個算法還是有一定的差距的。對於貝葉斯分類算法的原理可以用一句話概括:通過某對象的先驗概率,利用貝葉斯公式計

原创 Python讀取CSV和解析json格式數據

1讀寫CSV文件 原始CSV文件數據 圖1:股票數據stocks.csv 2將股票數據讀取爲元組序列 代碼: import csv with open('stocks.csv') as f:     f_csv = csv.reader

原创 做一個合格的程序員

 回到家一算,培訓計算機也有六個月的時間了,從一開始的運維,到後來的人工智能,不敢說自己從一個數學專業者成功的跨到計算機專業成爲一個合格的程序員,起碼我這六個月一直都在爲成爲一個合格的程序員而努力着,並將在這條道路上一直走下去。 怎麼樣纔

原创 基於networkx分析Louvain算法的社團網絡劃分

圖論之-Python NetworkX 入門 1:圖論概述 1.1圖論基本概念 1圖 一個圖G = (V, E)由一些點及點之間的連線(稱爲邊)構成,V、E分別計G的點集合和邊集合。在圖的概念中,點的空間位置,邊的區直長短都無關緊要,重要