原创 R語言基礎——因子

R語言基礎——因子 變量分類 1、名義型變量 2、有序型變量 3、連續型變量 因子 因子,在R中名義型變量和有序型變量稱爲因子,factor。這些分類變量的可能值稱爲一個水平,level,例如good,better,best,都稱

原创 R語言基礎——缺失數據

R語言基礎——缺失數據 缺失數據的分類 統計學家通常將缺失數據分爲三類。它們都用概率術語進行描述,但思想都非常直觀。我們將用sleep研究中對做夢時長的測量(有12個動物有缺失值)來依次闡述三種類型。 (1)完全隨機缺失 若某變量

原创 大數據技術原理與應用——Hadoop 再探討

大數據技術原理與應用——Hadoop 再探討 9.1 Hadoop 的優化與發展 Hadoop 的侷限和不足 1.抽象層次低。 2.表達能力有限。 3.開發者自己管理作業之間的依賴關係。 4.難以看到程序整體邏輯。 5.執行迭代操

原创 大數據技術原理與應用——數據倉庫

大數據技術原理與應用——數據倉庫 8.1 數據倉庫的概念 根本目的 數據倉庫概念 數據倉庫是一個面向主題的、集成的、相對穩定的、反映歷史變化的數據集合,用於支持管理決策。 數據倉庫的數據都來自於數據源,數據源中的數據需要經過抽

原创 大數據技術原理與應用——MapReduce

大數據技術原理與應用——MapReduce 7.1.1 分佈式並行編程 概述 MapReduce 是一種分佈式並行編程框架 數據處理能力提升的兩條路線 1.單核 CPU 到雙核到四核到八核 2.分佈式並行編程:藉助一個集羣通過多臺

原创 python練習——1062 最簡分數 (20分)

python練習——1062 最簡分數 (20分) 一個分數一般寫成兩個整數相除的形式:N/M,其中 M 不爲0。最簡分數是指分子和分母沒有公約數的分數表示形式。 現給定兩個不相等的正分數 N​1​​/M​1​​ 和 N​2/M

原创 R語言基礎——向量

R語言基礎——向量 向量,vector,是R中最重要的一個概念,它是構成其他數據結構的基礎。R中的向量概念與數學中向量是不同的,類似於數學上的集合的概念,由一個或多個元素所構成。 向量其實是用於存儲數值型、字符型或邏輯型數據的一維

原创 R語言基礎——獲取數據

R語言基礎——獲取數據 R獲取數據的三種途徑 1.利用鍵盤來輸入數據 2.通過讀取存儲在外部文件上的數據 3.通過訪問數據庫系統來獲取數據 鍵盤輸入 方法一: 方法二: 也可以使用fix函數來進行修改 讀入文件 如果

原创 R語言基礎——R包的安裝與使用

R語言基礎——R包的安裝與使用 R包的安裝 選擇鏡像站點 下載R包 使用函數library()來查看庫裏有哪些安裝包 R包的使用 載入包 列出包的幫助文檔 列出R包中所有包含的函數 列出R包中包含的數據集

原创 R語言基礎——數據框

R語言基礎——數據框 數據框是一種表格式的數據結構。數據框旨在模擬數據集,與其他統計軟件例如SAS或者SPSS中的數據集的概念一致。 數據集通常是由數據構成的一個矩形數組,行表示觀測,列表示變量。不同的行業對於數據集的行和列叫法不

原创 Python基礎——enumerate()函數

Python基礎——enumerate()函數 enumerate() 函數用於將一個可遍歷的數據對象(如列表、元組或字符串)組合爲一個索引序列,同時列出數據和數據下標,一般用在 for 循環當中。 語法 enumerate(se

原创 R語言基礎——基本操作

R語言基礎——基本操作 顯示當前工作目錄 查看目錄下包含的文件 對變量進行賦值 “=” 也可以進行賦值,但是並不推薦。 向右賦值也可以使用,但是也不推薦。 強制賦值給一個全局變量 求和 mean函數的使用 構造示

原创 Python基礎——remove()方法

Python基礎——remove()方法 remove()函數用於移除列表中某個值的第一個匹配項。 語法 list.remove(obj) # obj表示列表中要移除的對象。 舉例 l = [666,233,666,'aaa',

原创 Python基礎——get()方法

Python基礎——get()方法 字典(Dictionary) get() 函數返回指定鍵的值,如果值不在字典中返回默認值。 語法 dict.get(key, default=None) key – 字典中要查找的鍵。 def

原创 Python練習——輸出PATest

Python練習——輸出PATest 給定一個長度不超過 1e​4的、僅由英文字母構成的字符串。請將字符重新調整順序,按 PATestPATest… 這樣的順序輸出,並忽略其它字符。當然,六種字符的個數不一定是一樣多的,若某種字符