原创 hive信息查詢

轉自:http://www.aboutyun.com/forum.php?mod=viewthread&tid=8590&highlight=hive 問題導讀:1.如何查看hive表結構?2.如何查看錶結構信息?3.如何查看

原创 數據清洗與準備

主要介紹數據處理過程中,常用到的幾個函數。 查看存在缺失值的特徵 #計算特徵缺失值個數 na_counts = data.isnull.sum() #按缺失值個數降序輸出特徵 missing_values = na_count

原创 seleniun學習(python)

Selenium庫裏有一個叫WebDriver的API。WebDriver可以控制瀏覽器的操作,它可以像BeautifulSoup或者其它Selector對象一樣用來查找頁面元素,與頁面上的元素進行交互(發送文本、點擊等),以及執

原创 pandas(五)索引對象

這篇博文主要介紹索引對象。 文章目錄Index對象一級索引對象創建索引對象重建索引MultiIndex對象創建多級索引對象多級索引行列轉換多級索引數據存取 Index對象 一級索引對象 從Series對象中獲得Index對象: d

原创 SQL學習(三)

文章目錄創建計算字段拼接字段執行算術計算使用數據處理函數文本處理函數日期和時間處理函數數值處理函數彙總數據聚集函數聚集不同值組合聚集函數 創建計算字段 計算字段並不實際存在於數據庫表中,是運行時在SELECT語句內創建的。從客戶機

原创 常見圖表的使用場景

在數據可視化領域我們經常使用各種圖表來形象直觀的展現數據,業務人員或者數據分析人員可以通過圖表分析公司業務的經營狀況,發現公司經營過程中潛在的隱患,還可以通過圖表挖掘其中潛在的價值。那麼常見的圖標有哪些?在什麼場景下使

原创 tableau學習(持續更新)

文章目錄工作區tableau常用的文件類型連接到PDFtableau數據角色字段類型將數據添加到已保存數據源 工作區 1.工作表工作區 2.儀表板工作區 每個儀表板由一個或者多個視圖(工作表)按照一定的佈局方式構成。 儀表板工作

原创 SQL學習(二)

文章目錄檢索數據排序檢索數據過濾數據使用WHERE子句WHERE子句操作符組合WHERE子句用通配符進行過濾用正則表達式進行搜索 檢索數據 從某表中檢索某列或者多列: SELECT 列名1,列名2,列名3 FROM 表名; 檢索

原创 Pyecharts學習(二)

這篇博文主要是接着上篇博文繼續學習Pyecharts。 文章目錄主題基本圖表漏斗圖日曆圖儀表盤水球圖 主題 Pyecharts提供了十幾個默認的主題,分別是LIGHT,DARK,CHALK,ESSOS,INFOGRAPHIC,MA

原创 R基礎(三)

文章目錄創建和打印字符串格式化數字更改大小寫截取字符串分割字符串文本路徑 在R中,字符串其實是字符向量元素。 創建和打印字符串 1.字符向量可以用c函數創建,儘量使用雙引號 c( "you may not believe",

原创 用R求矩陣的特徵值和特徵向量

最近在學習多元統計分析的主成分分析時,發現需要經常計算矩陣的特徵值和特徵向量,自己就找了下用R來做計算的函數。 我們可以用sigen()函數來計算特徵對。 #創建一個矩陣 a <- matrix(c(11,sqrt(3)/2,3/

原创 使用第三方 SMTP 服務發送(QQ)

這裏使用了 QQ 郵箱(你也可以使用 163,Gmail等)的 SMTP 服務,需要做以下配置: 1、登錄QQ郵箱,點擊設置—賬戶—POP3/IMAP/SMTP/Exchange/CardDAV/CalDAV服務 2、QQ 郵箱

原创 find_element_by_xpath()的幾種方法

一:從根目錄/開始 有點像Linux的文件查看,/代表根目錄,一級一級的查找,直接子節點,相當於css_selector中的>號 /html/body/div/p    二. 根據元素屬性選擇: 查找具體的元素,必須在前面輸入標準

原创 csv庫學習

CSV(Comma Separated Values)格式比較常見,python提供了csv模塊去以csv格式讀取和寫入表格數據。 下面介紹幾個常用函數: 1.csv.reader(csvfile, delimiter=’’,qu

原创 R基礎(四)

這篇博文主要來介紹R中的高級循環。 文章目錄replicationlapplyvapplysapply應用和參數遍歷數組多個輸入的應用函數拆分-應用-合併 replication 之前介紹的rep函數可以把輸入的參數重複數次,這次