原创 數據分析2之數據特徵分析

參考:https://www.kesci.com/home/project/5caeefe1e0ad99002cac0b7f 【目錄】 1.分佈分析 2.對比分析 3.統計分析 4.帕累託分析 5.正態性檢驗 6.相關性分析 正文

原创 數據分析面試之去哪兒數據分析實習生

一、簡答題 1.pandas中數據類型有幾種,分別是什麼 兩種,DataFrame和Series 2.pandas中describe()有什麼用 描述數據基本特徵-均值,標準差,最大值,中位數,最小值,四分位數等 參考:DataF

原创 數據分析面經問題及整理1

猿輔導數據分析2020面經 一面-(簡歷評估面) 自我介紹+實習經歷+統計學基礎問題 1.假設檢驗: 假設檢驗是(先對總體參數提出一個假設值,然後利用樣本信息判斷這一假設是否成立) 步驟: -提出原假設與備擇假設 -從所研究總體中

原创 數據分析2之數據處理

目錄 缺失值處理 異常值處理 數據歸一化/標準化 數據連續屬性離散化 1、缺失值處理 數據缺失主要包括記錄缺失和字段信息缺失等情況,其對數據分析會有較大影響,導致結果不確定性更加顯著 缺失值的處理:刪除記錄 / 數據插補 / 不

原创 機器學習學習大綱

前言:本文主要參考《機器學習實戰》和周志華的《機器學習》 大部分機器學習算法主要用來解決分類和迴歸這兩類問題 而機器學習可分爲監督學習,無監督學習和半監督學習(強化學習)。 其中,按照數據有無標籤將其分爲監督學習和無監督學習; 強

原创 Python1-從零上手Python關鍵代碼

參考:https://www.kesci.com/home/project/59e4331c4663f7655c499bc3 本文整體梳理了 Python 的基本語法與使用方法,並重點介紹了對機器學習十分重要且常見的語法 基礎篇

原创 數據分析面試題收集(一)

來自於https://zhuanlan.zhihu.com/p/107195470 SQL涉及知識點:case()函數,group by,having count,開窗函數 Python涉及知識點:groupby()[],sort

原创 Python之Numpy1快速上手指南 --- 基礎篇

內容索引 1.概覽 2.創建數組 3.打印數組 4.基本運算 5.通用函數 6.形狀操作 7.函數和方法method總覽 1. 概覽 Numpy的主要對象是同種元素的多維數組。這是一個所有的元素都是一種類型、通過一個正整數元組索引

原创 數據分析系統學習大綱

作爲一個學了多年統計學理論的學生,在即將邁出校門去工作的20年,我對於工作也有過許多迷茫,無措。雖然在19年秋招中歷經坎坷,幾度放棄從事數據分析工作的想法,但最近認清了自己的內心,堅定了目標,還是想做些數據相關的工作,一來不想浪費

原创 高頻面經之數據分析

本文依舊是跟着大佬在學習,學習步驟大致如下:按照題目先自己想想答案,再在網上查找相關知識進行補充完善,將總結的點記入本文,以便加深記憶及後續複習。 注:數據分析主要側重產品sence與Hive??使用,也會有少量數據結構、大數據架

原创 Mysql之窗口函數

前言:本文使用的窗口函數需要Mysql8,使用其他版本可能出現錯誤-不支持窗口函數等問題噢 窗口函數 基本語法結構: <窗口函數> over (partition by <用戶分組的列名> order by <用戶排序的列名>)

原创 圖解Mysql面試題:如何分析用戶滿意度?

【本題考點】 ● 考察多表查詢的應用 ● 如何將業務需求轉換爲sql語句的能力 ● 聚合函數的運用 【題目】 “滿意度表”記錄了教師和學生對課程的滿意程度。“是否滿意”列裏是老師和學生對課程的評價,其中“是”表示教師和學生都滿意。

原创 常見的業務指標

本人想做偏業務相關的數據分析,奈何無相關實習經驗,只能在此紙上談兵,學一些理論,希望能有所收穫,喵嗚~ 常見業務指標介紹 首先上圖,看圖說話: 用戶數據[性別 年齡 地區] 行爲數據[點擊某個菜單的次數 分享量 收藏數] 產品數據

原创 全國空氣質量分析

本文基於2017年全國367個城市每日的空氣質量數據(包括AQI, 綜合指數,PM2.5,PM10,CO,NO2,SO2,O3_1,O3_8,風力,溼度,降水,氣溫等12個日均值指標),通過Stata軟件編寫爬蟲程序獲取數據,並採

原创 Python數據分析案例—淘寶用戶行爲分析

今天的數據分析小項目~ 數據來源於https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1 分析參考https://www.kesci.com/home/pr