原创 學習筆記 | Spark簡介、MapReduce

01 Spark的定義 Spark:一個通用的快速分析引擎。 分佈式計算框架 簡言之,Spark 爲我們常見的批處理、流處理、數據分析、數據探索、機器學習等場景都提供了很好的解決方案,任何有數據處理需求的人,都可以用它來完成自己

原创 學習筆記 | 相關分析法:驗證問題的切入點,迅速判斷工作優先級

相關分析法:驗證問題的切入點,迅速判斷工作優先級 01 什麼是相關 相關就是指兩個變量,當一個變量發生變化時,另一個變量也跟着變化的關係。 02 什麼是相關分析 相關分析,就是去找到兩種變量中間,到底有什麼相關關係。也就是說

原创 學習筆記 | 揭開明星店鋪的營收祕密

01 揭開明星店鋪的營收祕密 你是國內領先超市品牌的銷售負責人,新年伊始,你需要用掌握的三種分析方法(對比分析、相關性分析、漏斗分析法),對去年的銷售情況做一個覆盤,看看全國45家門店的銷售業績如何,找出業績最好的團隊,同時分析影

原创 學習筆記 | YARN 統一資源管理與調度 YARN

統一資源管理與調度系統的設計; 統一資源管理與調度系統的實現——YARN。 01 統一資源管理與調度系統的設計 YARN 的全稱是 Yet Another Resource Negotiator,直譯過來是:另一種資源協調者,

原创 學習筆記 | SQL刷題 | 對所有員工的薪水按照salary進行按照1-N的排名 DENSE_RANK

題目描述 對所有員工的當前(to_date='9999-01-01')薪水按照salary進行按照1-N的排名,相同salary並列且按照emp_no升序排列 CREATE TABLE `salaries` ( `emp_no`

原创 學習筆記 | 01 MySQL 體系結構與存儲引擎

課程內容 MySQL 數據庫的體系結構 MySQL 支持的存儲引擎 InnoDB 能夠取代 MyISAM 的原因和 InnoDB 幾大核心特性 InnoDB 存儲的原理和特點 MySQL 5.6 版本爲例介紹 MySQL 體系的

原创 學習筆記 | 建立完整的MySQL知識體系

學習目標: 數據庫的架構設計、性能調優、大規模數據庫集羣運維 如何利用 MySQL 來支撐互聯網的海量數據和高併發請求 掌握 MySQL 的底層運行機制,教你如何發揮 MySQL 的最佳性能、讓你掌握 MySQL 在互聯網應用領

原创 學習筆記 | MySQL 使用原則和設計規範

01 MySQL 使用原則和設計規範 MySQL 雖然具有很多特性並提供了很多功能,但是有些特性會嚴重影響它的性能,比如,在數據庫裏進行計算,寫大事務、大 SQL、存儲大字段等。 想要發揮 MySQL 的最佳性能,需要遵循 3

原创 學習筆記 | MySQL的exists 查找未分配具體部門的員工的所有信息

使用含有關鍵字exists查找未分配具體部門的員工的所有信息。 本題可以用EXISTS和IN兩種方法: /* 1. EXISTS */ SELECT * FROM employees WHERE NOT EXISTS (SELEC

原创 學習筆記 | 分頁查詢employees表,每5行一頁,返回第2頁的數據

select * from employees limit 5 offset 5

原创 學習筆記 | 按照dept_no進行彙總 group_concat

# sqlite select dept_no, group_concat(emp_no) as employees from dept_emp group by dept_no;

原创 學習筆記 | 分析離散數據的數學

統計學就是從世間許許多多的偶然中提煉出規律,並且利用這些規律推測出總體情況的一門學問。 01 n!(n的階乘)的定義 n! = n×(n-1)×(n-2)× ... ×3×2×1 02 排列 考慮到順序的時候,被稱爲排

原创 學習筆記 | python網絡爬蟲 反爬蟲簡介

01 反爬蟲簡介 網絡爬蟲的目的和手段 1. 通過User-Agent校驗反爬 瀏覽器在發送請求的時候,會附帶一部分瀏覽器及當前系統環境的參數給服務器,服務器會通過User-Agent的值來區分不同的瀏覽器。 2. 通過訪問

原创 學習筆記 | 針對庫中的所有表生成select count(*)對應的SQL語句

# sqlite select "select count(*) from "||name||";" as cnts from sqlite_master where type='table';