原创 Kafka面試題,附帶答案

1.什麼是kafka?? 答: kafka是分佈式 · 訂閱消息系統,最初由LinkedIn公司開發的,後來被Apache公司收購。kafka是一個分佈式、可劃分的、冗餘備份機制的持久性的日誌服務,主要用於流數據 2.爲什麼要使用

原创 HBASE面試題,希望能夠幫助到你

1、HBase是什麼? 答:hbase是開源的非關係型分佈式數據庫,擁有高可靠性、高性能、面向列、可伸縮的分佈式存儲系統 2、HBase存儲結構? 答: 3、HBase中rowkey設計原則? 答:(1)rowkey長度原則 (

原创 簡單Hive面試題,希望能夠幫到你

1、Hive是什麼? 答:Hive是建立在 Hadoop 上的數據倉庫基礎構架。。它提供了一系列的工具,可以用來進行數據提取轉化加載(ETL),這是一種可以存儲、查詢和分析存儲在 Hadoop 中的大規模數據的機制。 2、Hive

原创 17個Flume面試題。希望能夠幫到你

1、什麼是Flume? 答:Flume是Cloudera公司的一款高性能、高可用的分佈式日誌收集系統,現在已經被Apache收購。 2、Flume特點? 答:可靠性、可擴展性、可管理性、功能可擴展性、、 3、flume組成,Put

原创 10個Hadoop面試題,希望能夠幫到你

1、Hadoop是什麼? 答: hadoop是一個由Apache基金會所發佈的用於大規模集羣上的分佈式系統並行編程基礎框架。目前已經是大數據領域最流行的開發架構。並且已經從HDFS、MapReduce、Hbase三大核心組件成長