原创 流式數據處理在百度數據工廠的應用與實踐

本文整理自百度李俊卿在QCon上的演講:《流式數據處理在百度數據工廠的應用與實踐》。 百度數據工廠最原先用Hive引擎,進行離線批量數據分析和PB級別的查詢,處理一些核心報表數據。但是在我們推廣過程中發現,用戶其實還是有複雜分析、實時處理、