原创 基於spark排序的一種更廉價的實現方案-附基於spark的性能測試

排序可以說是很多日誌系統的硬指標(如按照時間逆序排序),如果一個大數據系統不能進行排序,基本上是這個系統屬於不可用狀態,排序算得上是大數據系統的一個“剛需”,無論大數據採用的是hadoop,還是spark,還是impala,hive,總之

原创 基於spark排序的一種更廉價的實現方案-附基於spark的性能測試

排序可以說是很多日誌系統的硬指標(如按照時間逆序排序),如果一個大數據系統不能進行排序,基本上是這個系統屬於不可用狀態,排序算得上是大數據系統的一個“剛需”,無論大數據採用的是hadoop,還是spark,還是impala,hive,總之

原创 hadoop、spark、hive、solr、es與YDB在車輛即席分析上的對比分析

自2012年以來,公安部交通管理局在全國範圍內推廣了機動車緝查布控系統(簡稱卡口系統),通過整合共享各地車輛智能監測記錄等信息資源,建立了橫向聯網、縱向貫通的全國機動車緝查布控系統,實現了大範圍車輛緝查布控和預警攔截、車輛軌跡、交通流量分

原创 YDB資源彙總

YDB介紹什麼是延雲YDB基於spark排序的一種更廉價的實現方案-附基於spark的性能測試大索引技術大數據的未來YDB技術原理YDB技術原理那些年我們在spark SQL上踩過的坑YDB跟Solr Cloud、ElasticSearch