開源大數據週刊-第99期

資訊

谷歌重磅開源強化學習框架Dopamine
谷歌推出了一款全新的開源強化學習框架 Dopamine，該框架基於 TensorFlow，主打靈活性、穩定性、復現性，能夠提供快速的基準測試。
整合AI和數據科學新利器：基於Apache Spark的Hydrogen項目
以往數據集的準備以及模型的訓練工作是分開的，這兩部分工作相當於存在兩套系統中。這種方式對於開發、測試都極其麻煩。是否存在於一套方案，同時解決這兩類問題呢？Apache Spark 無法做到。原因是模型的訓練在 Spark 的 DAGScheduler 中支持的並不好。後來 Spark 提出了 Hydrogen 項目，從而使得 Spark 能夠更好地整合深度學習框架。
Redis殺死許可證，閉源的有：RediSearch、Redis Graph、ReJSON、ReBloom、Redis-ML
本數據庫開發商Redis Labs本週將該公司開發的Redis模塊由AGPL改成了Apache v2.0和Commons Clause（共用條款）相結合的許可證，因而對銷售許可證涵蓋的軟件作了限制。

技術

爲什麼已有Kafka，我們最終卻選擇了Apache Pulsar？
本文主要介紹了一家商業公司在使用 Kafka 作爲事件總線時遇到的問題，主要是性能、可擴展性以及一些技術性限制。比如 Kafka Broker 是綁定存儲狀態的，擴展或縮小 Kafka 集羣需要重新平衡分區，而 Pulsar Broker 是無狀態的，真正的做到了計算和存儲分離。Pulsar 還有一些其他的優點。這篇文章可以說是消息系統選型的一個良好案例。
先過濾後解析：斯坦福開源數據解析引擎Sparser，解析提速22倍
很多大型數據應用程序通常在非結構化或半結構化的原始數據格式（如 JSON）上運行。查詢這些文件常常是非常耗時的，尤其是那些探索性應用程序，數據科學家用來運行查詢以探索及更好地理解其數據。令人驚訝的是，這些應用程序實際上有 80%-90% 的執行時間是用於解析數據，而不是用於評估實際查詢本身。因此，解析實際上纔是瓶頸。這篇文章介紹了介紹 Sparser，一個來自斯坦福 DAWN 團隊的一個研究項目，該項目解決了這個性能瓶頸。
Apache Flink狀態管理和容錯機制介紹
本文詳細介紹了Flink的狀態管理和容錯機制，內容包括有狀態的流數據處理、Flink中的狀態接口、狀態管理和容錯機制實現等。
Apache HBase中等對象存儲MOB壓縮分區策略介紹
Apache HBase 中等對象存儲（Medium Object Storage, 下面簡稱 MOB）的特性是由 HBASE-11339 引入的。該功能可以提高 HBase 對中等尺寸文件的低延遲讀寫訪問（理想情況下，文件大小爲 100K 到 10MB），這個功能使得 HBase 非常適合存儲文檔，圖片和其他中等尺寸的對象。本文對這一特性進行了詳細的介紹。

開源大數據週刊-第99期

資訊

技術

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

關於接口協議，你必須要知道這些！

一鍵自動化博客發佈工具,用過的人都說好(頭條篇)

01 穩定性（一）如何應對事故並做好覆盤？

美團一面：項目中有 10000 個 if else 如何優化？想了半天，被問懵了！

京東面試：如何進行JVM調優？

線程池那些坑爹的參數-核心線程數&最大線程數&工作隊列

Stream流常用方法總結

開源大數據週刊-第106期

開源大數據週刊-第101期

開源大數據週刊-第100期

開源大數據週刊-第99期

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結