原创 在Ignite中使用k-均值聚類算法

在本系列前面的文章中,簡單介紹了一下Ignite的k-最近鄰(k-NN)分類算法,下面會嘗試另一個機器學習算法,即使用泰坦尼克數據集介紹k-均值聚類算法。正好,Kaggle提供了CSV格式的數據集,而要分析的是兩個分類:即乘客是否倖存。 爲

原创 Apache Ignite事務架構:故障和恢復 頂 原 薦

在本系列的上一篇文章中,探討了併發模型和隔離級別,下面是本系列剩下的文章將要討論的主題: 故障和恢復 Ignite持久化層的事務處理(WAL、檢查點及其他) 第三方持久化層的事務處理 在本文中,會聚焦於事務執行過程中的故障和恢復。 一個

原创 Apache Ignite核心特性介紹(2.5.0版) 頂 原 薦

1.摘要 1.1.Ignite是什麼? Apache Ignite是一個以內存爲中心的分佈式數據庫、緩存和處理平臺,支持事務、分析以及流式負載,可以在PB級數據上享有內存級的性能。 1.1.1.Ignite定位 Ignite是不是內存數據

原创 Ignite集成Spark之IgniteDataFrames 頂 原 薦

本系列共兩篇文章,主要探討如何將Ignite和Spark進行集成。 下面簡要地回顧一下在第一篇文章中所談到的內容。 Ignite是一個分佈式的內存數據庫、緩存和處理平臺,爲事務型、分析型和流式負載而設計,在保證擴展性的前提下提供了內存級的性

原创 Apache Cassandra和Apache Ignite:通過Ignite增強Apache Cassandra 頂 原 薦

Apache Cassandra是開源分佈式NoSQL磁盤數據庫的領導者之一,作爲關鍵的基礎設施,已經部署在諸如Netflix、eBay、Expedia等很多公司中,它因爲速度、可線性擴展至上千個節點、一流的數據中心複製而廣受歡迎。 Apa

原创 Ignite與Spark內存計算平臺對比分析 頂 原

經常有人拿Ignite和Spark進行比較,然後搞不清兩者的區別和聯繫。Ignite和Spark,如果籠統歸類,都會歸類於內存計算平臺,兩者功能上雖然有交集,並且Ignite也會對Spark進行支持,但是不管是從定位、還是從功能上來說,差別

原创 Apache Ignite(V2.3.0)中文開發手冊 頂 原

Apache Ignite(V2.3.0)中文開發手冊 Ignite Java 1.基本概念 2.集羣化 3.數據網格 4.安全 5.數據注入&流處理 6.分佈式數據結構 7.計算網格 8.服務網格 9.消息和事件 10.固化內存 11.生

原创 Apache Ignite事務架構:Ignite持久化的事務處理 頂 原 薦

在本系列上一篇文章中,介紹了故障和恢復,下面是本系列剩下的文章將要討論的主題: Ignite持久化的事務處理(WAL、檢查點及其他) 第三方持久化的事務處理 在本文中,會聚焦於Ignite持久化的事務處理。 將Apache Ignite

原创 Apache Cassandra和Apache Ignite:關係並置和分佈式SQL 頂 原 薦

在上一篇文章中,回顧和總結了Cassandra中使用的查詢驅動數據模型(或者說非常規數據模型)方法論的缺陷。事實證明,如果不對查詢有深入的瞭解,通過該方法論將無法開發高效的應用。實際上,這種場景的應用架構上會變得更加的複雜,難於維護,並且會

原创 Apache Cassandra和Apache Ignite:分佈式數據庫的明智之選 頂 原 薦

Apache Cassandra應用廣泛,是一個開源的、分佈式的、鍵值存儲列模式NoSQL數據庫,支撐了很多大公司的關鍵業務,比如Netflix、eBay以及Expedia,對於Cassandra的用戶來說,如果他對Cassandra很滿意

原创 Apache Cassandra和Apache Ignite:對比測試,強大的內存計算 頂 原 薦

一個被頻繁提出的問題就是,Apache Cassandra和Apache Ignite之間的區別是什麼,這很正常,因爲這兩個數據庫有很多的共同之處,比如水平擴展性、高可用和持久化。在本系列的前四篇文章中,已經介紹了了架構以及從開發角度上的主

原创 Apache Ignite事務架構:第三方持久化的事務處理 頂 原 薦

本文是Ignite事務架構系列的最後一篇文章,在之前的文章中,討論了與鍵值API的事務處理有關的一系列主題。 第一篇文章中,主要介紹了二階段提交協議及其工作方式; 第二篇文章中,介紹了鎖模型和隔離級別,介紹了悲觀鎖和樂觀鎖中不同隔離級別對應

原创 在Ignite中使用遺傳算法 頂 原

本系列共6篇文章,會通過一些代碼示例,講解如何在Ignite中使用機器學習庫。 在第二篇中主要講解遺傳算法,這個算法是今年早些時候(2018)捐贈給Apache基金會的。 遺傳算法是一種通過模擬生物進化過程來解決優化問題的一種方法。 非常適

原创 Apache Cassandra和Apache Ignite:強一致和事務 頂 原 薦

NoSQL數據庫,比如Apache Cassandra,是最終一致性系統的典型案例,這種系統的機制比較簡單:如果應用在一臺主機上觸發了數據的變更,那麼在某個時間點更新會被傳播到所有的副本,換言之,最終一致。 在變更完全同步之前,系統作爲一個

原创 在Ignite中使用線性迴歸算法 頂 原 薦

在本系列前面的文章中,簡單介紹了一下Ignite的機器學習網格,下面會趁熱打鐵,結合一些示例,深入介紹Ignite支持的一些機器學習算法。 如果要找合適的數據集,會發現可用的有很多,但是對於線性迴歸來說,一個非常好的備選數據集就是房價,可以