Apache Avro簡介

原創

2020-02-22 22:36

簡介

Apache Avro是一個數據序列化方法。

Avro提供：

豐富的數據結構。
緊湊、高效的二進制數據格式。
容器文件，用於存儲持久數據。
遠程過程調用(RPC)。
易於集成到動態語言的特性。
無論是讀寫數據文件，還是使用或實現RPC協議，都無需代碼生成。代碼生成是一個優化選項且只對靜態類型語言的實現有意義。

Schema

Avro依賴於schema。當讀取Avro數據時，總是能夠獲取到寫入該數據時用到的schema。這樣一來，每次寫入數據都無需多餘的開銷，進而加快序列化速度、減小序列的大小。在動態的、腳本式語言中使用Avro也會變得更加容易，因爲數據配合它的schema可以進行完整的自我描述。

當Avro數據被存入一個文件時，它的schema也會隨之存入。隨後，文件可以被任何程序處理。如果讀取數據的程序期望另一個schema，這也容易解決，因爲兩個schema同時可以獲取到。

當把Avro用於RPC時，客戶端和服務器在連接握手時互換schema。（這一點還可以優化，對於大部分調用而言，實際上不會傳輸schema）。客戶端和服務器都擁有對方的全部的schema，因此，在通信中的命名域、缺失域、附加域等都可以很容易被處理。

Avro schema是使用JSON定義的。在已經存在JSON庫的語言中實現起來會更加方便。

同類比較

Thrift、Protocol Buffers等也提供了和Avro類似的功能。Avro區別於它們的主要方面如下：

動態類型：Avro不要求代碼生成。數據總是和schema一起，無需代碼生成和靜態數據類型等就可以完整解析。這有助於在多種語言中構建通用的數據處理方法。
無標記數據：由於讀取數據時總可以獲取到schema，因此，極少的類型信息會被編碼到數據中。這樣使得序列化之後的大小更小。
無手動分配的域標識：當一個schema發生變化，處理數據時新的和舊的schema都可以獲取到。所以，二者的差異使用域名即可解決。

參考鏈接

原始英文鏈接：http://avro.apache.org/docs/1.8.1/

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Java 自動識別文本文件字符編碼工具類

Java 自動識別文本文件字符編碼工具類測試用例2/** * @author Mr.superbeyone * @project cs-sys

2020-07-06 14:34:03

回望2015年看過的書，2016需要看的經典書

回望2015年看過的書，2016需要看的經典書 2015年，對我來說，是特別重要的一年，很多很多的事在這一年中發生了，連我自己也沒有想到，額，偏題了，那我今天就來扒扒2015年到底看了哪些書籍，與2016需要看的書籍。 201

2020-06-30 08:10:45

用於Firefox的Google工具欄Beta 2發佈

　　Google 一貫的目標的是成爲最好的搜索引擎，爲滿足用戶的需求可謂是不遺餘力，Google Toolbar的推出便是其方便用戶信息搜索的舉措之一。下載安裝Toolbar後，它會與IE瀏覽器工具欄緊密集成，用戶可以直接在工具條中輸入關

2020-06-26 09:15:50

在VS後臺接收GridView中綁定的數據

將一個數據庫表中的數據取出並通過gridview顯示出來，然後將某一列的數據插入到另一張數據庫表中（此例的兩個數據庫分別爲exam,test_table） //數據庫連接字符串 public static string SQLC

2020-06-25 22:20:31

數據庫操作類SQLHelper

有關C#連接SQL server 的一些數據庫操作函數數據庫操作類SQLHelper: using System; using System.Data; using System.Configuration; using System

2020-06-25 22:20:21

除了上帝就是我我是穆里尼奧

"我不是從瓶子裏蹦出來的，不過我是一個特殊的人。"這是穆里尼奧的一句名言，他確實有些特殊。　　忍耐　　穆里尼奧的父親是葡萄牙前著名門將弗萊克斯-穆里尼奧，老穆期待着兒子能夠遺傳自己的足球天賦，但情況和他的想象

2020-06-25 04:51:21

ELK不能查詢日誌報錯：index read-only

1.Kibana不能進行日誌查詢，其表現爲不能查當前日誌，但可以查到前幾天的日誌； 2.kibana能查看以前的日誌，說明kibana和elasticsearch應該運行正常。可能是filebeat或者logstash出了問題，無法將日誌

凭果子认树

2020-06-24 14:51:24

burpsuite得證書導到手機上安裝後依然無法訪問網絡原因

burpsuite導入CA證書並安裝到手機上，網上教程一大片，不再贅述。留下安裝後依然無法訪問網絡原因：burpsuite 默認用得127.0.0.1：8080，並不會認本地局域網ip得地址進行轉發。而手機上配置得是電腦上得局域網

百物易用是苏生

2020-06-24 13:24:50

python requests模塊給發送參data默認就會urllib.parse.quote_plus進行編碼，無需自己手動處理

爬取網站數據時，用到了國外的手機號登錄。自以爲是的，對+1xxx形式的參數進行了urllib.parse.quote_plus，然後總是不成功，最後使用burpsuite抓包比對。發現多了個%25 一查，知道了是對%進行了urlenc

百物易用是苏生

2020-06-24 13:24:50

多平臺寫作，空閒時同步！

一隻奇怪的碼農等待你的發現主戰場公衆號:百物易用是蘇生副戰場微博: 百物易用是蘇生O https://weibo.com/u/2532819964 短視頻抖音：百物易用是蘇生技術博客 csdn: 百物易用是蘇生 https://

百物易用是苏生

2020-06-24 13:24:39

Captive Portal - 連接WiFi自動彈出認證頁面

摘要解釋Captive Portal是什麼、爲什麼連上WiFi後會自動彈出認證頁面。同時，說明主流操作系統的支持情況。 Captive Portal 中文通常譯作“強制主頁”或“強制登錄門戶”。是一個登錄Web頁面，通常由網絡運

2020-06-20 20:03:03

虛擬主機 VPS 雲服務器的區別

一直困惑虛擬主機、VPS、雲服務器（雲主機）這幾個概念，下面是蒐集的資料，作爲參考。 Plan A 服務器是真實存在的物理設備。無論是性能還是安全方面都是最強大的。 VPS是虛擬服務器的意思，它的功能與服務器一模一樣。但不同的是它是虛擬

2020-06-20 19:05:13

關於ABI OABI EABI

什麼是EABI Embedded application binary interface, 即嵌入式應用二進制接口，是描述可連接目標代碼，庫目標代碼，可執行文件影像，如何連接，執行和調試，以及目標代碼生成過程，和c, c++語言接口

2020-06-20 19:05:02

BinaryToys - 詭異的桌面電子生物

站長曾經寫過一篇關於桌面電子寵物的文章，共享了自己收集的16款桌面電子寵物，這些小寵物都非常有趣，網友們也非常喜歡。今天，站長推薦的是一款類似的玩物

2020-06-20 05:31:11

直接將知識下載到大腦將成爲可能

教育專家預測，電影《黑客帝國》（The Matrix）描述的下載知識到大腦裏直接學習的情節30年內將會實現。英國獨立學校委員會（Independent Schools Council, ISC）首席執行官克里斯&#183；帕裏（Chris

2020-06-20 05:31:11

24小時熱門文章

最新文章

最新評論文章