原创 2020計算平臺事業部校招開始啦!

團隊介紹阿里雲實時計算部是阿里巴巴大數據技術體系的核心團隊。我們圍繞Apache Flink爲核心打造的大數據實時計算平臺,一方面在阿里集團內部提供全公司範圍的實時數據服務,淘寶、天貓、高德、優酷、餓了麼、釘釘等所有子公司的數據和算法業務都

原创 12月5日Spark社區直播【是時候改變你數倉的增量同步方案了】

議題:是時候改變你數倉的增量同步方案了直播間直達(回看)鏈接:https://tianchi.aliyun.com/course/live?&liveId=41124簡介:本分享會先介紹傳統數據增量同步方案,之後對比新方案(完全基於Spar

原创 Spark Operator淺析

本文作者: 林武康(花名:知瑕),阿里巴巴計算平臺事業部技術專家,Apache HUE Contributor, 參與了多個開源項目的研發工作,對於分佈式系統設計應用有較豐富的經驗,目前主要專注於EMR數據開發相關的產品的研發工作。本文介紹

原创 Virgin Hyperloop One如何使用Koalas將處理時間從幾小時降到幾分鐘--無縫的將pandas切換成Apache Spark指南

Virgin Hyperloop One(超級高鐵公司)是一家從事超級高鐵研究的公司,致力於能讓高鐵達到飛機的速度並且擁有更低的成本。爲了能夠製造一個商業的系統,我們需要收集並且分析非常大量的各種不同的數據,包括各種運行測試數據,多種模擬數

原创 列式存儲系列(二): Vertica

作者:辛庸,阿里巴巴計算平臺事業部 EMR 技術專家。Apache Hadoop,Apache Spark commiter。對 Hadoop、Spark、Hive、Druid 等大數據組件有深入研究。目前從事大數據雲化相關工作,專注於計算