Linkis JDBC是如何適配Tableau的?


目錄

一、       背景介紹
二、       使用案例
1     連接數據源
2     查看數據庫並提交Linkis任務
三、       兼容Tableau的具體實現
1     定義JDBC展示屬性的Manifest
2     用於定製連接器對話框的tcd文件
3     用於解析連接器的tcr文件
4     定製SQL方言的tdd文件
5     連接器的構造器connectionBuilder
6     連接器的參數配置文件Connection Properties
7     打包裝入Tableau完成適配
四、       實現總結
五、       參考文獻
 


01

背景介紹


----爲什麼我們需要Linkis JDBC去兼容Tableau?

毫無疑問,Tableau在當今商業化BI產品中有着廣泛的客戶羣體,很多商業機構使用Tableau進行數據分析和構建報表,支持Tableau的兼容方案可以使不懂java的數據分析人員依靠托拉拽的可視化方式向Linkis提交任務。無論對於用戶還是Linkis,實現Tableau兼容都是非常值得去做的一件事。

對於用戶來說,使用JDBC的開發人員必須掌握JDBC的使用方法,這種限制增加了分析人員的學習成本,爲了豐富用戶的使用場景,不僅僅依靠java api的方式去構建代碼與Linkis互動,兼容可視化BI工具的想法應運而生,而Tableau正是這一想法的其中一個實現目標。

對於Linkis來說,Linkis項目誕生之時便有“連接一切”的願景,實現豐富的底層計算存儲組件的支持和滿足多樣的上層應用接入,通過JDBC的方式連接Linkis拓展了自身的適用場景,將Linkis JDBC適配Tableau本身也是拓展用戶羣體的一種體現。


----應該如何去實現這一目標?
Tableau中提供了大量的數據源支持,而這些支持都是需要驅動類來實現的,例如Mysql、Hive等數據庫的JDBC Driver,只需要數據源廠商定製滿足Tableau接口規範的模組文件就能在Tableau中制定可插拔的數據源連接器。
圖2-1 Tableau中已經適配的數據源


02

使用案例

Tableau的適配方法在第三章中會詳細介紹,在介紹適配方法之前,我們先來一起體驗一下適配後的Tableau如何通過JDBC輕鬆地聯動Linkis。

(1)連接數據源

在適配好了Tableau之後,我們啓動Tableau,可以看到“連接” ->“服務器” ->“更多”的列表中已經有了Linkis。
圖2-1 服務器列表中已經有了Linkis
點擊後彈出對話框需要填寫數據源的相關配置,包含服務器的主機IP、端口、數據庫、用戶名及密碼。這裏的主機ip需要填寫部署Linkis的服務器ip,端口是gateway的服務端口,數據庫是Hive的數據庫,需要注意的是,用戶名是具有訪問Linkis權限的用戶,而不是數據庫的用戶,因爲本質上是用戶名和密碼需要經過gateway服務進行登錄和權限校驗。
圖2-2 通過Linkis JDBC連接到Linkis
填寫好相關數據點擊登錄即可。

(2)查看數據庫並提交Linkis任務

登錄後頁面會自動跳轉,左側一欄展示當前數據庫所有的Hive表信息
圖2-3 登錄後的使用界面
我們來試一下查詢表的具體數據,這裏使用的是testjohn1表,點擊表右側的按鈕即可快速查詢。
圖2-4 查詢表數據按鈕
圖2-5 查詢結果
從圖2-5可以看出,tableau已經成功提交SQL任務到Linkis執行,並將返回的結果集解析成表展示給用戶。我們從dss(DataSphere Studio)的管理臺可以查看到該任務的提交和執行情況。在後續linkis1.0的版本中也將可以通過linkis的管理臺直接查看任務的提交和執行情況。
圖2-6 dss管理臺任務執行情況
這裏介紹了在Tableau使用Linkis JDBC提交任務到Linkis的具體案例,用戶可以實現零代碼編寫使用Linkis,下面將介紹Tableau兼容方案的具體實現方式,會較爲詳細地介紹文件的作用和生成細節。


03

兼容Tableau的具體實現

爲了實現將Linkis的JDBC驅動加入到服務器列表中實現適配,我們需要自定義修改Tableau的適配文件,適配文件包含Manifest(.xml文件)、Tableau Custom Dialog file(.tcd文件)、Tableau ConnectionResolver file(.tcr文件)、Tableau Dialect file(.tdd)、connectionBuilder(.js文件)以及Connection Properties(.js文件)這六個文件[2],下面將逐一介紹。

(1)定義JDBC展示屬性的Manifest

Manifest文件的主要作用是用於定義連接器名字,用於在可用的數據源UI頁面展示給用戶,該文件對於每個客製化連接器來說是必選的,同樣地,在linkis的JDBC方案中,該文件也進行了修改與適配。

<?xml version='1.0' encoding='utf-8' ?><connector-plugin class='linkis_jdbc' superclass='jdbc' plugin-version='1.0' name='Linkis (JDBC)' version='2020.1.0'>  <vendor-information>    <company name="Linkis"/>    <support-link url="https://github.com/WeBankFinTech/Linkis"/>  </vendor-information>  <connection-customization class="linkis_jdbc" enabled="true" version='2020.1.0'>    <vendor name="linkis"/>    <driver name="Linkis JDBC Driver"/>    <customizations>      <customization name="CAP_JDBC_METADATA_READ_PRIMARYKEYS" value="no"/>      <customization name="CAP_JDBC_METADATA_READ_FOREIGNKEYS" value="no"/>      <customization name="CAP_JDBC_QUERY_ASYNC" value="yes"/>      <customization name="CAP_JDBC_QUERY_CANCEL" value="yes"/>      <customization name="CAP_FAST_METADATA" value="yes"/>      <customization name="CAP_SELECT_INTO" value="no"/>      <customization name="CAP_SELECT_TOP_INTO" value="no"/>      <customization name="CAP_CREATE_TEMP_TABLES" value="no"/>      <customization name="CAP_QUERY_BOOLEXPR_TO_INTEXPR" value="no"/>      <customization name="CAP_QUERY_GROUP_BY_DEGREE" value="no"/>      <customization name="CAP_QUERY_SORT_BY_DEGREE" value="no"/>      <customization name="CAP_QUERY_SUBQUERIES" value="yes"/>      <customization name="CAP_QUERY_TOPSTYLE_LIMIT" value="yes"/>      <customization name="CAP_QUERY_WHERE_FALSE_METADATA" value="yes"/>      <customization name="CAP_QUERY_SUBQUERIES_WITH_TOP" value="yes"/>      <customization name="CAP_SUPPORTS_SPLIT_FROM_LEFT" value="yes"/>      <customization name="CAP_SUPPORTS_SPLIT_FROM_RIGHT" value="yes"/>      <customization name="CAP_SUPPORTS_UNION" value="yes"/>      <customization name="CAP_QUERY_ALLOW_PARTIAL_AGGREGATION" value="no"/>      <customization name="CAP_QUERY_HAVING_REQUIRES_GROUP_BY" value="yes"/>    <customization name='CAP_JDBC_SUPPRESS_ENUMERATE_DATABASES' value='yes' />    <customization name='CAP_JDBC_SUPPRESS_ENUMERATE_SCHEMAS' value='yes' />    <customization name='CAP_QUERY_TOP_N' value='no' />    </customizations>  </connection-customization>   <connection-dialog file='connection-dialog.tcd'/>  <connection-resolver file="connectionResolver.tdr"/>  <dialect file='dialect.tdd'/></connector-plugin>

其中class的標籤值必須是唯一的,可以用於其他連接器中.xml文件的尋址、客製化定製以及Tableau工作簿中匹配連接器。
name值在Tableau 連接器窗格中顯示連接器名稱,還可以指定供應商信息。
company name用於在Tableau 連接器窗格中的連接器名旁邊顯示,可以展示連接器的創建者,也就是connector name by company name,例如Linkis JDBC Driverby linkis。
customizationname主要用於定製Linkis中JDBC的功能。

(2)用於定製連接器對話框的tcd文件

Tableau CustomDialog file即tcd文件,該文件是可選的,主要用於定製連接器對話框的內容。

   
   
   
<connection-dialog class='linkis_jdbc'> <connection-config> <authentication-mode value='Basic' /> <authentication-options> <option name="UsernameAndPassword" default="true" /> </authentication-options> <db-name-prompt value="Database: " /> <has-pre-connect-database value="true" /> <port-prompt value="Port: " default="9001" /> <show-ssl-checkbox value="true" /> </connection-config> </connection-dialog>

(3)用於解析連接器的tcr文件

解析器tcr用於Tableau創建連接時尋找Connection文件,配置如下:

<?xml version='1.0' encoding='utf-8' ?><tdr class='linkis_jdbc'>  <connection-resolver>    <connection-builder>      <script file='connectionBuilder.js'/>    </connection-builder>    <connection-normalizer>      <required-attributes>        <setImpersonateAttributes/>        <attribute-list>          <attr>server</attr>          <attr>port</attr>          <attr>dbname</attr>          <attr>username</attr>          <attr>password</attr>          <attr>sslmode</attr>        </attribute-list>      </required-attributes>    </connection-normalizer>    <connection-properties>      <script file='connectionProperties.js'/>    </connection-properties>  </connection-resolver></tdr>


這裏指定了connection-builder和connection-properties的文件名,以及連接器連接時的必要屬性,Tableau會將用戶填寫的這些數據信息組裝成URL字符串用於建立連接。

(4)定製SQL方言的tdd文件

SQL方言是指的不同數據庫之間的命令字不同,爲了使Tableau兼容數據源,需要對數據源的方言進行轉換,由於篇幅原因,這裏只列出部分tdd文件的數據:

<dialect name='HiveDialectSDK'         base='HiveDialect'         class='linkis_jdbc'         version='18.1'>  <function-map> <function group='numeric' name='LN' return-type='real'>      <formula>(CASE WHEN %1 &gt; 0 THEN LN(%1) ELSE CAST(NULL AS DOUBLE) END)</formula>      <argument type='real' />    </function>    <function group='numeric' name='LOG' return-type='real'>      <formula>(CASE WHEN %1 &gt; 0 THEN LOG10(%1) ELSE CAST(NULL AS DOUBLE) END)</formula>      <argument type='real' />    </function>    <function group='numeric' name='LOG' return-type='real'>      <formula>(CASE WHEN %1 &gt; 0 THEN LOG10(%1) / LOG10(%2) ELSE NULL END)</formula>      <argument type='real' />      <argument type='real' />    </function>    <function group='numeric' name='MAX' return-type='real'>      <formula>(CASE&#10;&#9;WHEN (%1 IS NULL) OR (%2 IS NULL) THEN NULL&#10;&#9;WHEN %1 &gt; %2 THEN %1&#10;&#9;ELSE %2 END)</formula>      <argument type='real' />      <argument type='real' />    </function>    <function group='numeric' name='MAX' return-type='int'>      <formula>(CASE&#10;&#9;WHEN (%1 IS NULL) OR (%2 IS NULL) THEN NULL&#10;&#9;WHEN %1 &gt; %2 THEN %1&#10;&#9;ELSE %2 END)</formula>      <argument type='int' />      <argument type='int' />    </function>  </function-map></dialect>
完整的SQL方言文檔可以參考
https://github.com/tableau/connector-plugin-sdk/blob/master/samples/plugins/postgres_jdbc/dialect.tdd

(5)連接器的構造器connectionBuilder

Tableau使用連接構造器(Linkis JDBC中的腳本名爲connectionBuilder.js)創建JDBC連接URL的字符串,腳本映射定義連接配置方式的屬性,在這裏數據庫地址、端口、以及數據庫名構造成JDBC連接字符串傳給驅動程序。
文件具體內容如下:

(function dsbuilder(attr) {    var urlBuilder = "jdbc:linkis://" + attr[connectionHelper.attributeServer] + ":" + attr[connectionHelper.attributePort] + "/" + attr[connectionHelper.attributeDatabase];
return [urlBuilder];})


(6)連接器的參數配置文件Connection Properties

該參數配置文件是可選的,僅僅當數據源驅動是JDBC時才需要(Linkis JDBC中的腳本名爲connectionProperties.js),用於構建URL最後的參數設置。

(function propertiesbuilder(attr) {    var props = {};    props["user"] = attr[connectionHelper.attributeUsername];    props["password"] = attr[connectionHelper.attributePassword];    if (attr[connectionHelper.attributeSSLMode] == "require") {        props["ssl"] = "true";        props["sslmode"] = "require";    }
return props;})


(7)打包裝入Tableau完成適配

方法一:自定義連接器插件裝載路徑(已驗證可行)
首先我們將前面六個文件裝入目錄linkis_jdbc目錄(該目錄名應該和Mainfest中的class='linkis_jdbc'是一致的),該目錄位於C:\connectors,文件目錄層級如下圖所示:
圖3-1 適配文件路徑

上述路徑和文件名是自定義的,不必和本文章完全一致,在啓動時我們需要添加額外參數-DConnectPluginsPath=/Path定向加載適配文件。在CMD命令行中輸入

E:\tableau\bin\tableau.exe  -DConnectPluginsPath=C:\connectors

其中E:\tableau\bin\tableau.exe是Tableau的運行路徑。也可以在Tableau快捷方式中指定運行參數,這樣就可以避免每次通過命令行啓動。

圖3-2 指定運行參數

方法二:通過官方文檔構建(嘗試過未成功,可能方法有誤)
該種方法是通過構造.taco文件存入Tableau的數據源根目錄,實現具體方法可以參考[1] 。
我們通過第一種方法完成了適配,在適配好了Tableau之後,我們啓動Tableau,可以看到“連接”->“服務器”->“更多”的列表中已經有了Linkis JDBC。
圖3-3 適配成功


04

實現總結

Tableau作爲一款受衆面極廣的商業BI軟件,兼容Tableau可以使Linkis的適用性更廣,用戶可以通過Linkis在Tableau上實現底層spark集羣的SQL請求。Tableau爲數據源服務商提供了一套完整的接口方案,方便服務商定製屬於自己的數據源驅動的適配文件,只需要服務商根據自身驅動的特性適當地修改,即可方便地完成適配過程,整個適配流程也遇到了一些困難,通過查看Tableau的日誌和其他產品的兼容方案[3]才得以解決。
       我們也將在未來對Linkis做更多的適配內容,歡迎廣大社區用戶加入到Linkis的開源建設工作中,我們也將極力提供應有的支持。



05

參考文獻

[1] 使用 Tableau Connector SDK 組建的連接器外掛程式
https://help.tableau.com/current/pro/desktop/zh-tw/examples_connector_sdk.htm
[2] connector-plugin-sdk
https://github.com/tableau/connector-plugin-sdk
[3] tableau-qubole-connector
https://github.com/qubole/tableau-qubole-connector/tree/master/Hive/qubole_hive


WeDataSphere,BIG DATA MADE EASY.

用心做一個有溫度的開源社區

~歡迎關注~


掃碼關注我們

微信號公衆號 : WeDataSphere

GitHub:WeDataSphere

如果喜歡我們的產品或文章,請給我們的GitHub點上你寶貴的star和fork哦~~

歡迎加入我們的有獎徵文活動哦,詳見如下鏈接~

【有獎徵文】我有酒,你有故事嗎?

同時誠摯的希望您點開“閱讀原文”,在OSC開源投票中,爲Linkis與DataSphere Studio投上您寶貴的一票哦~~

本文分享自微信公衆號 - WeDataSphere(gh_273e85fce73b)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章