薦書:理解知識圖譜必看的那些書、公衆號和其他資料

初稿已完成,以後慢慢補充。


在知識圖譜領域摸爬滾打了近三年,幾乎全靠自學,現在想起來還是一把辛酸淚。雖然現在的工作和知識圖譜沒太多關係,但還是放不下自己研究了很久的領域,所以在此總結一些有用的書和資料,以便自己回顧,以便他人學習。

薦書:

我開始研究知識圖譜的時候,相關書籍真的不多。大概是我當時按照“知識圖譜”這個領域來搜索,結果自然是無功而返。其實,按照“語義網”搜索,可以找到很多基礎又權威的資料。知識圖譜和語義網可以說是雙胞胎(非常相似但有細微的不同),知識圖譜的描述語言,又和xml,html是親戚。事實上,知識圖譜最常用的描述語言RDF,有xml形式的寫法。

1. 語義網基礎教程

這本書可以說是我的“師傅”了,它把我領進了知識圖譜的大門。我看的是第三版,現在應該已經出到了第四版。不過此書現在並不好買,大概只能在網上的個體書店或圖書館看到。

“知識圖譜”雖然是2012年提出的,但其發展歷程遠不止於此。“知識圖譜”更像是爲了引起人們關注而起的一種噱頭,它的前身語義網早在上世紀50年代就有研究資料了。語義網更重視知識圖譜的上層結構,所以由此衍生出一系列通過邏輯推理補充語義網的方法。隨着信息時代的到來,關於個體的數據量越來越大,所以更注重數據層的知識圖譜才被提出來。

總之,這本書說明白了知識圖譜的來龍去脈,以及表示它的幾種語言是怎麼用的。並且這本書已經出了四版,漢化得比較好,文字容易理解。

2. 關聯數據:萬維網上的結構化數據

這本書是2018年出的,相對來說新一些。目前這本書我只看了第一章,感覺還可以,所以也推薦一下。

在讀這本書之前,我對知識圖譜只有一個籠統的認識:見到知識圖譜,能認出來;讓我說知識圖譜的用途,我也能羅列出一些諸如便於推理,輔助搜索引擎,個性化推薦等大衆常識。但我並沒有真正見過知識圖譜的效用。這本書第一章讓我真正理解了什麼是關聯數據(這種數據的形式,實際上就是知識圖譜的形式)。由關聯數據組成的網頁,可以導出爲RDF形式。而這種形式既便於人類理解,也便於機器理解。這種形式組成的網頁,便於其他人對當前知識的利用。只要把對應的RDF複製下來,就相當於擁有了該網頁中蘊含的知識,從而可以通過組合知識的方式創建自己的網頁。

總結:個人認爲,市面上適合知識圖譜初學者的紙質書籍仍不算太多,大概因爲知識圖譜本身就沒有什麼確切的定義吧。最近王昊奮和肖仰華都除了知識圖譜相關的書,我翻看了一下,感覺書的概括面不小,但不精,也太厚,其中語言有些晦澀,貌似也不是王老師和肖老師親筆寫的全書,因此不建議逐頁閱讀,有需要時當作查資料的工具書未嘗不可。

薦公衆號:

1. PaperWeekly

這個公衆號可以說是比較有名了,經常解讀頂會上的英文論文。此外,公衆號還經常舉辦線下活動,在清華大學進行知識交流。主要就是邀請一些比較厲害的清華碩博士,講自己在權威期刊或會議上發表的論文,當然還有答疑等線下交流的機會。

2. 機器之心

同樣是學術分享公衆號,但是文章的內容學術性沒那麼強,比較適合當作科普雜誌來讀。

3. AI科技大本營

大概和機器之心的模式差不多,分享一些AI方面的知識。

4. 開放知識圖譜

從題目可以看出,公衆號比較有針對性地介紹知識圖譜方面的論文、新聞、知識。

5. 知識工廠

從名字也可以看出,公衆號側重分享知識圖譜和深度學習的相關知識。

 

薦工具:

1. Gephi

複雜網絡領域常用的畫圖軟件。可導入CSV格式的三元組,然後就可以把知識圖譜可視化了。當然Neo4j功能應該更強大,但我沒怎麼用過,暫時先不推薦,用過之後再補充。

2. Protege

把RDF或OWL文件導入,也能可視化。和Gephi不同的是,這個軟件面向語義網更多一些,所以不能承擔太大的數據量,個人認爲100個實體大概就是其上限了。這個軟件的好處在於支持推理。

3. rdf2rdf

一個可將知識圖譜描述文件轉化爲三元組的程序,具體見文章:https://blog.csdn.net/LucyGill/article/details/79501700

(其實就是把rdf,owl,xml等格式的知識圖譜轉化爲N-triples格式啊。轉化後再用Gephi可視化一下,可以清楚地看到知識圖譜的結構。)

薦人(排名分先後):

1. 鮑捷

在語義網時代就開始研究知識圖譜,在這個領域挺有發言權的。看過他的講稿,感覺他真正瞭解知識圖譜的來龍去脈,說話也通俗易懂。

2. 王昊奮

在小象學院開設了知識圖譜相關視頻課程,初學者看他的視頻也是不錯的。(悄悄說一句,tb在賣這個課程,只要幾塊錢就能買到錄屏版)他曾經參與美國智能問答機器人的構建,也算是元老了。

3. 肖仰華

因爲我的研究偏上層結構,而他一直強調上層結構重要,所以對他還是比較有好感的。看過他的文章,也不錯,適合新手。

4. 劉知遠

主要涉及深度學習方面的知識圖譜,比如知識圖譜向量化的Trans系列,好多算法都是他們課題組做的。清華大學的老師,比較年輕。去年在北京舉辦過一個逼格比較高的知識圖譜活動。(兩天都提供精美的餐食,很遺憾沒去……)

5. 漆桂林

帶着團隊做各類知識圖譜,人比較接地氣。之前在知乎問過知識圖譜方向的相關問題,他竟然主動回答了(驚)。師兄還加了他的微信,據說如果想的話還可以跟着他的課題組幹活 。

6. 李涓子

不是特別瞭解,看過她寫的知識圖譜相關綜述。好像也是清華的,和劉知遠同事。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章