實時事理學習與搜索平臺DemoV1.0正式對外發布

我們團隊探索了一種將事件、概念、邏輯、實時學習、多類知識庫實時更新串起來的知識服務新模式。一個面向事理的實時學習和搜索系統Demo,取名叫“學跡”,取自“學事理,知行跡”。
項目地址:https://xueji.zhiwenben.com

一、 “學跡”的起源與願景
“踏雪有痕,抓鐵有印”,“來時須有影,去時更有蹤”,萬物皆有跡可循。語言是社會的鏡子,每天產生的文本中蘊含了大量的事件知識,清晰地記錄了社會發展中各個事物在人們腦海中的印象以及自身發展和演變的軌跡。

我們常想,“要是能夠構建一個全面、精準、緊隨社會發展的軌跡庫(事理知識庫),將社會對某個事物或事件不同的認識整理出來,將某個或每類事件發展和演化的邏輯軌跡梳理出來;並基於這種認識和演化邏輯,將互相關聯的事物聯繫起來,做些有意義的未知推理,將是件多麼美妙的事”。

秉持着這個“學事理,知行跡”的初衷,我們推出了“學跡”,一個7*24小時不斷學習的實時事理學習與搜索平臺,力圖緊跟實時網絡信息,面向公衆提供以“事件”爲核心的實時結構化知識搜索服務。

我們希望,來過“學跡”的人,都能看到“學跡”的這種初衷,並從我們的知識服務中得到有用的信息,並對我們的不足,提出批評和建議,督促“學跡”不斷進步。

二、 “學跡”的技術與構成

“學跡”的背後,是以“數地工場”中圍繞“事件”爲核心的相關自然語言處理技術(事理抽取、概念識別、產業鏈識別等)沉澱以及實時知識庫構建與基於事理的關聯推理技術支撐,也是數據地平線全體開發人員在近年來對“事理”相關工作的一個典型總結和應用嘗試。

在這裏插入圖片描述
“學跡”就像一個還在成長的孩子,隨着後臺知識學習算法的不斷升級以及更多、更廣多源異構數據的輸入,它必將成爲一個龐大的多源知識庫,提供更好的檢索體驗,爲此:

我們設計了一套以“事件”爲核心的知識學習和搜索數據流。我們避開了類型衆多且不可控的“實體搜索”,而選擇了更爲聚焦的“事件搜索”,我們約定,一個事件應該包括具體的施事主體和關聯動作,如“人民幣貶值”、“美聯儲降息”,對應其中的實體信息,我們將以“概念描述”的方式對其實體進行解釋展示。

我們從零研發了一套互聯網採集引擎。每天數以萬計的網絡開源文本源源不斷地輸入到我們的實時學習系統中,並變成新的結構化事理、概念、產業鏈知識。值得注意是,這個學習過程在無人干預的情況下 7 x 24 小時不間斷運行,實時文本中的結構化知識可在幾秒鐘內即可被掌握。

我們設計了一套可靠的知識可信度評分算法。隨着信息源不斷增加,先前學習到的知識的可信度會被不斷更新,錯誤結果的權重被自動糾正,根據可信度排序,可以看到“學跡”最有把握的知識。

我們嘗試了一種友好的方式來最大化地展示事理學習的動態過程。我們用連線和層級表示的方式,爲每條知識都提供可視化的學習實證,從中可以看到知識的創造者、知識的創造時間、知識出現的上下文,知識學習來源的評分。

我們嘗試了一個針對事件的實時熱點發現和推薦形式。基於這些不斷湧進的實時知識信息,進一步對當下實時的熱點事件進行聚合和提煉,在提供快速事理搜索的同時,能夠時刻看到時下最新、最熱、發生的事件列表。基於推薦,相關的搜索可進一步得到拓寬和聚合。

我們嘗試了一條將各種數據進行關聯聚合的展示方式。爲了將事件與其他關聯數據形成傳導通路,以事件爲連接中介,我們將概念、事件、產業、數據等進行關聯,將事件相關的事物都有機地聚合起來。

我們嘗試地做了一種基於推理可解釋性的產業標的物預測。試圖基於這些知識試探性地往前走一步,做一些產業相關的推理和預測。根據演變的軌跡以及在概念、產業鏈以及數據關聯路徑,我們對標的物的利好利空情況進行了可能的判定。

我們嘗試儘可能最大化地提供信息或知識服務。對於暫時未能收錄到我們的知識庫中的事件,我們會推薦出與其最爲相關的事件以及關聯資訊,這樣即便沒有得到期待的結構化知識,用戶也不會白來,隨着後臺實時數據的不斷擴充,這種情況會得到好轉。

三、 “學跡” 的用法和探索

我們避開了類型衆多且不可控的“實體搜索”,選擇了更爲聚焦的“事件搜索”。我們約定,一個事件應該包括具體的施事主體和關聯動作,如“人民幣貶值”、“美聯儲降息”,對應其中的實體信息,我們將以“概念描述”的方式對其實體進行解釋展示。

因此,在“學跡”裏,所有的功能和內容都圍繞“事件”展開,我們更推薦您在使用的過程中輸入一個事件,這樣能夠儘可能得到更滿意的結果。在這裏,我們希望您可以:
1、找到關心的事件
“學跡”以搜索框的形態出現,並限制在指定事件的搜索,在搜索的過程中,會自動進行事件聯想,您可以根據下拉的事件聯想中選擇,也可以自己輸入。

在這裏插入圖片描述
此外,您也可以進一步根據我們推薦的事件,完成更進一步的搜索。

2、瞭解當下的熱點事件
我們根據時下發布的資訊,識別出了當下的實時事件熱點,並實時更新,您也可以直接點擊查看。

在這裏插入圖片描述
3、體驗到知識的實時學習過程
在“學跡”的首頁底部,我們與後臺的實時學習進行對接,動態地展示了這種學習過程。

在這裏插入圖片描述
4、瞭解社會對該事件或關聯概念的理解
我們不斷學習出該事件自身或者事件關聯實體的描述信息,從中我們可以得到對該事件本身的印象。
在這裏插入圖片描述

5、看到知識學習過程中的實證來源過程
我們用連線的方式,爲每條知識都提供可視化的學習實證,我們隨機選取了幾條結構化的知識放在頁面的右側。從線條的首末尾動態關聯,可體驗到其中的“取之有道”。
在這裏插入圖片描述

我們對每個結構化的知識都進行了可信度的表示,顏色的深淺以及結構化標籤上的數值對其進行了清晰的區分。點開標籤後出現的下拉信息框中,可以看到知識的生成者、知識的生成時間、生成知識的上下文,知識學習來源的評分。
在這裏插入圖片描述

6、獲取特定事件發生的前因後果
因果邏輯是事理邏輯中的一個重要組成部分,通過事件發生的前因後果,可以對事件的演化提供一定借鑑,通過對邏輯事件關聯的聚合,可以看出不同可信度下特定事件發生的前因後果。
在這裏插入圖片描述
7、查看特定事件關聯的數據和經濟產業
我們將事件與產業鏈實時知識庫進行關聯,從以事件的關聯邏輯進一步延伸至產業鏈的關聯邏輯。
在這裏插入圖片描述

我們將事件與後臺數據指標進行關聯,形成事件與具體量化數據指標的聯通。

在這裏插入圖片描述
8、基於可解釋推理路徑的經濟標的物影響預測
根據演變的軌跡以及在概念、產業鏈以及數據關聯路徑,我們對標的物的利好利空情況進行了可能的判定,在給出標的物的同時,還給出推理路徑,標的物的影響類型。

在這裏插入圖片描述
9、跟蹤特定事件的關聯資訊
除了結構化的知識之外,還給出了與事件相關的關聯資訊。需要注意的是,對於暫時未能收錄到我們的知識庫中的事件時,這些相關關聯資訊可以進一步發揮全文檢索的功能,您也不會白來。
在這裏插入圖片描述

四、 “學跡”的未來與期待
我們正在尋求一種更爲友好的技術展示形態,並尋求運用這類技術來做一些有意義和有價值的落地應用,用於探索解決並自然語言處理業務中的一些實際問題。“學跡”是對這一目標的一個嘗試。
學跡”正不斷成長,交互方式以及各個細節還處於初步探索階段,但其中的學習技術和知識庫思想讓“學跡”前路可望。
我們相信,假以時日,後臺知識的精度和廣度、實時處理的速度和性能將進一步提升。我們相信,成長的“學跡”,將更好地爲社會提供的實時事理知識檢索和探索。
“讓事理知識學得更快、學得更多、學得更好,併爲更多人傳遞事理知識和知識學習技術”,是“學跡”下一步要前進的方向。
有關於對“學跡”有更好的想法和意見,對“學跡”中使用的抽取、關聯和推理技術以及積累的知識庫有興趣或需求,歡迎與我們聯繫。
“學跡”還在不斷成長,歡迎常回來看看。

項目地址:https://xueji.zhiwenben.com
如有自然語言處理、[知識圖譜、事理圖譜]、社會計算、語言資源建設等問題或合作,如果對事件知識庫有興趣的落地或者研究,可聯繫我:
1、我的github項目介紹:https://liuhuanyong.github.io
2、我的csdn博客:https://blog.csdn.net/lhy2014
3、about me:劉煥勇,中國科學院軟件研究所,[email protected]
4、懂預言者得天下,得語言者分天下,得知識邏輯者,遊得天下。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章