知識圖譜技術的演進

知識圖譜技術的演進


簡述  

  圖譜是指進過系統編輯並根據實物描述或攝製的圖,是研究某一學科所用的資料。圖譜中的指的是地圖,指系統,圖與譜合一則是空間與時間動態變化的統一表述。圖譜主要表現事物和現象的形態結構、成因機制、組成物質、動態變化等綜合性、複雜性規律,往往以系列圖的形式表示時空動態變化[12]。


  知識圖譜,也被稱爲科學知識圖譜、知識域可視化或知識域映射地圖,是顯示科學知識的發展進程與結構關係的的一系列各種不同的圖形。它用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪製和顯示知識及它們之間的相互聯繫。文獻[4]也將科學知識圖譜譯爲Scientific Knowledge Map,在上述概念的基礎上認爲科學知識圖譜可以在組織內創造知識共享的環境,從而最終達到促進知識交流和研究深入的目的。

 

  具體來說,知識圖譜是把應用數學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現分析等方法結合,用可視化的圖譜形象地展示學科 的核心框架、發展歷史、前沿領域以及整體知識架構的多學科融合的一種研究方法。它把複雜的知識領域通過數據挖掘、信息處理、知識計量和圖形繪製而顯示出 來,揭示知識領域的動態發展規律,爲學科研究提供切實的、有價值的參考[12]。

 

  Google知識圖譜(Knowledge graph),通過用戶搜索query,能夠顯示關於這個query相關的更多的實時信息。使得搜索智能化,根據用戶的意圖得到用戶想要的結果。

  知識圖譜,可將搜索結果進行知識系統化。一個關鍵詞搜索也能獲得多維度的相關信息,呈現在有結構化的知識卡上。爲用戶提供有完整知識體系的搜索結果。 

  相比於之前的搜索結果看來,知識圖譜將在三個方面提高Google搜索的最終結果:

  找到正確的結果。由於一個關鍵詞可能代表多重含義,所以知識圖譜會將最全面的信息展現出來,讓用戶找到自己最想要的那種含義。

  最好的總結。有了知識圖譜,Google 可以更好的理解用戶搜索的信息,並總結處相關的內容和主題。當你搜瑪麗·居里時,你不僅可以獲得這個關鍵詞的所有相關內容,還能獲得居里夫人的詳細生平介紹。

  更深、更廣。由於知識圖譜會給出搜索結果的完整知識體系,所以用戶往往會發現很多不知道的東西(知識)。當你搜索一個即將去玩的地方時,可能你會發現一個以此命名的餐館,甚至還可能發現還有一本小說就叫這個名字,並且已經改編成了同名電影。

涉及到的方面

   1.複雜的數據模型構建:freebase namespace domain type property,其中的相互關聯關係。

      2. 數據結構、數據存儲、圖數據存儲

      3. 數據收集困難:這種結構化的數據,添加困難,需要的字段比較多。

      4. 完整的體系:freebase的體系價值很大,需要內部構建基礎的數據,同時需要定製規則,讓 其他數據源接入,商業合作類型的。需要大量的人工進行審覈和規範。

特點

  1、能夠利用對自然語言查詢進行深入的理解,並從語義層面解析用戶查詢意圖;

  2、能夠利用海量的結構化知識庫,針對用戶查詢提供準確的答案。

        3、充分利用結構化大數據,深入理解用戶自然語言查詢並針對查詢出準確的答案,能夠更好地給出準確的答案,能夠更好地滿足人類對知識獲取的需求,同時也代表計算和搜索的未來。

背後的支持

        知識圖譜的背後是龐大的信息庫。知識圖譜的信息蒐集工作始於2010年收購的MetawebMetaweb專注於將不同文字表述與同一個實體連接起來,並探索這些實體的屬性和彼此之間的關係,最終提供一種新的搜索形式。Metaweb的數據來源主要來源與Freebase ,google的信息來源較廣。

發展趨勢

       知識圖譜:未來的數據挖掘,基於海量數據之上的數據管理平臺(DMP)。搭建使用即反饋的個性化數據產品平臺。根據用戶的任何需求,追究映射其根源,實時個性化推薦。在需求和產品上精益求精個性化。更加符合用戶的需求。

對比

  相比與Goggle提出的knowledge graph ,Facebook也於2013115日推出了圖譜搜索(Graph search)。該功能基於社交圖譜(social graph)的語義搜索服務。目的:讓一切信息可搜索化、可被發現用戶登錄使用臉譜搜索框時,能在下拉菜單中中使用好友、照片、地點和興趣等新的搜索選項。與基於關鍵詞匹配的傳統網絡搜索引擎相比,圖譜搜索能夠支持更自然、複雜的查詢輸入,並針對查詢直接給出答案。與搜索引擎關鍵詞自動補足功能類似,圖譜搜索會在用戶輸入時同步預測用戶搜索意圖,並根據用戶選擇進行查詢擴展。

  圖譜搜索是基於社交圖譜構建起來的搜索服務,與基於關鍵詞匹配的傳統網絡搜索引擎相比,圖譜搜索能夠支持更自然、複雜的查詢輸入,並針對查詢直接給出答案。

  除臉譜外,信息技術領域的其他巨頭也先後推出了類似的基於結構化數據的搜索產品或服務,作爲其進軍和探索下一代搜索引擎技術的橋頭堡和試驗田。

谷歌提出了知識圖譜[9] 的概念,並推出了基於知識圖譜的新型搜索服務。知識圖譜從本質上講是一個知識庫,基於知識圖譜的搜索服務則可以看作是一個典型的自動問答系統。與傳統網頁搜索相比,基於知識圖譜的搜索能夠更好地理解用戶的搜索意圖,並對相關內容和主題進行總結。例如,當輸入“Bill Gates”時,用戶不僅可以獲得這個關鍵詞的全部信息,還能獲取關於Bill Gates 的介紹。知識圖譜還能夠提供搜索結果的詳細知識體系,幫助用戶從更多角度瞭解搜索結果的相關信息。

有趣的事情[13]

在關於臉譜搜索的演進中,必不可少的兩個人是:扎克伯格、拉斯穆森。前者不用多說,後者是Google Maps的締造者,不用多說,想想有多牛逼。拉斯穆森加入Facebook搜索團隊後,開始這個劃時代的的產品。他提到:讓這一搜索引擎幾乎能回答任何問題。給出的結果是:絕不可能,隨便輸入想要的東西然後就能變魔術一樣彈出一個包含相關內容的頁面,這種事情不是通過自然語言所能實現的,更別說爲所有這些內容編制索引了。在 Facebook 上有超過 萬億個用戶關係,將這些關係索引化,還要隨意利用它們,這絕對是一個巨大的技術挑戰!但如果能實現,這將是非常棒的一個產品。With Google's words: you must implement it!  Facebook 就像一個巨大的數據庫,而你在其中查找匹配的搜索結果,而搜索結果本身也是根據搜索目的進行量身定製的。

 

  相比於GoogleFacebookMicrosoft同時也在做出努力。通過提取網頁中的非結構化數據,構建了結構化的知識庫Satori[11],用於從語義層面提高和改進必應的搜索質量。此外,與谷歌的知識圖譜搜索類似,當用戶輸入的查詢語句能夠被後臺自然語言處理模塊解析時,必應將觸發自動問答模塊,基於Satori 知識庫生成答案,並將生成的結果及其相關知識直接返回給用戶。

   

願景

讓我們追到遠古的需求,展現盡美。

Vision: Let all the information searchable,can be found.

 

 

 

參考內容:

[1]http://www.36kr.com/p/109843.html

[2]http://www.36kr.com/p/202209.html

[3]http://blog.sina.com.cn/s/blog_7d26e1ac01015itb.html

[4]http://blog.sina.com.cn/s/blog_4caedc7a0102e

[5]http://searchengineland.com/google-launches-knowledge-graph-121585vz6.html

[6]http://blog.sina.com.cn/s/blog_4caedc7a0102evz6.html

[7]http://www.zhihu.com/question/21371605

[8]http://news.cnet.com/8300-5_3-0.html?keyword=knowledge+graph

[9] http://searchengineland.com/google-launches-knowledge-graph-121585

http://www.google.com/insidesearch/features/search/knowledge.html

[11] Gallagher, Sean. How Google and Microsoft taught searchto understand the Web. 2012

[12]http://blog.sina.com.cn/s/blog_7d26e1ac01015itb.html

[13]http://www.guokr.com/article/436673/



 Copyright©BUAA

 

發佈了29 篇原創文章 · 獲贊 10 · 訪問量 21萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章