一、摘要
文章提出了一種結合【實體外部描述】和【三元組】的知識圖譜表示學習方法。在【知識圖譜補全】和【實體分類】兩個任務上取得了很大的提升。並且很重要的一點是,該方法能夠自然地解決【實體不在圖譜中的問題】。
二、簡介
文章使用了兩種表示方法進行知識圖譜表示:
- 基於結構的表示方法,如
Trans-E
等。 - 基於描述的表示方法,利用對實體或者關係的自然語言描述生成的表示。
三、方法
文章在相同的向量空間中學習兩類實體表示,具體的方法是通過優化下式
其中是Trans-E
等方法的優化目標,而
用來對其兩個表示的空間。
基於結構的表示方法,如Trans-E
就不做介紹。而基於描述的表示方法,文章給出了兩種。
詞袋模型編碼器
這裏首先我們擁有頭實體和尾實體的描述信息,然後通過TF-IDF
等算法對描述中的詞進行排序找到【關鍵詞】,將關鍵詞的embedding
加起來得到實體的embedding
CNN編碼器
四、實驗結果