實體-關係聯合抽取:入門資料彙總

寫在前面:實體-關係聯合抽取這個方向剛剛入門就要換方向了,很不捨,因此將自己這段時間看的一些入門資料分享出來,供大家學習,希望能起到一些拋磚引玉的作用。如有一絲幫助到您,請點贊支持,謝謝!!!

一、知識圖譜概述

  1. http://ex.cssn.cn/glx_tsqbx/201710/t20171030_3685466_2.shtml
  2. https://www.jiqizhixin.com/articles/2018-06-20-4
  3. https://www.tinymind.cn/articles/3712
  4. https://mp.weixin.qq.com/s/sLgRR5tLYuYMch1EGv55Bw
  5. https://mp.weixin.qq.com/s/SZzJW-tOg-ZJE3jTmYHY7A
  6. https://blog.csdn.net/pelhans/article/details/80019974

二、知識圖譜工具一(中文語義開放平臺)

  1. http://kw.fudan.edu.cn/
  2. https://nlp.qq.com/
  3. http://www.ltp-cloud.com/
  4. https://bosonnlp.com/

三、知識圖譜工具二(標註工具)

1、命名實體識別/關係抽取標註工具

  • ① DeepKE:基於深度學習的開源中文關係抽取工具
    地址:http://www.openkg.cn/tool/186bb65b-195d-4a58-90ec-3e6efd06f864
  • ② NCRF++:序列標註模型
  • ③ Deepdive:斯坦福大學開源知識抽取工具包(三元組抽取)
  • ④ HanLP:面向生產環境的自然語言處理工具包
  • 總結:現有的命名實體識別/關係抽取模型大多隻提供最基本的實體/關係類型,比如:人名、地名、機構名等,因此,對於更細粒度的實體區分起不到作用。如果自己需要按照自己的類別對實體進行分類,最好進行手動標記。

2、手動標註工具

  • ① INCEpTION
    地址:https://inception-project.github.io/
    缺點:命名實體識別的類型已給定且無法修改,該標註工具針對的目標是通用領域的知識圖譜標註。
  • ② Poplar
    是一個企業的內部標註程序,支持性不要,容易崩潰,且要求待標註的數據是json數據。
  • ③ CogComp-NLPy
    缺點:只能進行實體標註,無法標註關係。
  • NeuroNER
    可用來標註實體,文章發表於EMNLP,相比於已有的NER系統,能提供以下優勢:
    1、利用神經網絡(深度學習)
    2、讓用戶能夠創造新的語料庫或修改已有的語料庫
    3、它是跨平臺的、開源的、免費直接使用的
    地址:http://neuroner.com/在這裏插入圖片描述
  • BRAT
    該工具是爲了實體識別和關係抽取設計的,但可用於各種NLP任務。

四、知識圖譜競賽

  1. http://lic2019.ccf.org.cn/kg

五、命名實體識別

  1. https://mp.weixin.qq.com/s/3fY8XS-6vNUvjr-_qAByVA
  2. https://mp.weixin.qq.com/s/viHXIpNjg7J2FpSs6qkwtQ
  3. https://www.cnblogs.com/robert-dlut/p/6847401.html
  4. http://www.shuang0420.com/2018/09/15/%E7%9F%A5%E8%AF%86%E6%8A%BD%E5%8F%96-%E5%AE%9E%E4%BD%93%E5%8F%8A%E5%85%B3%E7%B3%BB%E6%8A%BD%E5%8F%96/
  5. https://www.tinymind.cn/articles/3936

六、關係抽取

  1. https://www.moshangxingzou.com/index.php/category/%e8%ae%a1%e7%ae%97%e6%9c%ba%e6%8a%80%e6%9c%af/%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80/%e5%85%b3%e7%b3%bb%e6%8a%bd%e5%8f%96/
  2. https://blog.csdn.net/u010960155/article/details/97620015

七、實體-關係聯合抽取

  1. https://blog.csdn.net/qq_32782771/article/details/89404573
  2. https://blog.csdn.net/qq_32782771/article/details/89404573
  3. https://www.cnblogs.com/robert-dlut/p/7710735.html
  4. https://www.cnblogs.com/theodoric008/p/7874373.html

八、brat文本標註工具

  1. http://brat.nlplab.org/features.html
  2. https://blog.csdn.net/lidichengfo0412/article/details/99574674
  3. https://www.jianshu.com/p/5043a2128a5f
  4. http://www.sykv.cn/m/view.php?aid=18051
  5. http://www.voidcn.com/article/p-yyophaay-v.html
  6. https://www.cnblogs.com/anai/p/11474460.html

九、一些博客/Github推薦

(僅適合入門,深度理解請閱讀頂會最新文章及其Reference)

  1. https://www.cnblogs.com/Determined22/
  2. https://liuhuanyong.github.io/

十、圖數據庫(Neo4j)

  1. https://neo4j.com/
  2. https://www.w3cschool.cn/neo4j/
發佈了199 篇原創文章 · 獲贊 272 · 訪問量 9萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章