NER
命名實體識別(NER)(也稱爲實體識別、實體分塊和實體提取)是信息提取的一個子任務,旨在將文本中的命名實體定位並分類爲預先定義的類別,如人員、組織、位置、時間表達式、數量、貨幣值、百分比等。
data
https://www.kaggle.com/abhinavwalia95/entity-annotated-corpus/download
Methods
統計的方法
機器學習
統計和機器學習
LSTM
CRF HMM
LSTM + CRF
Bert
Links
Memory with NER: https://colab.research.google.com/drive/1Yxhog5eqz2D17qLXH4bnHsMarRHrSbyP
CRF with NER: https://colab.research.google.com/drive/1VIpv0MXOf_Qq0Gs21GGq12dwzES9a471
Bert with NER: https://colab.research.google.com/drive/13rfbXaTbKpzF4VEiN2kkRPVnVoshoSuy#scrollTo=JBJ7anvohBKq