論文筆記：Incorporating dictionaries into deep neural networks for the Chinese clinical NER

原創

无聊的人生事无聊

2019-10-26 05:43

文章目錄

摘要

融合了字典到深度神經網絡中，解決了一些稀有實體不能被識別的問題。

一、簡介

對每個中文字符，基於字典和上下文設計了5種不同的Schemes來創建特徵向量。
介紹了兩種結構融合特徵向量和字的Embedding向量

二、相關工作

現有工作可分爲四類：(1)基於規則的。(2) 基於字典的。(3) 基於統計機器學習的。(4) 基於深度學習的

三、模型

Embedding層
Bi_LSTM層
CRF層

四、融合詞典信息

N-Gram Feature

前後截取共8個截取段，每一個截取段用0/1標示是哪一類實體，故一個字有8*5=40的向量表示。

PIPE

先根據詞典用BDMM切詞，然後給每一個字一個標籤，表示其屬於哪一類實體。比如一共有5類實體，那麼對每個字，都有一個0/1/2/3/4/5的特徵。

PDET

在PIPE的基礎上，考慮了字在實體中的位置。

五、融合結構

這裏把提取後的特徵進行embedding較好

直接拼接
獨立加工

六、實驗結果

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

CS294-112: Introduction to Reinforcement Learning

文章目錄一、定義1、馬爾可夫決策過程2、部分馬爾可夫決策過程3、強化學習的目的4、簡化表示5、在意期望二、強化學習算法1、算法模塊總覽2、無模型、基於價值的算法3、有模型的算法三、Q函數與V函數1、Q函數2、V函數3、Q函數與V函

无聊的人生事无聊

2020-06-15 06:54:10

論文筆記：Simplify the Usage of Lexicon in Chinese NER Minlong

文章目錄一、摘要二、模型三、實驗結果一、摘要以前我們已經提到過一篇結合字典進行中文命名實體識別的文章《Chinese NER Using Lattice LSTM》. 這個方法能夠一定程度解決分詞錯誤。然而，這個方法有一個重要

无聊的人生事无聊

2020-06-15 06:54:10

CS294-112: Policy Gradients

文章目錄一、策略梯度法1、評估策略2、優化策略3、直觀理解4、高方差問題二、方差削減一、策略梯度法 1、評估策略在前面的學習中，我們已經瞭解到了，強化學習的目標是求解下式: θ∗=argmax⁡θEτ∼pθ(τ)[∑tr(st

无聊的人生事无聊

2020-06-15 06:54:10

自然語言處理名言

You shall know a word by the company it keeps ——J. R. Firth 1957: 11(開創現代統計NLP的核心思想)”

无聊的人生事无聊

2020-06-15 06:54:10

CS294-112: Supervised Learning of Behaviors

文章目錄一、從監督學習到決策二、模仿學習三、模仿學習的問題四、獎勵/代價函數參考文獻一、從監督學習到決策首先來看一個標準的監督學習的例子，給定一張圖片，然後通過CNN對其進行分類。但是，在強化學習的世界裏，重點是Agent

无聊的人生事无聊

2020-06-15 06:54:10

CS294-112:Introduction and Course overview

文章目錄一、課程內容二、什麼是深度強化學習三、真實世界中的決策需要解決什麼問題四、應該如何構建一個智能體參考資料一、課程內容從監督學習到決策強化學習中的無模型算法:Q-Learning，Policy Gradients,

无聊的人生事无聊

2020-06-15 06:54:10

可視化: Python—MatPlotLib—折線圖帶子圖

文章目錄圖示代碼圖示代碼 import matplotlib.pyplot as plt import numpy as np def plot_epoch_for_performance_and_loss(mode

无聊的人生事无聊

2020-06-15 06:54:10

論文筆記: Generating Knowledge Graph Paths from Textual Definitions using Sequence-to-Sequence Models

前言：這是一篇關於Text to Entity Mapping(以下簡稱TEM)的文章，也是筆者瞭解的第一篇關於該任務的文章，自己是抱着瞭解該任務的目的來的，因此只是很淺層的理解，也沒有摳細節。這篇文章是自然語言處理——知識圖

无聊的人生事无聊

2020-06-15 06:54:10

可視化: Python—MatPlotLib—多模型的ROC曲線

文章目錄示例代碼解釋示例代碼 from sklearn.metrics import roc_curve, auc import matplotlib as mpl import matplotlib.pyplot as

无聊的人生事无聊

2020-06-15 06:54:10

論文筆記：A Neural Multi-digraph Model for Chinese NER with Gazetteers

无聊的人生事无聊

2020-02-23 17:44:57

可視化: Python—MatPlotLib—CV常用對比圖繪製

无聊的人生事无聊

2020-02-23 17:44:57

論文筆記：Representation Learning of Knowledge Graphs with Entity Descriptions

无聊的人生事无聊

2019-10-27 04:31:25

論文筆記：Chinese NER Using Lattice LSTM Yue

无聊的人生事无聊

2019-10-26 05:43:17

論文筆記：Gazetteer-Enhanced Attentive Neural Networks for Named Entity Recognition

无聊的人生事无聊

2019-10-26 05:43:17

論文筆記：A Study of the Importance of External Knowledge in the Named Entity Recognition Task

无聊的人生事无聊

2019-10-26 05:43:17

24小時熱門文章

最新文章

最新評論文章