原创 自然語言處理—閱讀理解

文章目錄一、任務定義二、數據集三、評價指標3.1 檢索類3.2 生成類3.2.1 詞重疊評價指標3.2.2 詞向量評價指標3.3 基於學習的評價指標3.4 人工評測四、相關文章五、參考 一、任務定義 閱讀理解任務根據答案類型,可以

原创 科學和藝術

今天翻開博士導師給的一份資料,之所以稱其爲資料,是因爲我也不知道其是一本書還是一篇論文,竟是有點慚愧。資料名爲《The Lost Combinator》。這是一份關於自然語言理解的資料,其似乎旨在將自然語言中的【parsing】,

原创 可視化: Python—MatPlotLib—多模型的ROC曲線

文章目錄示例代碼解釋 示例 代碼 from sklearn.metrics import roc_curve, auc import matplotlib as mpl import matplotlib.pyplot as

原创 自然語言處理:文本相似性衡量

文章目錄TF-IDF TF-IDF 理論:TF-IDF與餘弦相似性的應用 實踐: 使用不同的方法計算TF-IDF值 實踐:結果持久化

原创 自然語言處理—語義分析

文章目錄一、任務定義二、數據集三、評價指標四、相關文章參考資料 一、任務定義 語義分析旨在將自然語言(NL)映射爲機器可解釋語言。 此要求模型對語言本身、場景都着深度理解,並且具備一定的推理能力。目前來看,該任務可以說是極具挑戰

原创 論文筆記:A Neural Multi-digraph Model for Chinese NER with Gazetteers

文章目錄一、摘要二、簡介三、模型1、構圖2、加工四、實驗結果 一、摘要 文章提出了一種基於圖神經網絡並結合多種詞典的命名實體識別方法,主要的新意是讓模型自動去學習詞典的特徵,而不是像《Incorporating dictionar

原创 可視化: Python—MatPlotLib—CV常用對比圖繪製

文章目錄樣例代碼:解釋 樣例 代碼: plt.figure(figsize=(10, 2)) plt.subplots_adjust(bottom=0, left=.01, right=.99, top=.90, hspace=

原创 自然語言處理——知識圖譜——表示學習

文章目錄一、任務定義二、數據集三、評測方法四、相關論文 一、任務定義 Representation learning (RL) of knowledge graphs aims to project both entities

原创 論文筆記:Representation Learning of Knowledge Graphs with Entity Descriptions

文章目錄一、摘要二、簡介三、方法詞袋模型編碼器CNN編碼器四、實驗結果 一、摘要 文章提出了一種結合【實體外部描述】和【三元組】的知識圖譜表示學習方法。在【知識圖譜補全】和【實體分類】兩個任務上取得了很大的提升。並且很重要的一點是

原创 論文筆記:Chinese NER Using Lattice LSTM Yue

文章目錄摘要一、簡介二、模型2.1 基於字的模型2.2 基於詞的模型2.3 Lattice Model三、實驗結果指導性結論 摘要 文章提出了一種將【字】和所有【潛在詞組】作爲輸入的模型。其有以下優勢: 對於基於字的方法:模型利

原创 自然語言處理——信息抽取——命名實體識別

文章目錄一、任務定義二、數據集三、評測方法四、相關工作 一、任務定義 命名實體識別(NER)是指識別文本中具有特定意義的實體。比如以下句子 喬布斯離開了蘋果 NER系統應該能夠識別出【喬布斯】和【蘋果】兩個實體,並標記【喬布斯

原创 論文筆記:Gazetteer-Enhanced Attentive Neural Networks for Named Entity Recognition

文章目錄摘要一、模型二、結果三、疑惑 摘要 文章設計了一種利用外部詞典加強命名實體識別的方法,整個模型大致分爲【Inner-Region Encoder】、【Attentive Context Encoder】、【Utteranc

原创 論文筆記:A Survey on Deep Learning for Named Entity Recognition

前言: 因爲實習接觸到了命名實體識別的問題,因此打算調研一下相關方法。即有了這篇綜述的論文《A Survey on Deep Learning for Named Entity Recognition》的閱讀筆記。 除此以外:一個

原创 論文筆記:Incorporating dictionaries into deep neural networks for the Chinese clinical NER

文章目錄摘要一、簡介二、相關工作三、模型四、融合詞典信息N-Gram FeaturePIPEPDET五、融合結構六、實驗結果 摘要 融合了字典到深度神經網絡中,解決了一些稀有實體不能被識別的問題。 一、簡介 對每個中文字符,基於字

原创 論文筆記:A Study of the Importance of External Knowledge in the Named Entity Recognition Task

文章目錄摘要一、簡介二、知識分類2.1 Knowledge Agnostic(A)2.2 Name-Based Knowledge (Name)2.3 Knowledge-Base-Based Knowledge (KB)2.4