緩存筆記:關於NLP的一些項目

該篇筆記,主要是來自網絡的大雜燴,用於學習記錄之用,在此感謝各位博主,如有侵權,立馬刪除

一、緩存記錄一

來自於劉煥勇博主,文章地址:https://blog.csdn.net/lhy2014/article/details/82954509

他的github主頁:https://github.com/liuhuanyong,github項目主頁:https://liuhuanyong.github.io

1.語言資源構建

項目名稱 中文名稱 項目技術點
SentimentWordExpansion 情感詞擴展 SOPMI
BaikeInfoExtraction 百科信息抽取 Urllib,xpath
SougouWordCollector 搜狗詞庫自動構建 Urllib,Scrapy
LanguageResources 語言資源 語言資源庫,語義庫,常用詞典
BaikeKnowledgeSchema 百科知識體系構建 Urllib,xpath,遞歸,知識庫本體概念

2.自然語言處理基本組件

項目名稱 中文名稱 項目技術點
WordSegment 分詞 HMM, MAXCUT,Ngram
HuanNLP 自然語言處理組件 HMM, maxent, CRF
Pinyin2Chinese 拼音轉文字 Trie樹,HMM, bigram
QueryCorrection 查詢糾錯 edit-distance
ChineseCixing 中文詞形查詢 字形,音形
ChineseAntiword 中文反義詞查詢 反義詞

3.信息抽取

項目名稱 中文名稱 項目技術點
WordMultiSenseDisambiguation 中文多義詞詞義消歧 百科知識庫,詞義語義表示,詞義語義相似度計算
TextFeatureExtraction 文本特徵提取 IG,CHI ,DF,MI
WordCollocation 搭配抽取 MI
KeyInfoExtraction 關鍵信息提取 TFIDF,TextRank
EventTriplesExtraction 事件三元組提取 dependency parser
知識圖譜與事理圖譜
項目名稱 中文名稱 項目技術點
PersonRelationKnowledgeGraph 中文人物關係圖譜 bootstrapping, 遠程監督, 訓練數據回標, 關係抽取
CrimeKgAssitant 法律罪行智能助手 知識圖譜, 智能預判, 自動問答
QASystemOnKG 醫療知識圖譜與自動問答 知識圖譜構建及自動問答
ComplexEventExtraction 複合事件圖譜 複合事件,條件事件、反轉事件抽取
CausalityEventExtraction 因果事件圖譜 因果圖譜,因果事件抽取
SequentialEventExtration 順承事件圖譜 動賓短語提取,事件圖譜
LanguageKnowledgeGraph 語言政策知識圖譜 Neo4j,Echarts,D3js
HyponymyExtraction 上下位關係圖譜 模式匹配,上下位概念表示
MusicLyricChatbot 歌詞對對碰 es搜索,歌詞知識庫

4.文本挖掘與社會計算

項目名稱 中文名稱 項目技術點
WeiboIndexSpyder 微博指數採集 selenium,xpath
BaiduIndexSpyder 百度指數採集 xpath,selenium
AliIndexSpyder 阿里指數採集 selenium,xpath
DocSentimentAnalysis 基於句法依存的情感分析 Template, Dependencyparser
LearningBasedSentiment 基於深度學習的情感分析 CNN,RNN,ML
TextGrapher 文本結構化圖譜表示 EventExtraction,知識表示
ImportantEventExtractor 文本重要性計算 textrank
ZhuguanDetection 文本主觀性計算 subjective knowledge base
SentenceSimilarity 句子相似度計算 distance, hash, haiming ,eidtdistance
TopicCluster 文本話題聚類 LDA,Kmeans
EventMonitor 特定事件追蹤 新聞採集,事件監測架構,scrapy
PoemMining 中國古代詩詞挖掘 語料庫構建,文本挖掘
LawCrimeMining 司法文本挖掘 語料庫構建,文本挖掘
HumorMining 幽默計算 語料庫構建,文本挖掘
LanguagePlatform 集成自然語言處理技術的語言平臺 Neo4j,Echarts,Django

5.深度學習與語義表示

項目名稱 中文名稱 項目技術點
ChineseTextualInference 中文文本蘊含/推理 Textual entailment, keras, 文本分類
SiameseSentenceSimilarity siamese相似問句匹配 siamese lstm network, keras, 文本分類
MedicalNamedEntityRecognition 中文電子病例命名實體識別 keras, bi-lstm-crf
ChineseEmbedding 中文向量大全(字符向量、詞向量、拼音向量、依存向量、詞性向量) SKIP-GRAM,Co-Matrix
Word2Vector 詞向量表示 CBOW, SKIP-GRAM,Co-Matrix
Sentence2Vector 句子向量表示 CBOW
Seq2SeqTranslation 端到端的翻譯模型 keras, lstm

6.其他

@@1.醫藥領域知識圖譜快速及醫藥問答項目:
原文:https://blog.csdn.net/lhy2014/article/details/82953792
github地址:https://github.com/liuhuanyong/QASystemOnMedicalKG

@@2.中國古代詩詞文本挖掘項目:
原文:https://blog.csdn.net/lhy2014/article/details/82956612
github地址:https://github.com/liuhuanyong/PoemMining

@@3.基於法律罪行知識圖譜的智能預判與客服問答:
原文:https://blog.csdn.net/lhy2014/article/details/83962640
github地址:https://github.com/liuhuanyong/CrimeKgAssitant

@@4.中文電子病例命名實體識別項目
原文:https://blog.csdn.net/lhy2014/article/details/84582145
github地址:https://github.com/liuhuanyong/MedicalNamedEntityRecognition

@@5.中文現代詩歌創作項目
原文:https://blog.csdn.net/lhy2014/article/details/85227231
github地址:https://github.com/liuhuanyong/PersonalModernPoems

@@6. 啊哈自然語言處理包
https://gitee.com/chinahuik/AHANLP

--------------------------------------------------待完善

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章