該篇筆記,主要是來自網絡的大雜燴,用於學習記錄之用,在此感謝各位博主,如有侵權,立馬刪除
一、緩存記錄一
來自於劉煥勇博主,文章地址:https://blog.csdn.net/lhy2014/article/details/82954509
他的github主頁:https://github.com/liuhuanyong,github項目主頁:https://liuhuanyong.github.io
1.語言資源構建
項目名稱 | 中文名稱 | 項目技術點 |
---|---|---|
SentimentWordExpansion | 情感詞擴展 | SOPMI |
BaikeInfoExtraction | 百科信息抽取 | Urllib,xpath |
SougouWordCollector | 搜狗詞庫自動構建 | Urllib,Scrapy |
LanguageResources | 語言資源 | 語言資源庫,語義庫,常用詞典 |
BaikeKnowledgeSchema | 百科知識體系構建 | Urllib,xpath,遞歸,知識庫本體概念 |
2.自然語言處理基本組件
項目名稱 | 中文名稱 | 項目技術點 |
---|---|---|
WordSegment | 分詞 | HMM, MAXCUT,Ngram |
HuanNLP | 自然語言處理組件 | HMM, maxent, CRF |
Pinyin2Chinese | 拼音轉文字 | Trie樹,HMM, bigram |
QueryCorrection | 查詢糾錯 | edit-distance |
ChineseCixing | 中文詞形查詢 | 字形,音形 |
ChineseAntiword | 中文反義詞查詢 | 反義詞 |
3.信息抽取
項目名稱 | 中文名稱 | 項目技術點 |
---|---|---|
WordMultiSenseDisambiguation | 中文多義詞詞義消歧 | 百科知識庫,詞義語義表示,詞義語義相似度計算 |
TextFeatureExtraction | 文本特徵提取 | IG,CHI ,DF,MI |
WordCollocation | 搭配抽取 | MI |
KeyInfoExtraction | 關鍵信息提取 | TFIDF,TextRank |
EventTriplesExtraction | 事件三元組提取 | dependency parser |
項目名稱 | 中文名稱 | 項目技術點 |
---|---|---|
PersonRelationKnowledgeGraph | 中文人物關係圖譜 | bootstrapping, 遠程監督, 訓練數據回標, 關係抽取 |
CrimeKgAssitant | 法律罪行智能助手 | 知識圖譜, 智能預判, 自動問答 |
QASystemOnKG | 醫療知識圖譜與自動問答 | 知識圖譜構建及自動問答 |
ComplexEventExtraction | 複合事件圖譜 | 複合事件,條件事件、反轉事件抽取 |
CausalityEventExtraction | 因果事件圖譜 | 因果圖譜,因果事件抽取 |
SequentialEventExtration | 順承事件圖譜 | 動賓短語提取,事件圖譜 |
LanguageKnowledgeGraph | 語言政策知識圖譜 | Neo4j,Echarts,D3js |
HyponymyExtraction | 上下位關係圖譜 | 模式匹配,上下位概念表示 |
MusicLyricChatbot | 歌詞對對碰 | es搜索,歌詞知識庫 |
4.文本挖掘與社會計算
項目名稱 | 中文名稱 | 項目技術點 |
---|---|---|
WeiboIndexSpyder | 微博指數採集 | selenium,xpath |
BaiduIndexSpyder | 百度指數採集 | xpath,selenium |
AliIndexSpyder | 阿里指數採集 | selenium,xpath |
DocSentimentAnalysis | 基於句法依存的情感分析 | Template, Dependencyparser |
LearningBasedSentiment | 基於深度學習的情感分析 | CNN,RNN,ML |
TextGrapher | 文本結構化圖譜表示 | EventExtraction,知識表示 |
ImportantEventExtractor | 文本重要性計算 | textrank |
ZhuguanDetection | 文本主觀性計算 | subjective knowledge base |
SentenceSimilarity | 句子相似度計算 | distance, hash, haiming ,eidtdistance |
TopicCluster | 文本話題聚類 | LDA,Kmeans |
EventMonitor | 特定事件追蹤 | 新聞採集,事件監測架構,scrapy |
PoemMining | 中國古代詩詞挖掘 | 語料庫構建,文本挖掘 |
LawCrimeMining | 司法文本挖掘 | 語料庫構建,文本挖掘 |
HumorMining | 幽默計算 | 語料庫構建,文本挖掘 |
LanguagePlatform | 集成自然語言處理技術的語言平臺 | Neo4j,Echarts,Django |
5.深度學習與語義表示
項目名稱 | 中文名稱 | 項目技術點 |
---|---|---|
ChineseTextualInference | 中文文本蘊含/推理 | Textual entailment, keras, 文本分類 |
SiameseSentenceSimilarity | siamese相似問句匹配 | siamese lstm network, keras, 文本分類 |
MedicalNamedEntityRecognition | 中文電子病例命名實體識別 | keras, bi-lstm-crf |
ChineseEmbedding | 中文向量大全(字符向量、詞向量、拼音向量、依存向量、詞性向量) | SKIP-GRAM,Co-Matrix |
Word2Vector | 詞向量表示 | CBOW, SKIP-GRAM,Co-Matrix |
Sentence2Vector | 句子向量表示 | CBOW |
Seq2SeqTranslation | 端到端的翻譯模型 | keras, lstm |
6.其他
@@1.醫藥領域知識圖譜快速及醫藥問答項目:
原文:https://blog.csdn.net/lhy2014/article/details/82953792
github地址:https://github.com/liuhuanyong/QASystemOnMedicalKG
@@2.中國古代詩詞文本挖掘項目:
原文:https://blog.csdn.net/lhy2014/article/details/82956612
github地址:https://github.com/liuhuanyong/PoemMining
@@3.基於法律罪行知識圖譜的智能預判與客服問答:
原文:https://blog.csdn.net/lhy2014/article/details/83962640
github地址:https://github.com/liuhuanyong/CrimeKgAssitant
@@4.中文電子病例命名實體識別項目
原文:https://blog.csdn.net/lhy2014/article/details/84582145
github地址:https://github.com/liuhuanyong/MedicalNamedEntityRecognition
@@5.中文現代詩歌創作項目
原文:https://blog.csdn.net/lhy2014/article/details/85227231
github地址:https://github.com/liuhuanyong/PersonalModernPoems
@@6. 啊哈自然語言處理包
https://gitee.com/chinahuik/AHANLP
--------------------------------------------------待完善