鏈接:[ 全文章目錄 ]
零、開始的話
首先要說聲對不起,咕咕咕了這麼久也沒更新python的相關內容。爲什麼不繼續更新了呢,主要有幾點原因。
- 對於非程序員學習編程來說,爬蟲不一定常用(而且很容易違法)。而且前面的基本用法捋清了就可以開始根據自己的實際興趣做軟件,遇到不會的可以百度。如果確實想深入學習轉行程序員的話,反而不是很推薦python作爲第一門編程語言,更推薦學java,除非專門做爬蟲、機器學習等。
- 如果是有編程基礎的同學想深入學習python,更推薦去看視頻教程(b站上就有),跟着教程自己也敲一遍。
- 審覈不通過,有幾篇都被ban了。
爲什麼前面會更新一些python教程,主要是爲了NLP(自然語言處理)這個系列的開始,本系列將會以儘量簡單的語言來講解NLP是什麼,怎麼做。
一、NLP是什麼
(一)NLP=NLU+NLG
NLP(Natural Language Processing):自然語言處理。
NLU(Natural Language Understanding):自然語言理解,從 語音/文本—>意思 。
NLG(Natural Language Generation):自然語言生成,從 意思—>語音/文本 。
(二)NLP的困難
1. 多種表達方式
例子:“這篇博客是我寫的” 和 “我寫了這篇博客”
2. 一次多義
例子:“我今天看了蘋果的發佈會” 和 “我吃了一個蘋果”
解決方法:根據上下文
(三)經典應用場景
1. 問答系統
2. 情感分析
3. 機器翻譯
4. 提取文本摘要
5. 聊天機器人
6. 信息抽取
(四)NLP技術的四個維度
1. 聲音(一般不考慮)
2. 單詞(分詞、NEG、詞性分析等)
3. 句子結構(句法分析、依存分析等)
4. 語義(NLU等)