python實現文本翻譯

在很多數據處理的時候,我們可能會面臨一個問題-多語言的文本數據,比如我最近做的一個評論數據分析,我們發現這個數據有多種語言形式,這個時候我們需要對它進行統一化,方面後面的進行,不然可能會面臨多語言分情況分析(比如做情感分析的時候,語言不同,它所使用的模型也不同),所以這篇博客也是爲了那個問題解決所介紹的。
下面我主要介紹幾種方法:

1.translate

用法很簡單,它的功能也就是翻譯的功能,下面我看幾個實例:

from translate import Translator
translator= Translator(to_lang="chinese")#指定要翻譯成的語言
translation = translator.translate("Good night!")
print(translation)

運行結果是:

晚安!

還可以對不同兩種語言直接進行切換:

translator= Translator(from_lang="chinese",to_lang="english")
translation = translator.translate("這是一隻鉛筆!")
print(translation)

運行結果是:

This is a pencil!

我們可以試試稍微複雜點的句子:

translator= Translator(from_lang="chinese",to_lang="english")
translation = translator.translate("哇謝謝您的超讚好評 您提到的問題我們會努力改進 期待再來喲")
print(translation)

運行結果是:

Wow, thank you for your praise, the questions you mentioned, we will work hard to improve and look forward to seeing you again.

個人覺得翻譯還是可以的。

translator= Translator(to_lang="chinese")
translation = translator.translate("Niko was very welcoming, and very easy to communicate. I had a cold when I arrived, she cooked porridge for me. The place is close to metro station, a really good value!")
print (translation)

運行結果是:

Niko非常熱情,也很容易溝通。我到達時感冒了,她爲我煮了粥。這個地方靠近地鐵站,非常物有所值!

而且它能夠識別英文名字,然後內容也大體翻譯的還行。
這裏我就介紹到這裏,最後補充一點關於那個翻譯語言參數可以設爲簡寫,比如中文’zh’,這個大家自己下去查閱就行了。大多數我們也只用到這個功能。

2.Googletrans庫(谷歌翻譯)

由於谷歌不能直接訪問可能還需要代理等,想了解的話可以看這篇博客。但它的功能相對更強大一些。

3.百度翻譯

這個首先我們需要去百度翻譯平臺註冊並填寫申請,最後得到一個密鑰相關,有興趣的話可以去了解一下。具體用法類似我之前寫的一篇博客,可以參考一下。

4.有道翻譯

這個和百度類似,都可以對接python實現,具體我也沒用過,大家可以自己去了解,
最後可以看看這篇博客關於翻譯API的使用。
我們平時選用一種就可以了,看大家選擇,後兩種效率更高一些,但存在一定的收費功能。但對於大家而言都夠用了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章