第13期-在線的文章摘要生成器, 自己寫了一個支持中文的

大家可能還記得我寫的第12期-在線的文章摘要生成器,使用NLP生成簡介

在那篇文章裏我們介紹了一款通過NLP分析文章,自動生成摘要的一個小工具。

當時我就說這個玩意,還是很實用的,於是就上手自己擼了一個支持中文生成文章摘要的生成器。訪問地址http://zhaiyao.xiezuoguan.cn/
在這裏插入圖片描述
效果還可以,我找一篇騰訊網的新聞報道來給大家試驗一下,報道爲《無聊催生的一次狂歡:雲蹦迪、雲睡覺,虛火一場?》

經過我們的自動生成器,將內容概括如下

博主“誰家的圓三”也意外掀起了一場互聯網的狂歡,帶起睡覺直播的風潮,人氣最旺的一晚,一共有1850萬用
戶圍觀他睡覺。

1月9日開始,每天5小時,連續三天“雲蹦迪”直播後,北京知名夜店ONE
THIRD在抖音賺到了332.36萬打賞,單日超過100萬元,直播首日收看人數就已破百萬。博主“誰家的圓三”也意外掀起了一場互聯網的狂歡,帶起睡覺直播的風潮,人氣最旺的一晚,一共有1850萬用戶圍觀他睡覺。

在這裏插入圖片描述
從我個人的使用效果來看,效果並非完全令人滿意,最好還是有人爲介入來二次加工一下。二是現在文字閱讀內容質量堪憂,自從自媒體開始興起,每天網上產生的都是大量的文字垃圾,大部分人更是失去了對於1000字長文以上的閱讀能力。篇篇都是幾百字的小文章根本沒什麼好辦法生成120字內的摘要概括啊。

另一方面流量也越來越便宜,人們的文字閱讀興趣更是被圖片和短視頻瓜分掉了。我自己試用這個工具時,去騰訊網上翻了很多篇新聞,結果三分之一是以圖片爲主,圖片中有零散文字(確實排版會更精美,信息量也足夠),另外三分之一都是不超過1000字的短篇。剩下的三分之一里面,還被視頻給佔據了一部分,只有極少數的文章能寫到1000字以上用這個工具來好好概括了。

技術方案

難度係數 ⭐
我這邊是用python寫的,參考了網上的一些方案。部署時本來打算探索一下新東西用一下騰訊雲的雲函數和api網關,結果折騰了半天好麻煩啊,最終還是部署在了服務器裏。
前端我不擅長,做的特別醜,能用就行吧。

我們可以怎麼做:

上次提到的,Chrome插件這個需求還可以做。

另外我還發現,如果以後大家傾向於視頻內容,不如做一個能夠支持視頻自動摘要的工具。但是這個就很難了,隨口一說,短期內應該還是人力才能解決的工作。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章