AI也能寫高考作文?我們用清華剛剛開源的「九歌」試了試

雲棲號資訊:【點擊查看更多行業資訊
在這裏您可以找到不同行業的第一手的上雲資訊,還在等什麼,快來!

今天是高考第一天,我猜,你一定在看全國各地那些奇奇怪怪的高考作文題,還要糾結一下:

這題目,該怎麼寫?

那,寫不出來不如扔給AI,看看能生成什麼文章?

正好,最近清華的AI寫詩模型「九歌」開源了,給它一個關鍵詞,它就能立即賦詩一首。

雖然大部分考卷都規定了“詩歌除外”,但我們偏要拿它來試一試。

AI的高考作文

「九歌」可以生成絕句、律詩、藏頭詩、詞等多種詩詞,在Demo網站裏,只要輸入關鍵詞,就可以自動生成。

那我們就把各地的作文題目當做關鍵詞放進去試試。且看各地考卷在AI筆下會變成什麼樣?

天津卷“中國面孔”

“中國面孔”是全球熱播紀錄片裏充滿家國情懷的杜甫,是用中醫藥造福人類榮獲諾貝爾獎的屠呦呦,是醫務工作者厚重防護服下疲憊的笑臉,是快遞小哥在寂靜街巷裏傳送溫暖的雙手……也是用各種方式共同形塑“中國面孔”的你和我。

走過2020年的春天,你對“中國面孔”又有什麼新的思考和感悟?請寫一篇文章。

先來一首七言絕句:

image

能看出是一首有民族自豪感的詩,雖然開頭的“平生面面”讓人有點看不懂,但後兩句“四海共推周典禮,百年誰識漢文高”看起來對仗工整的兩句詩。

再來一首《憶江南·中國面孔》:

image

這首詞就和前面完全不一樣了,整體都喪喪的,開頭就是中原國破,山河不再的淒涼感,後面還有一個回不去的老頭子。

咦,有種熟悉的感覺,彷彿在洗稿陸游的《示兒》:

死去元知萬事空,
但悲不見九州同。
王師北定中原日,
家祭無忘告乃翁。

北京卷作文題1:北斗衛星相關

2020年6月23日,北斗三號最後一顆衛星成功發射,整個系統55個衛星織成一張“天網”每一顆都有自己的功用。以材料“每一顆都有自己的功用”爲話題,自選角度,自擬題目,寫一篇議論文。

嗯,題目是「北斗衛星」,我們試一下:

image

生成又是感嘆時光易逝、歲月變遷的詩,一點都不正能量。

不知道詩中的情感這麼喪,會不會被判卷老師打低分?

但寫首藏頭詩效果就好得多了:

image

「夜月」、「夕陽」、「草木」……看起來是是在描述自然景觀,可是開頭代表戰爭的「旌旗」暴露了一切。

嗯,背後的AI一定是一個鷹派的詩人。

寫詞的效果,也有些類似,比如這篇《如夢令·北斗》:

image

怎麼一說「北斗」,就全是星星月亮的啊?

北京卷作文題2:一條信息
當今時代,我們每天都會面對各種各樣的信息。其中有一條信息,或引發了你的感悟,或影響了你的生活,或令人振奮,或使你愧疚,或讓你學會辨別真僞……請以“一條信息”爲題,聯繫現實生活,展開聯想或想象,寫一篇記敘文。要求:思想健康;內容充實,有細節描寫;語言流暢,書寫清晰。

請以“一條信息”爲題,寫一篇記敘文。字數仍要求不少於700字。

寫一首七言絕句:

image

真是佛系的詩,簡直是“信息人間造成的一百種焦慮的消除方法”,勸你不要在網上跟人吵架,自己玩自己的吧?

全國II卷:“攜手同一世界,青年共創未來”主題演講
墨子說:“視人之國,若視其國;視人之家,若視其家;視人之身,若視其身。”英國詩人約翰·多恩說:“沒有人是自成一體、與世隔絕的孤島,每一個人都是廣袤大陸的一部分。”

“青山一道同雲雨,明月何曾是兩鄉。”“同氣連枝,共盼春來。”……2020年的春天,這些寄言印在國際社會援助中國的物資上,表達了世界人民對中國的支持。

“山和山不相遇,人和人要相逢。”“消失吧,黑夜!黎明時我們將獲勝!”……這些話語印在中國援助其他國家的物資上,寄託着中國人民對世界的祝福。

“世界青年與社會發展論壇”邀請你作爲中國青年代表參會,發表以“攜手同一世界,青年共創未來”爲主題的中文演講。請完成一篇演講稿。

image

我只輸入了“攜手同一世界,青年共創未來”這個主題,難道AI自動讀出了要代表中國青年參加世界大會的意思?全篇都是場面話,又是「仙」,又是「賢」的,如果是根據訓練模型的數據集來的,那看來古人寫詩也是充滿了彩虹屁。

全國三卷:自畫像

人們用眼睛看他人、看世界,卻無法直接看到完整的自己。所以,在人生的旅程中,我們需要尋找各種“鏡子”、不斷繪製“自畫像”來審視自我,嘗試回答“我是怎樣的人”“我想過怎樣的生活”“我能做些什麼”“如何生活得更有意義”等重要的問題。

畢業前,學校請你給即將入學的高一新生寫一封信,主題是“如何爲自己畫好像”,與他們分享自己的感悟與思考。

image

注意第三句,不是「掉髮」,不是「掉髮」,不是「掉髮」。

什麼是九歌

九歌是清華自然語言處理與社會人文計算實驗室(THUNLP)研發的自動詩歌生成系統,基於超過一千多年來80萬首中國古詩進行訓練學習。

該團隊由清華孫茂松教授帶領,多位博士、碩士、本科生參與開發。

image

九歌系統最早可以追溯到2017年,當年還登上了央視挑戰類節目《機智過人》,與人類同臺比拼詩詞創作,讓在場觀衆都難辨AI與人類。

經過這些年的發展終於在7月2日,清華九歌團隊宣佈將古詩寫作模型MixPoet開源。

AI發展到今天,NLP模型來寫文章已經不稀奇了。和其他模型相比,九歌多了些人文氣息。

如果告訴它以“明月”爲題來賦詩一首,那麼九歌能寫出幾首不重樣,而且每一首都帶有不同的感情色彩。

image

如果說其他的AI詩歌生成器是“強行”擬合語料庫,那麼九歌可以說是熟讀《聲律啓蒙》,掌握古詩詞基本規則,而非一通亂扯。

最近,我們從團隊公開的數據集也可看出他們的細緻用心,可以說九歌是站在人文和AI的十字路口。

九歌依靠四大數據集保證了AI能夠學習到人類作詩的基本法則。

image

首先是學習古代著名詩人的句法。

CCPC是中國古典詩歌語料庫,收納了從隋朝到明朝的所有古詩,每首詩都附帶作者姓名、朝代、標題以及自動提取的關鍵詞。

比如:

{“dynasty”: “Tang”, “author”: “杜牧”, “content”: “李白題詩水西寺|古木回巖樓閣風|半醒半醉遊三日|紅白花開山雨中”, “title”: “念昔遊三首 其三”, “keywords”: “題詩 花開 樓閣 山雨”}
其次是學習詩歌的聲律。

CRRD是古詩音律數據集,將漢字按照古代的平仄聲進行分類。古詩不僅要押韻,也要符合平仄規律。例如詩的第一句是「仄仄平平仄」,那麼第二句就應該是「平平仄仄平」。

image

然後是學習詩歌中表達的情感,給AI加上一點人文氣息。

FSPC是細膩情感詩歌語料庫,將每首詩、每行註釋都分爲5類情感,即否定、隱含否定、中性、隱含肯定和肯定。

詩歌寫得好不好,最終還需要人類判定。

PQED是手動註釋的詩歌質量數據集,按照以下四個標準對詩歌評分,每項得分爲1到5分:

image

給文科生一個報考清華的理由

你覺得,如果李白杜甫白居易們的作詩水平是滿分10分,九歌的作詩水平能打幾分?

「九歌」雖然只是一個實驗研究性項目,但其實,背後的自然語言處理(NLP)技術,纔是大有用途的AI領域。

你可以「調戲」的小愛同學、Siri、天貓精靈們,需要NLP技術支撐,才能聽懂人類的語言;

手機輸入法里長按空格鍵就可以實現的語音輸入功能,也要靠NLP技術,才能準確的呈現你想要說的句子;

無論是在百度還是在淘寶,要靠NLP技術拆解你輸入的文字,才能搜索出你需要的資料或商品;

還有谷歌翻譯、翻譯筆、微信聊天中的自動翻譯,背後都要依靠NLP技術;

……

人類和語言相關的工作,都可以自動完成。

而這些技術的開拓,並非只靠程序員寫代碼、跑數據、調參數就可以完成,同樣需要語言文學方面的專家支持。

(準備)學中文的朋友們,你們以後可能不只能夠當人類學生們的語文老師了,說不定畢業後就可以進入NLP方面的實驗室,當AI的語文老師。

雖說「文科選北大,理科選清華」,九歌也是給文科生報考清華找到了一個理由吧。

最後祝願所有考生高考順利!

image

傳送門
論文鏈接:
https://arxiv.org/pdf/2003.06094.pdf

代碼鏈接:
https://github.com/THUNLP-AIPoet/MixPoet

參考鏈接:
https://mp.weixin.qq.com/s/uw7uDV94z3iQsn1v_NKiYw
http://nlp.csai.tsinghua.edu.cn/news/九歌多樣化古典詩歌機器寫作模型mixpoet開源/

【雲棲號在線課堂】每天都有產品技術專家分享!
課程地址:https://yqh.aliyun.com/live

立即加入社羣,與專家面對面,及時瞭解課程最新動態!
【雲棲號在線課堂 社羣】https://c.tb.cn/F3.Z8gvnK

原文發佈時間:2020-07-09
本文作者:曉查
本文來自:“量子位”,瞭解相關信息可以關注“量子位

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章