Wordle是優秀的信息可視化嗎?如何真正使用Wordle?

《數據可視化之美》(Beautiful Visualization)

Wordle是優秀的信息可視化嗎?

如果你認爲Wordle 是嚴格意義上的信息可視化工具,它在設計的某些方面存在誤導或者干擾用戶的潛在可能,有必要指出並加以批判。以下是我認爲Wordle 存在的不足之處。

單詞大小調整太初級

Wordle 在計算其字體大小時,並沒有考慮單詞的長度,或者它所繪製的文字的字形。其結果是,給定使用次數相同的兩個單詞,包含的字母越多的單詞在屏幕上會佔用更多的空間,這可能會給讀者帶來這樣的印象:單詞越長,其出現頻度越高。

此外,據我所知,在關於單詞大小和感知上的相對權重的關係上沒有任何研究。更糟糕的是,常見的策略是把單詞的權值根據其平方根進行縮放(爲了體現單詞擁有區域而不僅僅是長度這一事實),這隻會使Wordle 顯得很無聊。

顏色毫無意義

在你的電腦屏幕的中央提供了最寶貴的幾個維度,令人吃驚的是,Wordle 在顏色使用上非常“散漫”。在Wordle 中,顏色是毫無意義的;它僅僅是用來提高單詞邊界的對比度和增加一些美感。

顏色可以用於對各個維度進行編碼,如聚集(意味着這些單詞通常是一起使用的)或者統計學意義(如圖3-19 中的總統就職演說的單詞雲)。Wordle 還可以使用顏色在同一空間表示兩種或者更多不同的文本。

值得一提的是,Wordle 並沒有爲色盲的讀者做出什麼特意安排,雖然人們總是可以通過應用小程序的色彩菜單欄創建一個定製的調色板。

3-19
圖3-19 :這個演講使用了很多“Government ”(政府)這個詞,但是在其他演講中該詞用得更多;“pleasing ”(愉快)只被用了幾次,但是它在語料庫中是一個不尋常的單詞;“people”(人民)被用了很多,其頻率在該演講中非同尋常。

字體是使人充滿遐想的

Wordle 的很多字體都更傾向於美學和表現力,而不是可讀性。這麼做的原因一部分是因爲Wordle 的Web 站點設計——如果缺乏形式多樣的字體,畫面將是單調的。最重要的是,Wordle 中的字體必須看起來很優美,這意味着它不一定很適合於正文文本。

對於易讀性至關重要的應用,Wordle 提供了Ray Larabie 的Expressway 字體,該字體被美國運輸部作爲標準字母。

字數計數不夠具體

Wordle 對《New Testament 》中的每一卷的頁面中出現的“Lord ”(上帝)這個單詞的次數進行了求和,但是它沒有提供任何關於各個章節的區別的信息。僅僅簡單地對單詞計數並不能對相似的文本做出有意義的比較。比如有一個博客帖子,突出該帖子和該博客的其他帖子的不同之處,或者說明它和其他博客的在同一主題上的區別,甚至是說明該帖子和新聞報道文章的用語的不同,這些方面的說明可能是最具有啓迪性的。

存在很多統計學方法,可以應用於一篇“樣本”文章,來基於一些“範文”的正文來抽取“樣本”中的特定字符,尤其注意一些單詞的使用在統計上是更重要的。除了單詞出現頻度,還可以對單詞權重進行更細緻深入地探析,然後應用Wordle 佈局算法來展示結果。

在分析每個總統就職演說時,我都探索了這個想法,把每個演說都和當時最接近的5個演講、10 個最接近的演講以及所有其他的就職演說進行了比較。這種分析的優點是可以揭示一些不可預見的單詞。舉個例子,圖3-20 是哈里·杜魯門在1948 年的就職演說的可視化。左側是該就職演說中使用的單詞的Wordle 形式的展現,右側是他那個時代的其他總統所使用次數更多的單詞的展現。該可視化展現說明了杜魯門的演說強調的是對外政策。

3-20
圖3-20 :哈里·杜魯門在1948 年的總統就職演說:和他同時代的其他總統就職演說相比,杜魯門的演說當中很明顯缺乏那些紅色標註的單詞。

如何真正使用Wordle?

Wordle 不是爲可視化專家、文本分析專家甚至是有經驗的計算機用戶而設計的。我試着把Wordle 做得儘可能像個工具。

在撰寫本章時,人們在Wordle 畫廊中已經創造、保存了超過140 萬的“單詞雲”。這些單詞雲被用於:總結和修飾商務演示和博士論文,插圖說明新的文章和電視新聞報道,提煉和抽象受害者個人痛苦的回憶。Wrodle 還發現形形色色的充滿熱情的教師社區,他們使用Wordle 來展示拼寫列表、總結話題以及促使不識字的青年參與到享受文本的樂趣中。

如表3-1 的調查結果表明(Viégas、Wattenberg 和Feinberg,2009 ),使用Wordle 激發了人們的創造力,人們會覺得他們正在做創造性的事情。

表3-1 :人們創造Wordle時的感受  

感受 贊成% 中立% 不贊成%
激發我的創造力 88 9 4
我感到一種情緒反應 66 22 12
從文本中我學到了一些新的知識 63 24 13
它證實了我對文本的理解 57 33 10
它勾起了我的回憶 50 35 15
Wordle 使我感到困惑 5 9 86

因此,通過對可視化效能應用傳統的學術評估——“從文本中我學到了一些新的知識”——至少可以認爲Wordle 是比較成功的。但是Wordle 真正閃光之處在於其交際作品的創作。使用Wordle 的人們感覺他們似乎創造了一些東西,它成功地表示一些有意義的事物,並準確地反映或增強了源文本。這種意義看起來主要是直觀的,因爲很多人並沒有意識到單詞大小和單詞頻度是相關的(相反地,猜測該大小表示“情感重視”甚至是“單詞意義”)。

Wordle 的特性緣於文本的特性。只是簡單地把一個單詞放到屏幕上,其字體要麼對單詞本身的涵義進行補充,要麼對其進行反襯,可以馬上使讀者產生共鳴(實際上,在公共畫廊上保存了成千上萬的單詞)。當你把兩個或者更多的單詞並排展示時,一個有文化的人就會自然而然地去理解該序列化單詞。Wordle 對單詞的隨機組合給人們創造了喜悅、驚喜、某種程度的認可,以及如詩般激發了人們的洞察力。

爲傳統的信息可視化使用Wordle

Wordle 的信息可視化分析用途當然可以爲專業用戶所用,更不用說Wordle 所具備的特定的情感和交際特性。爲了滿足那些使用Wordle 給“加權文本”創建可視化的用戶,其權重不一定是基於單詞的出現頻度,Wordle 的Web 站點提供了“高級”用戶界面,用戶可以輸入包含任意(可選)色彩的加權單詞或短語的表格數據。

Wordle 的更高級的使用方式可能是通過“單詞雲生成器”控制檯應用程序,可以通過IBM 的alphaWorks Web 站點進行查看。

ManyEyes 協作式數據可視化網站還把Wordle 作爲文本可視化選項,其他的還有創新型的Phrase Net 和Word Tree 可視化(以及更傳統的標籤雲)。

 

 

---------------------------
本文節選自《數據可視化之美》(Beautiful Visualization)第3章“Wordle”,作者Jonathan Feinberg。
更多本書相關鏈接,請點擊:【華章官網】【互動網】【卓越網】【噹噹網】【京東網】【豆瓣網

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章