這種圖叫文字雲,不是只有把許多的文字擺在一起,通常是依據文字出現的頻率來決定字的大小,出現越多次的文字字體越大。有的網站有標籤雲或分類雲,每一篇文章有一個或數個標籤或分類,一文章被點擊觀看的次數來決定,可以看出哪一類的文章被看最多次,其實也算是一種分析及視覺化的工具。最近文字雲也常出現在我的簡報中。
網上有一些製作文字雲的線上工具,把你的文字匯入後,選擇你的形狀、顏色等自訂功能,即可產生你的文字雲。 不是每個這樣的工具都有支援中文,這一個有,但還有其他的問題要先處理。 中文跟英文不同,英文要處理這種文字雲並不難,因為英文句子是由「word」組成,每個word間均有空白分開,所有要去統計一篇文章中每個word 出現的次數比較沒有難度。但中文就不一樣了,總不能把每個「字」分開,這邊英文的「word」對照的應該是中文的「詞」,由數個中文字組成。問題來了,一篇文章要怎麼去把每個「詞」解析出來?
當然你也可以自己手動斷詞,這是一種相對準確的方式,可以斷成你要的意思,只是一篇不用太長文章的斷詞工作我相信就可以把大部分的耐心磨光,然後咒罵著我為什麼要這樣浪費我的青春。偏偏你的文字雲要好看最好資料量要大一點。
製作文字雲:
2.點選Import words,貼上已斷詞的文章' https://wordart.com/create
3.想看到中文需另外上傳中文字型 |