2019-08-29・旺報

2019-08-29・旺報
大數據解析宋詞 「東風」最常見

「何處」及「人間」居二三 唐女詩人愛用「相思」

「東風」一詞,對兩岸民眾而言都不陌生,居然在《全宋詞》裡出現過上千次、高居冠軍寶座!近日在微信朋友圈刷屏的視覺化數據作品,《宋詞繾綣,何處畫人間》(下簡稱《宋詞》)、《唐女詩人群像》(下簡稱《唐詩》),用大數據統計出《全宋詞》裡用詞的前三名,分別為「東風」(1264次)、「何處」(1157次)及「人間」(1061次)。

《宋詞》、《唐詩》由浙江大學CAD&CG國家重點實驗室與新華網資料新聞部合作,歷時半年才大功告成。《宋詞》以《全宋詞》為樣本,團隊分析近2.1萬首詞作、1330家詞人及1300個詞牌名;《唐詩》則針對5.5萬首唐詩展開大數據分析,意外發現不少隱藏在唐詩宋詞裡的資訊。

蘇軾足跡遍布宋疆域

《宋詞》網頁版由詩人行跡圖、年代生平圖聯動的時空圖,以及宋詞詞雲圖、意象情緒圖、韻律圖組成。以蘇軾為例,年代生平圖除用折線體現出蘇東坡一生的仕途起伏外,行跡圖上大小不同的褐點,用線條連接之後,也讓蘇軾的生命軌跡化為點、線、面。由圖可見蘇軾足跡幾乎遍布整個宋朝疆域,杭州城則是他造訪次數最頻繁的地方。

▲6月15日,唐代以來的130餘張古代石刻拓片在四川美術館展出。圖為蘇軾楷書拓片吸引參觀者拍照。(中新社)
▲6月15日,唐代以來的130餘張古代石刻拓片在四川美術館展出。圖為蘇軾楷書拓片吸引參觀者拍照。(中新社)

詞雲圖則根據宋詞詞語的使用次數,進行大數據分析後,使用次數越多的字型越大、顏色越深,位置也更居中。正中間的「東風」與緊追在後的「何處」、「人間」,堪稱宋朝詞人的「心頭好」,在《全宋詞》近2.1萬作品中,三者均被使用超過千次。

「何處」可謂唐詩、宋詞的共同最愛,再度登上《唐詩》的榜眼──透過大數據整理出5.5萬首唐詩用詞的前三名,分別為「不知」(1551次)、「何處」(1258次)、「千里」(1188次);至於唐代女詩人常用之詞,則以「相思」(27次)、「不知」(17次),「今日」與「殷勤」(11次)居多。

值得一提的是,《唐詩》網頁版製作的「唐朝女詩人社交圖」,以交友最為廣闊的薛濤為中心,連同並列為「唐代四大女詩人」的李冶、魚玄機、劉采春等,直接與杜牧、劉禹錫、元稹、溫庭筠、白居易等男詩人產生連結,進而再擴及杜甫、李商隱等名家。巧妙地以眾位女詩人為軸心,重現出整個大唐男女詩人的社交圈。

視覺化讓古詩詞易懂

此外,《宋詞》的「意象情緒圖」選取30個類似「月」、「酒」等常見的字詞,並以蘇軾、李清照等24位「高產量」的詞人為代表;在大數據分析下,得出這些意象詞彙在作品中所表達的情緒,再把情緒分為「喜、怒、哀、樂、思」五類,然後用餅狀圖呈現出,各字詞所代表不同情緒的比例,讓造訪網頁的網友一目了然。

浙江大學CAD&CG國家重點實驗室設計主管張瑋表示,「我們之前瞭解宋詞唐詩,更多地是一首一首分開理解賞析,而這次的研究讓我們可以從大數據層面去尋找詩詞背後所隱藏的資訊。」他並強調,製作《宋詞》、《唐詩》並非為求得出某一結論,而是提供人們一種「探索唐詩宋詞的有趣工具」。
浙江大學電腦科學與技術學院副院長陳為也指出,「人是視覺性的,視覺化形式的科普手段,可以把晦澀的古詩詞變得通俗易懂,讓科普擺脫說教或者沈悶的刻板印象,從而起到推廣傳統文化的作用。」

(記者賴廷恆)