- +1
我用數(shù)據(jù)分析了唐詩三百首,發(fā)現(xiàn)最秀的竟然不是李白?
摘要:本文爬取了古詩文網(wǎng)[1]《唐詩三百首》里唐詩相關(guān)數(shù)據(jù)。首先,分析了唐詩體裁的構(gòu)成。其次,篩選出唐朝Top5高產(chǎn)詩人名單。然后,分析出不同詩人擅長創(chuàng)作的題材類型。接著,對古詩內(nèi)容和古詩類型進行內(nèi)容分析。最后,探討了詩人壽命和作品產(chǎn)量的關(guān)系并給出總結(jié)。
“熟讀唐詩三百首,不會吟詩也會吟”。想必這句話大家都不陌生,其出自《唐詩三百首》編者蘅塘退士所作原序。
出于義務(wù)教育教材的強力推薦,幾乎所有人從小就和唐詩有著不解之緣,我說“床前明月光”,下一句你肯定知道既不是“李白睡得香”也不是“地上鞋兩雙”,而是“疑似地上霜”。
但是今天,我們不復(fù)習(xí)韻律,也不品派別,就從數(shù)據(jù)的角度重新認識一下《唐詩三百首》!
一、唐詩基本形式?體裁構(gòu)成
如下圖,《唐詩三百首》按體裁可分為五言絕句、七言絕句、五言律詩、七言律詩、五言古詩、七言古詩和樂府七類。
其中,五言律詩涌現(xiàn)了大量優(yōu)秀的詩作,數(shù)量達到80首,這可能是因為五言律詩具有“二二一”(客路青山外,行舟綠水前)或“二一二”(海內(nèi)存知己,天涯若比鄰)的節(jié)拍群,奇偶相配、富于變化、能夠更靈活細致地抒情和敘事、語句的表現(xiàn)力強[2]。
在七類體裁中七言古詩收錄數(shù)量最少,僅有28首。七言古詩作為一種古老的詩體,經(jīng)歷了漫長而曲折的發(fā)展歷程,在唐代走向成熟。
二、誰著作等身?唐朝Top5高產(chǎn)詩人
按照詩人作品產(chǎn)量由高到低排序,可以得到唐朝Top5高產(chǎn)詩人名單(如下圖),他們依次是白居易(3075首)、杜甫(1371首)、李白(1178首)、劉禹錫(816首)和元稹(719首)。
從產(chǎn)量來看,在白居易面前,李、杜也略顯遜色。
從代表作來看,白居易的《琵琶行》可謂高考語文常客,其朗朗上口的韻腳、快慢分明的節(jié)奏經(jīng)常讓人讀著有酣暢淋漓之感,不愧是能讓“江州司馬青衫濕”的好詩!
杜甫許多膾炙人口的佳句,只讀一遍便在腦海里三日不絕揮之不去。例如,“兩個黃鸝鳴翠柳,一行白鷺上青天”、“無邊落木蕭蕭下,不盡長江滾滾來”、“會當凌絕頂、一覽眾山小”、“安得廣廈千萬間,大庇天下寒士俱歡顏”等。
浪漫主義詩派代表人物李白,其人心胸之闊,桀驁不馴;其詩格局之高,氣勢磅礴。情極悲憤而作狂放,語極豪縱而又沉著,可謂才氣逼人。其代表作《將進酒》、《蜀道難》等乃治療抑郁之良藥,大家失意或者傷心時酌情朗誦兩遍,情緒可得緩解!
最后兩位詩人分別為劉禹錫和元稹,知名度稍遜于前者。
寫到這里順便給大家科普一下自古以來最高產(chǎn)的詩人——乾隆皇帝。是的,你沒看錯,作詩量世界古今雙第一,一生89歲作詩42250多首[3]。
全唐朝2700多位詩人300年的總產(chǎn)量也只有48900,可見乾隆一人出詩量可擋世界第一詩朝300年的世界記錄,且其詩內(nèi)容遍及經(jīng)史子籍、政經(jīng)文教、家國個人,題材弙闊、前無古人、后無來者、不愧是朕。
三、體裁通吃?平平無奇的創(chuàng)作小天才
下圖展示了作品量前30唐朝詩人創(chuàng)作體裁的偏好。右邊節(jié)點越寬說明詩人擅長創(chuàng)作的體裁種類越多。
可以看到在七個唐詩體裁中,李白、杜甫等能創(chuàng)作,不愧是家喻戶曉的“大李杜”[4],可謂全能型創(chuàng)作選手。
李、杜之后還有白居易、李商隱、王維、岑參和韋應(yīng)物,他們的作品體裁也較為豐富。
值得注意的是,這里并不是說其他詩人不寫某些體裁,而是寫了此類體裁又能被《唐詩三百首》收錄的體裁數(shù)量,這在一定程度上能夠反映出詩人所擅長的體裁種類。
四、 我找到了寫詩的精髓?內(nèi)容分析
分別對古詩具體內(nèi)容和古詩分類進行文本挖掘,繪制出如下所示的詞云圖。
01 古詩內(nèi)容
詞云圖中的字母“T”由古詩內(nèi)容的關(guān)鍵詞組成,從詩歌的意象來看:“月”、“明月”等關(guān)鍵詞出現(xiàn)的頻次較高。
古往今來,“月”常被文人墨客作為寄托思念的物象,正所謂望云思友、望月懷人,如杜甫的《恨別》:“思家步月清宵立,憶弟看云白日眠”。
此外,“長弦”、“琵琶”、“青山”、“春風(fēng)”等物象也經(jīng)常被使用,在特定場景可象征不同的含義與情感。
從詩歌的時空來看,“萬里”、“隔”、“年”等詞出現(xiàn)的頻次較高,這是因為古代交通不便,以書信作為主要的通訊方式,一旦分離,相見甚難,而詩詞中常出現(xiàn)的“見”、“不見”等關(guān)鍵詞更加凸顯了離人糾結(jié)與無奈之感。
02古詩分類
詞云圖中的字母“S”由古詩類型關(guān)鍵詞組成,其中“寫景”和“抒情”出現(xiàn)的頻次最高。
一般而言,古詩大多寫景抒情、觸景生情,很少有單純寫景,詩人的境遇、情感一定會與所見之景結(jié)合起來。
例如,同樣是春天,得意時賞春(留連戲蝶時時舞,自在嬌鶯恰恰啼),失意時傷春(桃杏嬌妍能幾日,逝水無情春月明)。
其它較多見的唐詩類型還有,還有“送別”、“懷古”、“思鄉(xiāng)”、“邊塞”等。
五、為祖國健康寫詩五十年?壽命與產(chǎn)量
除了詩人才能之外,還有哪些因素會對詩人作品量產(chǎn)生影響呢?
記得之前看過一篇報道,某院士總結(jié)科研成功的經(jīng)驗是因為自己活得比同行久,莞爾之余細想很有道理。因此下圖擬合了詩人壽命與其產(chǎn)量的關(guān)系。
可以看到,詩人壽命對作品產(chǎn)量具有正向促進作用,平均壽命的增加會帶來平均產(chǎn)量的增加。
產(chǎn)量唐朝第一詩人白居易74歲以及前面提到的產(chǎn)量古今第一詩人乾隆皇帝89歲,成功的秘訣原來是才能+長壽呀!
六、總結(jié)
綜上,本文爬取古詩文網(wǎng)唐詩三百首數(shù)據(jù)并進行了內(nèi)容分析,大致得出以下結(jié)論:
第一,唐詩三百首里出現(xiàn)次數(shù)最多的體裁是五言律詩,最少的是七言古詩。
第二,唐朝詩人中當屬白居易最高產(chǎn),雖然李、杜才氣逼人、名聲更響,但從產(chǎn)量角度看,均沒有白居易秀。
第三,李白、杜甫擅長全部七種唐詩體裁,可謂全能型選手。
第四,唐詩三百首中寫景抒情詩最多,且“月亮”這個意象出現(xiàn)頻率最高,一般寄托相思之情。
第五,詩人壽命在一定程度上正向影響作品產(chǎn)量,正所謂活到老、寫到老。
寫到最后,小編已經(jīng)滿腦詩詞歌賦,心情澎湃,那就隨便來兩句。祝大家:五花裘,千斤肉,呸說錯了,祝大家五花馬、千金裘,浴足皆用茅臺酒,余生不掛一絲愁。
好,大家下期見(偷笑)!!!
參考資料:
[1]出于版本原因,古詩文網(wǎng)《唐詩三百首》共收錄320首唐詩。原著蘅塘退士版為311首。
[2]唐代詩人里面,誰的五言詩成就最高?來源于:https://zhuanlan.zhihu.com/p/59485245?utm_source=wechat_session&utm_medium=social&utm_oi=841561048036298752&from=singlemessage
[3]見《河南教育:基教版(上)》1994年第7期39-39,共1頁。
[4]“大李杜”和“小李杜”,來源于https://baijiahao.baidu.com/s?id=1643999912576563316&wfr=spider&for=pc
數(shù)據(jù) | YaJie
文章 | Yajie、璇璇璇璇子
編輯 | 璇璇璇璇子
本文首發(fā)于微信公眾號“Giao數(shù)據(jù)" 轉(zhuǎn)載請到微信公眾號后臺或文章末尾留言處聯(lián)系原作者!
本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司