- +1
數說兩會|1978年到2024年政府工作報告關鍵詞盤點
2024年3月5日上午,十四屆全國人大二次會議在人民大會堂舉行開幕會。國務院總理李強代表國務院,向十四屆全國人大二次會議作政府工作報告。
澎湃新聞從中國政府網上,整理了1978年至2024年共計47份《政府工作報告》,通過文本挖掘算法,一同解鎖中國發展背后的政策密碼。
一份政府工作報告一般分為兩個部分:對過去的回顧總結、對未來工作的發展部署。
47年間,政府對未來的發展布局有何變化?澎湃新聞分析了在發展部署部分,關鍵詞共現詞的變化情況。
不難發現,近些年,一些新的共現詞頻繁出現:1978年至2017年的政府工作報告,和“發展”共同高頻相鄰出現的,是“經濟”“社會”。然而,從2018年政府工作報告開始,“高質量”成為了“發展”最大的關鍵詞。
不僅如此,“建設”的共現詞,從早些年的“現代化建設”“經濟建設”,發展到進入21世紀的“基礎設施建設”,再到如今的“政府建設”。2024年政府工作報告提出,“全面加強政府建設,大力提升治理效能”。
澎湃新聞也統計了47份《政府工作報告》中的常青詞匯。結果顯示,“發展”、“建設”以及“經濟”等詞語在過去47年中一直高頻出現。
還有部分詞語愈發頻繁地出現在《政府工作報告》中,例如“政策”“保障”。因其增長趨勢,澎湃新聞將此類詞語稱為“喇叭形詞語”。近些年新的喇叭形詞語,還包括“高質量”“數字”“人工智能”。
那么,2024年的政府工作報告有哪些新詞匯?澎湃新聞找到了一些今年提到,但過去五年(2019年-2023年)未曾提及的詞語,例如“基礎教育”“市場秩序”“質量第一”。
分析方法:
1.本文所有原始文本材料來自中國政府網1978年至2024年政府工作報告。
2.本文使用jieba分詞(https://github.com/fxsjy/jieba/)。采用精確分詞模式,避免重復分詞和歧義。分詞結果均去掉數字、單字、標點符號。
3.為增加分詞正確率,在jieba分詞的基礎上加入自定義詞典,自定義詞典主要包含了往年人民網和新華網統計的兩會熱詞。
4.在分詞基礎上,采用TF-IDF加權技術。詞語的重要性隨著它在文本中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。本文使用的語料庫即1978年至2024年政府工作報告文本。
澎湃新聞記者 舒怡爾 對文本有所貢獻
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2024 上海東方報業有限公司