- +1
第十五期北京大學可視化發展前沿研究生暑期學校第八講:歷史可視化與標注利用
7月12日上午,第十五期北京大學可視化發展前沿研究生暑期學校系列線下課程中,華為軟件創新實驗室張宇老師為同學們帶來了專題講座:歷史可視化與標注利用。

數據可視化歷史
背景: 前計算機時代的數據可視化
講座一開始,張宇老師介紹了幾幅經典的前計算機時代的可視化作品作為引子,包括John Snow的霍亂地圖、Charles Minard的拿破侖東征圖、William Playfair的小麥價格和工資圖、Jacques Bertillon的專題地圖。這些作品至今仍是可視化工作者學習的對象。
張宇老師由此引出了以下問題:有多少前計算機時代的可視化流傳至今?歷史上的可視化使用過哪些設計?我們可以如何利用前計算機時代的可視化?這一次講座將依次回答這三個問題。

背景:前計算機時代的數據可視化
有多少前計算機時代的可視化流傳至今
想要弄清這個問題需要明確前計算機時代可視化作品的數據收集方法。張老師首先排除了圖片搜索引擎,因為這類來源缺乏元數據,收集到的數據還需要去重。更合理的辦法是從各類數字圖書館提取圖片,方便獲得書目信息、圖片文件屬性和版權信息等元數據。他從中提取了37萬張電子圖書館中的圖像及相應元數據。而后人工對這些圖片進行標注,用VGG-16行文本/地圖/可視化檢測,篩選出34.5萬余張圖像的標簽 。進行標注質檢與糾錯后,按出版日期過濾可視化圖像,最后得到了1.3萬張前計算機時代的可視化圖像及相應元數據。這一步研究的成果以線上畫廊(https://github.com/oldvis/gallery)的形式呈現。

OldVis項目軟件棧

OldVis項目標注系統

線上畫廊
歷史上的可視化使用過哪些設計?
張宇老師在上一步研究的基礎上,用設計方法對前計算機時代的可視化作品進行了層次分類。這一步研究需要利用VisTaxa對圖片標簽進行大量編碼工作,包括創建和編輯分類、解決結構沖突、修改標簽以及解決標簽沖突的一套完整流程。在進行這一步研究時,包括張老師在內的3個編碼者一起工作,每次迭代中編碼100張圖片,最后建立了51個分類單元。

VisTaxa系統
我們可以如何利用前計算機時代的可視化?
首先,收集前計算機時代的可視化作品可以作為二次設計的靈感來源,比如現代工作者可以在舊有作品上增加交互和提升擴展性。
其次,還可以進行一些衍生研究,比如回答這兩個問題:誰是最高產的作者?高產的作者為什么高產?張老師發現前計算機時代的高產工作者往往是政府的1統計工作者,他們具有時間、數據和出版等方面的便利。
再次,這些前計算機時代的作品還可以用來提取歷史數據,比如從John Snow的霍亂地圖中可以提取出倫敦瘟疫的史料。
復次,歷史圖像往往不是孤立存在的,而是有前后繼承的譜系,收集工作有利于圖像的版本研究。
總結
張宇老師的研究不僅對于理解可視化工作的前史和經驗積累有重要意義,也對歷史研究者搜集史料提供了便利。本次講座詳細拆解了這一研究的過程和工具,對于同學們進行自己的研究具有方法論和研究邏輯上的借鑒意義。
原標題:《第十五期北京大學可視化發展前沿研究生暑期學校第八講-歷史可視化與標注利用-張宇》
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。





- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2025 上海东方报业有限公司