- +1
歷史與AI的距離︱拜占庭學的數字研究方法
“拜占庭”,來自地中海的中世紀文明,在傳統的觀念中以保守陳舊,食古不化的刻板印象著稱,長期以來只被視作繁榮又多元的羅馬帝國的影子。而研究這一文明的學科也只是肇始于語文學的尋章摘句之中,亦或是從實地對業已荒廢的建筑遺跡進行考察,抒發思古之幽情。這一古舊的文明與學科,給人最早的AI印象竟然是計算機科學研究中的“拜占庭容錯算法”(Byzantine Fault Tolerant),成為了計算機技術發展歷程中的一個凝固的概念,也是拜占庭學研究者常常自我取笑的內容。在這種停滯且毫無生機的印象里,研究拜占庭帝國的學問是如何同與時俱進的數字研究方法聯系起來的呢?
實際上,計算機和數字技術的迅速發展加速了科學與人文學科的互動,已經催生了數字人文成為當今拜占庭學學界最為活躍的研究領域之一,許多基于數字方法的歷史數據庫被建立起來。不僅如此,近年來AI技術的進步加速了數字人文的發展局勢。如今,如何利用數字方法進行歷史研究,應用AI技術對數字研究方法進行進一步的創新,突破傳統歷史研究范式,構建新的歷史研究方法,已經成為當代學者們熱切探討的核心問題。為此,2024年9月19日至11月21日,東北師范大學世界古典文明史研究所以“拜占庭學的數字研究方法”(Digital Methods for Byzantine Studies)為主題,組織了第八屆國際拜占庭學研討班講座系列。該活動旨在通過邀請國際同行來展示國際拜占庭學中的最新數字研究方法,為國內拜占庭學的數字人文研究提供思路和合作契機。本次研討班匯聚了來自奧地利科學院中世紀研究所、德國美因茨萊布尼茨考古中心、比利時根特大學等國際一流學術機構的多位拜占庭數字人文研究學者,圍繞拜占庭學研究的數字化轉型與AI應用,從文獻數字化、歷史地理建模到數據庫構建等多個角度展示了數字方法在拜占庭學中的創新與應用。他們的報告不僅展現了拜占庭學領域數字人文的最新研究成果,也為全球范圍內的古典與拜占庭學研究者提供了數字人文研究在方法和理論上的新啟發。更重要的是,講座的舉辦展現了學術共同體中開放學習和交流的重要性,推動國內外拜占庭學學術界在信息時代以數據庫為基礎,借助AI的方法,建立緊密的學術共同體。
在當下,許多歷史學者被新興的概念吸引進AI的發展潮流中。因此如何正確認識AI技術與數字人文的關系以及對之如何加以利用成為一個亟需解決的問題。奧地利科學院中世紀研究所研究員約阿尼斯·普萊西爾-卡佩樂(Johannes Preiser-Kapeller)博士以《卷入全球史:處于史料分析與AI技術之間的歷史和考古網絡研究的潛力、陷阱與新進展》(Entangling Global Histories: Potentials, Pitfalls and New Developments in Historical and Archaeological Network Research between Source Analysis and Artificial Intelligence)為主題,以網絡分析(Network Analysis)的概念將聽眾們引入他對AI技術使用的思考,開啟了本系列線上講座的數字知識盛宴。在以卡佩樂為代表的拜占庭學研究者看來,AI技術的引入對于拜占庭學不是沖擊,反而可以讓我們通過其數據處理能力和可視化能力對過去的世界有了更清晰的認知。他以總覽全局的視角論述了在拜占庭學中使用AI技術進行數據分析的要點。許多拜占庭學學者已經借助AI技術建立了許多數據庫,這些數據庫包含群體傳記學(prosopography)、地理信息系統(GIS)等等,涉及大量拜占庭學的數據分析。他尤其強調了深度學習型AI在數據分析中的應用。但是,AI方法的引入對歷史研究可能并非全然沒有問題。實際上,在卡佩樂看來,AI技術在歷史學研究中的過度應用可能會造成人為的復雜性(Artificial Complexity),掩蓋了其歷史意義。他以“威尼斯時間機器”(Venice Time Machine)等案例,反思了以拜占庭學為代表的古史研究中大數據應用的可行性,同時強調歷史學家應注意主體在AI應用中的重要地位。簡而言之,AI在如今的拜占庭學研究中是現象級的研究工具,應受到每個歷史學家的重視。
對可讀取文本進行信息處理是AI技術在拜占庭學傳統的文本研究中最直接的應用。比利時根特大學文學研究部的克里斯托菲勒·德莫恩(Kristoffel Demoen)教授的團隊就是這類研究的代表。德莫恩教授是拜占庭文學研究的專家,他和博士生團隊以《拜占庭書籍警句數據庫:從中世紀手稿的邊白到可搜索數字文本庫的旁文本詩歌》(The Database of Byzantine Book Epigrams: Paratextual Poems from the Margins of Medieval Manuscripts to a Searchable Corpus)為題,系統闡釋并以實例來驗證了團隊使用AI技術助力數據庫建設與拜占庭學研究。德莫恩教授從書籍警句的定義出發,認為這類文本的產生是與文本的贊助人、作者、讀者、抄工、畫工等等人員相關,因此,書籍警句有著重要的社會史、文化史、藝術史等層面的意義。德莫恩教授詳細講解了數據庫的發展歷程,從2009年開始,書籍警句數據庫經歷了收集數據、整理數據、發布數據庫版本、現狀、和未來發展規劃等階段。然后,他同兩位博士生詳細解讀了其數據庫的原則、現狀和挑戰。他還介紹了目前學術團隊的組成,尤其強調了計算機技術人員的重要性,給予聽眾很強的參考意義。在講座的第二部分,他指導的兩位博士生詳細介紹了自己目前所進行的研究。首先是對于拜占庭書籍警句的模式化表達的研究(Formulaic Expressions in Byzantine Book Epigrams),該研究從拜占庭希臘語的表達方式出發,應用數據提取、N元語法(N-Grams)以及手動的探索和注解等方法進行研究。這種研究運用AI對語言進行分析,給拜占庭學傳統的文本研究與分析路徑注入了新的活力。另一個個案研究則是從語義學出發,對數據庫中的語言模型和語言檢索進行分析,最終建立了研究的語言模型。
AI技術的發展不僅可以將拜占庭流傳下來的諸多文本進行分析、研究,AI的可視化能力可以讓我們更直觀地體會拜占庭帝國的歷史文化。基督教既是拜占庭帝國的官方信仰,也是帝國借以處理與周邊關系的重要手段。在拜占庭帝國的影響下,其周邊的族群幾乎都是基督教世界的成員,并采用了東正教的禮儀,而且許多地區都有自己的圣徒,這讓拜占庭的宗教文化擁有了更廣闊的地理空間意義。君士坦丁堡的《教會慶典圣徒禮儀要書》(Synaxarion of Constantinople)中充滿了以圣徒禮儀為核心的地理元素,成為研究這一問題的核心文本材料。德國美因茨萊布尼茨考古中心的斯蒂芬·阿布萊希特(Stefan Albrecht)博士在《君士坦丁堡<教會慶典圣徒禮儀要書>的數字化》(The Digitization of the Synaxary of Constantinople)中對這類禮儀書文本及其數字化進行了闡釋。他首先對該類文本予以定義,并強調項目依托的是博蘭德學派神父希波呂特·德勒哈耶(Hippolyte Delehaye)整理的版本,是一部10世紀的禮儀書籍,記錄了充分的社會史信息,在地理知識層面記錄了多達1315個地名。之后,他從“文學地理”(Literary Geography)的角度出發,通過地理、網絡和鏈接的角度展示了對這個文本的電子化與可視化情況,并詳細介紹了數據庫建設的目前狀況和數據的分類與結構。阿布萊希特博士的數字人文方法為我們思考傳統上內容重復的禮儀文學提供了新視角。
拜占庭帝國的地理空間不僅存在于禮儀文本的歷史記憶中,更實實在在地體現在地理信息系統的研究中。奧地利科學院中世紀研究所的米海洛·波波維奇(Mihailo Popovi?)博士在《虛擬世界中的拜占庭帝國歷史地理:過去、現在和將來的方法》(The Historical Geography of Byzantium in a Virtual World:Past, Contemporary and Future Methods)中就從這一角度帶給我們深刻的思考。
波波維奇博士是奧地利科學院項目《拜占庭帝國地理圖冊》(Tabula Imperii Byzantini)的子項目負責人。他首先闡釋了奧地利的歷史地理研究傳統,并定義了拜占庭學中地理空間的核心地區,即東地中海、小亞細亞和巴爾干半島。他隨后對地理信息的重要材料進行了介紹。他認為主要有四種材料,分別是拜占庭時期的書寫材料,這包括憲章、歷史寫作、銘文等等內容。然后是考古發現、地名學以及現今地貌的物理狀況。然后,他詳細列舉了對這些材料的實際應用與應用的困難,如地名學需要語言學知識背景,考古信息與地貌分析需要注意各種自然與人文方式的破壞等。在講座的下半部分,波波維奇博士詳細講述了自己在數字人文研究的心路歷程,讓我們更加深入地了解了拜占庭歷史地理的數字人文化發展與一位數字人文學者的成長路程。此外,作為歷史地理研究者,他特別強調了實地考察的重要意義,以及文獻資料與免費的地理數據的不可靠。他還強調了大數據研究在古代史中應用的危險性,并反思了網絡分析研究中出現的種種問題。最后,波波維奇博士的講座以對數據庫的建設和數字人文發展的思考作為結尾。波波維奇博士的講座極大的調動了聽眾們的思考,給我國以拜占庭學為主的數字人文建設以豐富的經驗、思考與啟迪。
東北師范大學世界古典文明史研究所國際拜占庭學研討班(由科隆大學拜占庭與現代希臘研究中心與挪威科技大學古典學系協辦)自2017年創辦以來,已成為中國拜占庭學研究對外交流與國際合作的重要平臺。本次以數字人文為主題的研討班不僅激發了與會學者的濃厚興趣,也為世界古典文明史研究所的數字人文研究指明了方向。然而,正如卡佩樂所提醒的,數字人文方法在古代史研究中的應用需要保持審慎態度。他指出,大數據和人工智能雖然為拜占庭學提供了全新的研究視角,但數據的完善度與韌性仍是關鍵問題。缺乏批判性應用可能導致“盲人摸象”,無法全面理解歷史。在當前數字人文領域的發展中,雖然AI技術的應用受到高度關注,但數字化與數據庫建設本身的重要性不容忽視。從相關講座系列中可以看出,學界的進展并不僅局限于AI技術的探索,還涵蓋了理論反思、數據庫的建設實踐,以及基于數據庫的AI工具開發。AI技術的潛力不僅體現在為專業學者提供復雜數據分析的支持,更在于通過智慧數據平臺的普及,使普通用戶也能輕松訪問與利用歷史數據。然而,這也凸顯了一個現實問題:歷史研究與AI技術之間仍存在距離。彌合這一差距,需要進一步加強數據基礎設施建設,確保數據的系統性、標準化與開放性,為AI應用提供堅實的基礎,并在學術與公眾領域實現更廣泛的價值轉換,從而為這一學科的數字化發展奠定更加穩固的基石。卡佩樂以“大數據還是大障礙”(Big Data-Big Biases)為引,深刻啟發了聽眾對方法論與數據偏差的反思。這些討論不僅揭示了AI在歷史研究中的潛力與局限,也為拜占庭學未來的數字化轉型提供了寶貴經驗。我們期待這一學術盛會繼續發揮橋梁作用,推動拜占庭學研究邁向新的高度,同時鼓勵學者在擁抱數字技術的同時,保持嚴謹的批判思維,以更全面地探索拜占庭文明的深邃歷史。
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2024 上海東方報業有限公司