會解脫擇優(yōu)挑選。這可以讓歷史學家避開占支配地位的敘事。例如,數(shù)據(jù)科學會局部地防止這種主觀性。普賴澤爾-卡佩勒說:如果你系統(tǒng)地搜集證據(jù)并將它放進一個數(shù)據(jù)庫。普賴澤爾-卡佩勒繪制了一些網(wǎng)絡來識別拜占庭帝國文件中的重要角色。這些人在對這些文件的初步閱讀中顯得并不起眼。說:不是最容易受到關注的人。但他總是存在于背景中,將各個人群聯(lián)系起來,而原本這些群體可能不會被聯(lián)系起來。
媒稱,據(jù)美國《連線》月刊網(wǎng)站3月21日報道??茖W家用人工智能(AI和X射線解密古代社交網(wǎng)絡。
卡塔魯奇婭·薩沃納里奧的遺囑在威尼斯國家檔案館保存了650多年,從未有人讀過它學者們不明白,為什么這份寫于1351年的文件從未被打開過?
這份6頁紙的文件正好適合做實驗。但對物理學家福齊亞·阿爾貝廷而言。
方法是利用
X光機透視。2017年的一次演示中,阿爾貝廷目前在意大利的恩里科·費米研究中心工作。希望疑惑封這份遺囑而讀取其內(nèi)容。阿爾貝廷和她團隊用X光照射這份文件,以此方法為其中的文本拍照。然后,利用一些算法,以數(shù)字手段展開這6頁紙,從而清晰地重制其中的手寫單詞。
薩沃納里奧使用了一種舊的意大利語形式,尚未完全弄清楚這份文件的內(nèi)容。阿爾貝廷說。與他合作的檔案官員還在解讀這種語言。但這一技術應該可以協(xié)助歷史學家在不損害物品自身的情況下研究文本。阿爾貝廷說:另外閱讀這份遺囑的唯一途徑是將它剪開。
跨越歐洲2000年歷史
并且該引擎的搜索范圍將跨越歐洲2000年的歷史。阿爾貝廷正在參與一個稱為“時光機器”項目。該項目的目的制造一種類似谷歌的搜索引擎。
為了做到這一點,洛桑聯(lián)邦理工大學的計算機科學家弗雷德里克·卡普蘭說。研究人員計劃對歐洲各個鄉(xiāng)村的檔案文件進行數(shù)字化處理,并將它納入一個數(shù)據(jù)庫。卡普蘭將領導“時光機器”項目的合作事務。卡普蘭認為,最終歷史學家可以利用阿爾貝廷的X光
安檢機技術在一個自動化程度很高的過程中掃描大量未打開的大部頭書。然后,可以將這些掃描結(jié)果輸入卡普蘭團隊正在開發(fā)的一個由人工智能推動的文本識別算法中。該算法將自動把有關文本送入一個數(shù)據(jù)庫。
有越來越多的歷史學家試圖使用數(shù)據(jù)科學來從舊文本中發(fā)掘新信息。奧地利科學院的歷史學家約翰內(nèi)斯·普賴澤爾-卡佩勒說,時光機器”不只是時髦的應用。巨大的數(shù)據(jù)庫將讓歷史學家在更長的時間跨度和更大的地理范圍中研究社會組織模式。該項目是過去幾年來一種新趨勢的一部分。近幾年。當歷史學家為他科研項目申請研究基金時,要建立一個數(shù)據(jù)庫并做一些網(wǎng)絡分析,這幾乎是一個必要條件”
萊頓大學的歷史學家茜爾德·德韋爾特和她團隊已經(jīng)建造了一個工具。該工具會在數(shù)字化的中國和朝鮮文本中自動標志人名、地名和時間。已經(jīng)設計了數(shù)據(jù)庫,例如。這樣它可以同地圖繪制軟件相連,以便更容易直觀地展示人如何在時空中移動,以及思想如何在時空中傳播。
數(shù)據(jù)科學防止“擇優(yōu)挑選”
保守上,這種基于數(shù)據(jù)的方法可以就過去提供一種新鮮的視角。普賴澤爾-卡佩勒說。歷史學家使用敘事來理解過去,并把他重點放在大人物和重要地方”上。這種框架可能導致“擇優(yōu)挑選”這樣學者們只會強調(diào)支持他敘事的案例。說,歷史研究中,擇優(yōu)挑選依然經(jīng)常發(fā)生。