Meteor App
每日配對一位校外同學
立即下載

{{adMap.article_top.title}}
{{adMap.article_top.cta}}

#分享 數位人文下的歷史普及
頭板

|

{{ articleMoment(createdAt) }}

數位人文下的歷史普及 Making the Future of the Past: Digital Humanities and Popular History 數位與人文講堂(二) 2021年1月6日(星期三) ◎ 主持人:李建良(中央研究院法律學研究所特聘研究員兼所長) ◎ 主講人:盧省言(英國倫敦大學高等歷史研究院博士) 引言 先說明主題的背景與意義。 我是政大歷史法律雙主修,之後獲愛丁堡念歷史碩士、倫敦大學歷史博士。我的專業是13世紀英格蘭婦女的財產權,博士論文是建構在使用許多寫在羊皮紙上的拉丁文史料。英國的傳統是普通法,就是case law,必須看那時候法庭案件的裁判。13世紀距今非常久遠,裁判都是寫在羊皮紙上的拉丁文,沒有index,也沒有翻譯,因此研究中世紀的學者必須要自己去看、去解讀每一個條目、每一個字,對於這領域的學者來說,這是窮極一生都做不完的事情。從這點出發,我們可以深入探討文件數位化的問題,也就是數位典藏。 早在1985年的時候,台灣就有「漢籍電子文獻資料庫」做史料的數位化。而關於我使用的手稿,目前由一個專門研究common law(共同法)的協會,稱作Anglo-American legal tradition,設立一個收錄英格蘭從12世紀到十九世紀,維多利亞女王時期的法律案件。案件呈現全部使用照片,以一張一張的圖像檔呈現。雖然該網站替研究者省去親自到檔案館調閱文件的時間,但也需要一個一個檔案研究,找出跟自己研究相關的案件。 從這點出發,以下討論我會分為點線面三個層次。 第一個點是,從研究者的角度出發,以自己研究取向的數位化;線的部分,我將介紹台灣的數位人文與數位平台,以及其對於台灣地方歷史的重建有什麼樣的幫助,包括中研院數位文化中心的開放博物館,和Google Arts & Culture(谷歌藝術與文化)以及Europeana(歐洲數位圖書館)做比較。接著討論博物館的線上展覽,例如:故宮、大英博物館以及羅浮宮的線上策展,希望透過多重比較,看看到底怎麼樣才可以讓台灣的數位人文做的更好。 https://i.imgur.com/hSkc7g2.jpg (Photo by Fabrizio Chiagano on Unsplash) 數位歷史 開始進入主題,我今天要討論的是數位歷史。數位歷史是數位人文的下位概念。不知道各位第一次接觸數位人文的感想是什麼,我覺得數位人文很包山包海,沒有辦法給他一個定義,因為什麼都可以定義成人文,你只要加上一點數位,一點科技,一些data,一些資料,好像你就可以把他放在數位人文裡面。我目前看到比較比較同意的解釋或是定義就是,一個可能在某個面向必須要借助科技才可以進行的人文研究。 以歷史學門來講,一開始數位化出來的時候,許多上個世代的的大老們非常的抗拒,他們覺得讀歷史應該從史料堆中去挖東西就對了,你不應該借助這種科技的東西。加上數位人文最早在歷史學門是由計量史學開始。 不知道各位是否聽過計量史學?計量史學即利用統計學的方法分析歷史事實,並進行歷史研究,但歷史學本身是一門很重視文本的學科,其實這是歷史跟考古最大的差別,考古是去挖東西,而歷史學是根據你的文本去做研究,那以歷史學的眼光來看,會覺得計量史學把所有東西都量化了,造成一個很大的擔憂是說,你會不會用這些數字去抹去一些當時可能會存在的現象,有很多東西是數字無法顯現的,因為你沒有去看文字,所以一開始歷史學對於計量史學有一股很反彈的聲音。 但我個人覺得數位人文發展到今天這個階段,對大部分歷史界的人來說,就是利用科技跟數位的方式建立一個統整資料庫,一方面你在搜尋的時候也比較容易。比如說,我用肉眼去看一百條資料好了,肉眼可能會錯失一些機會,但是我如果用電腦,用程式下去搜尋,我就不會去錯過任何資料(理想狀況)。 這邊以Anthony Grafton,一個美國歷史學家的話來說明,他說數位科技只是手段,而非目的。以我來說,我做13世紀英格蘭女性財產權,我關心的是,我能不能夠借用科技把我所要的資料全部都一筆一筆挑出來,這個是手段;那目的則是要釐清這些案件裡面講了什麼,跟當時的法條當中有什麼差異,或者是說我們財產權的行使在各地區的差異,就是以歷史學來說,你總是要返回到文本裡面去看,但是在手段方面,還是會希望會有一個比較快的方式,幫我把關鍵字挑出來。簡單介紹一下今天點線面的研究。我會以自己的研究作今天點的層面的研究,講述數位歷史的新可能。我剛剛提到我的博士論文使用大量拉丁文手稿,我讀博士的時候很辛苦,因為要不斷的去學習閱讀拉丁文。首先,你要學會讀拉丁文,那第二個你要學會看手稿,因為印刷體跟手稿是兩個完全不一樣的東西,我待會會給大家看手稿和印刷體的不同。手稿有非常多的縮寫,而且沒有索引,等於是說,我可能看了一百條資料,沒有一條可以用。所以我目前的研究是如何利用OCR光學辨識,辨識出拉丁文,建立索引,方便搜尋。 今天我的合作者也有到場,師大物理系博士後胡耿銘博士。我們構想以寫程式的方式,客製化做關鍵字的挑選。在線的方面,今天也會借重了胡博士他目前的研究討論數位方法與地方歷史。 台灣目前很多數位資料庫還只停在研究的面向,包括你去看中研院數位文化中心,他做的很多資料庫,尤其是GIS,比如台灣水圳系統的分布,以及唐宋詩詞的這些GIS分布,我覺得還是停留在研究端,如果要下放到大眾端的話,就所謂的大眾歷史的應用,你還是有賴於博物館他如何做一個主題性的特展,或是說博物館他如何利用線上策展的東西,把研究員的心血變成一個一般大眾,他可能閒暇的時候,或假日的時候,他會想要知道的東西。這就是我想討論的面的層次,比如說如何從博物館實體,然後下放到線上,或是手機上可以參展。 我們會從點開始講,目的是希望,數位歷史不只是典藏,但典藏很多時候,就只停留在照片,單獨的照片,其實你沒有辦法說成一個好的故事,在講歷史學的時候,沒有辦法建立他之間的關連性。那我希望做的是,把這些東西變成不再是典藏。 那稍微再講個一兩點就是說,歷史學一直非常不喜歡數位人文。老一輩的學者擔心檢索會讓年輕的學者以檢索替代閱讀。相信各位都有一個經驗,是在閱讀一些資料的時候,會突然發現新的方向,有B有C有D,可是當你用檢索的時候,你會錯過這個機會,錯過日後發展另外一條線的可能性。甚至老一輩的學者會認為,你就是沒有這個能力去閱讀,為了消除這種疑慮我們希望建立一個具互相關聯性的資料庫的話,比如將性質相同的東西放在一起。 以我自己的研究為例,十三世紀女性的財產權,當我就是把他歸類在財產權時,我也希望資料庫可以把他跟婚姻連在一起,或是列出相關財產權的訴訟標的物,資料庫的關聯性說越強,那對於歷史研究會更有幫助。再以GIS為例,在我自己的研究裡面,礙於研究史料完全沒有索引,所以沒有相關GIS系統告訴我訴訟發生的區域間如何分布,但我在閱讀時,我發現一件很有趣的事情是,比如中世紀英格蘭的婦女有一項財產權叫亡夫遺產權,意即在丈夫過世了之後,寡婦可以去請求這個亡夫生前所擁有的財產的三分之一,不論動產、不動產,全部加總的三分之一。而有些寡婦會放棄這個三分之一權利,用這個三分之一去幫土地耕種的佃農交換穀物或現金,請佃農每年上繳我多少的食物或是衣料,而在現今Cornwall的這個地方,就是英格蘭的西南邊這邊,很多時候寡婦不要衣料,他們要魚,因為Cornwall漁業發達,所以那邊有非常多靠海為生的人。因此,透過史料你看到寡婦交換的東西有時根據當地經濟狀況不一樣。 對我來說,因為我們資料量實在太大,也沒有索引可以方便做GIS系統,但若可以建立起案件的區域分布資料庫,那就可以進一步探討各地的經濟狀況。 而要建立這種系統,第一步必須有效地辨識各種手寫紀錄,這部分就是我要探討的點的部分。是我最近的project是在做我想要做光學辨識拉丁文的手稿。大家可以看到,右邊這就是手稿,其實他的狀況其實沒有算很好,而且以辨識來說,有過多的雜音。比如那些圖就是雜音。我剛開始想要做辨識拉丁文手稿時,有請教過法律所的詹朝慶先生,他那時候認為難度太高,建議我去找念神學的幫忙肉眼辨識。辨識手寫真的很難,連google現在都還在學習。例如:當你在訂台鐵車票的時候,輸入的辨識碼,其實都是在幫google認識,幫他幫助他學習那些手稿,所以手稿這東西真的非常非常困難,好。 https://i.imgur.com/tlfC3NT.jpg (Photo by Samir Bouaked on Unsplash) 螢幕上我列出三種不一樣的手稿,辨識手稿最難的地方在於他的風格非常非常不一樣,多數程式必須針對一種風格訓練,進而辨識,但是當你的風格很不一樣的時候,軟體難以開發,甚至可能造成在A風格的辨識率可以有百分之九十,可是辨識B風格辨識率可能就掉到百分之七十,或是可能更低。根據在做手稿辨識的人說,基本上你的辨識率如果沒有辦法到達九成以上,就都沒有用。接下來跟各位簡單介紹一下手稿。這個圖是Caroline Minuscule,就是卡洛里小寫,他會比較多的稜角。而上面這個圖是我在處理的史料,稱作court hand,他有非常多的縮寫,縮寫也是背景雜音的一種,會影響光學辨識字母。接下來我直接操作收錄史料的網頁給各位看。 AALT收錄了從英格蘭十三世紀到維多利亞女王時期的法庭史料,以拉丁文紀錄就到十七世紀左右,他的資料量很龐大,從理查一世1176年開始收錄,共計九百五十萬張照片檔。我做的研究集中十三世紀,跨越亨利三世到愛德華一世的時期,我們就隨便點JUST 1系列的一張進去看,如果對英美法有點熟悉的人應該知道,在共同法的歷史中,有個巡迴法庭,意即每隔六七年,國王會跟著他的法庭到各地去,那這個JUST 1就是所謂的巡迴法庭這樣子。這個系統在巡迴法庭上有分區域,下面標示年份。點進去有兩個分類,一個是正面,一個是反面。點進來後大家可以看到這個照片檔其實很人工,不是精細的掃描。 我們就隨便點一張,這張狀況比較糟。我跟大家介紹一下,寫在最前面這個是地名,像這個就是德文郡。那大家也可以看到很多縮寫,每一個記號縮起來的東西都不一樣,所以只能靠學者本身對於拉丁文的理解能力。像這個就是assize,就是法庭的意思,那這個,中間這個字就是venit。所以閱讀法庭紀錄要憑你自己的能力,每個做中世紀法律史的學者都要讀,但像各位看到的,它完全沒有index,所以會比較麻煩。接下來給大家看愛德華一世時期的案件。案件最旁邊會標示地方,像這個是Lincolnshire,林肯郡,而這個是Warwick,縮寫成war。接下來這個案子跟我的研究相關,第一個字是rosa,就是rose,這句在表達Rose曾經是誰的妻子,以這種句型開頭就代表這個女的是寡婦。紀錄的最後通常會記錄下次再開庭的日期,但因為在沒有任何的索引之下,我常常會找不到下次出庭的紀錄。而且因為人名一樣的不少,我下一個找到的 rose可能不是這個rose。 面對一生可能都研究不完的史料量,要怎麼樣才能幫助去挑出關鍵字,找出所有相關案件呢?其實在2016年有個辨識拉丁文手稿大賽,有兩個軟體脫穎而出,一個是DeepScript,一個是FAU,兩者其都是用深度AI學習的方式去,但兩者頂多能辨識手稿風格不一樣,就像我們剛剛秀給大家看,手稿他有很多不一樣的風格,這兩個軟體可以辨識出是哪個風格,他是利用字的向量跟梯度去辨識,各種風格的字體的向量跟梯度不同,以此為關鍵辨識。 到了2019年又有另外一款嘗試叫OCRopus,這是公開資源,可以下載,我在法國的合作者周百里先生之後會下載並嚐試跑這程式。但根據中研院數位文化中心找王翔安老師所說,如果辨識度沒有到9成,沒有辦法用,必須根據你像做的法律史料重新開發一程式。 但剛剛也說過,我使用的史料辨識難度很高,有過多的背景雜音,在第一階段一定要處理掉。雖然我一開始雄心大志,想要全部辨識,反正拉丁文就是英文的26個字母,但是經過跟有在做光學辨識跟物理系的博士們談時候才發現難度非常高,所以我們的目標就轉向為辨識關鍵字。比如說以我最關心的這個,就是所謂的亡夫遺產權,在拉丁文裡叫dos 。dos最初的意思有嫁妝,也有亡夫遺產,但在十三世紀英格蘭,用來指涉亡夫遺產較多,而此字在拉丁文手稿裡有很多變形,李老師應該知道拉丁文裡面有很多格式,所以拼法不同。有時是dos ,有時是dotem,根據其格式改變。再加上縮寫,dotem就會變成dote,然後上面一撇。手稿裡面通常M跟N會省掉。再看到這個ux是wife妻子的意思,為uxor的縮寫。 跟合作者們討論後,我們決定以抓關鍵字的方式,因為亡夫遺產權必定跟妻子這個字同時出現,因此目標是抓出uxor這個字。也就是我們大量的餵程式uxor這個字,讓它抓出所有有關妻子的案件,從這裡我們也能找出亡夫遺產權。 要辨識關鍵字也要從切字塊開始,切字塊的準確率要高才能辨識。胡博士有先幫我他利用去背程式先淨化圖檔,再上色。大家可以看到,在去完背跟上色之後,會有一些東西不見,比如說大家看左邊,這中間的字母會不見。再給各位另一個例子,比如說這個字是一個大寫的B,但去背上色之後,他變的很模糊,辨識度就會沒有這麼好。下一張圖是胡博士直接用google去幫我切的字塊,那我覺得準確率沒有那麼低,但是你看他這個,the wife of Simon,他就把這四個單字連在一個字塊裡面,我們可以發現,只用google去做的話,準確率沒有那麼高。接下來這張圖是胡博士做出來計算每個字塊之間的間距,而我們目前的進度是已經下載Anglo-American legal tradition兩萬多張的圖片,聽說中間有造成該網頁當機,他們可能有偵測到可能有駭客來了,我們總共耗時多久才下載完成? 50個小時。 50個小時,所以是兩天多,我們就下載了這麼多。我覺得這個計畫從小目標出發,先辨識出uxor跟dotem這兩個字就好了。另外,亡夫遺產權的案件有個模式,uxor這個字會出現在案件的第一行,是一大特徵,他有什麼好處是,他跟上面的間距比較大,所以在抓的時候可以把這特徵寫進辨識程式中。如果能夠先把辨識關鍵字做出來,基本上是可以把中世紀英格蘭法律史推進一大步,我相信大家對於法律史可能都有不同關心的地方,比如說李老師比較關心的是人身保護令,habeas corpus,如果我可以做出辨識關鍵字的話,下一步也許可以辨識habeas corpus,找這個字的起源。 https://i.imgur.com/BsJE3cT.jpg (Photo by Mika Baumeister on Unsplash) 這個網頁擁有龐大的資料量非常大,網頁其實設立了一個wikipedia區域,讓大家自由填寫學者個別翻出來的案件。而再我研究的亡夫遺產權部分,只有兩三個案件被填上,因此希望辨識能亡夫遺產權帶來更多認識。如果再進一步將辨識系統跟台灣連結,我們可以跟台史博合作,因為台史博希望能辨識荷領時期在台灣的荷蘭文史料,如果有辦法辨識出拉丁文,我覺得同樣手法可能可以辨識荷蘭文,那這對台灣史的研究也會推進一大步。 以上是以個人研究出發的數文人文以點開始的部分,那第二個部分是串起地方歷史的線,這部分借重胡耿明博士的研究。 胡博士本身是苑里人,所以它對日治時期再苑里創辦櫟社相當有興趣,櫟社是由林獻堂等人創辦的詩社。這個詩社以現在的話來講就浪漫廢柴,根據1921年史料紀載,櫟木這種木頭沒有什麼用,一個不材之木也,所以詩人們創社時就稱自己為廢青,這是一個日治時期的浪漫廢柴詩社這樣子。詩社有許多文裝抗日運動的領導者,像是有林獻堂或是蔡惠如等人,但裡面有一個人大家可能對他不熟悉,就是蔡正豐。 胡博士發現,在研究當蔡正豐先生的生平思想的時候,會發現他的資料很多被竄改過,而且很多謬誤跟殘缺。為了重建蔡正豐的生平,胡博士從苑里市場興建時的史料開始爬梳,因為這個蔡正豐先生曾經在19世紀末,寫了一個對苑里市場的建議,裡面提到他建議這個市場該怎麼蓋。蔡正豐也是櫟社詩人的,但他的很多東西在國民政府來樂後被刻意抹去痕跡,甚至是竄改,關於蔡正豐的敘述,在A史料跟B史料上的呈現會有一些衝突,因此,胡博士以苑里市場為中心,參考各種日記、詩集、聚會紀錄跟當時的台灣日日新報,然後以統計物理的方式重建這個詩社裡面的詩人在地方的這些活動跟地方的參與度,從中找出被抹去痕跡的蔡正豐。 胡博士就用了他原本的演算法分析把詩社的20場聚會,151個人物,重新建構起他們的關係圖。透過聚會出席紀錄算出詩社成員的親疏遠近,並重建他們當時的關係,還有對於地方建設的參與度這樣。以下這個圖是取自於胡博士的研究,圖中間的數值代表他們的親疏遠近,像這個以六代表的人,他跟每個人的關係都超過了一百,代表說關係非常非常遠,所以這圖告訴我們,其他這五個人比較親密,這五個人可能之間還有自己的小團體,但這個六可能就是一個陌生人,可能跟大家都不是很好,所以建構到最後,可以將他剔除。以一個歷史人來說,我不曾想過用數學以及統計物理的方式去重建,但胡博士進一步利用他們之間的關係圖,將其中的小圈圈全都列出來。我認為這個圖對於地方史的重建非常有用,畢竟目前地方史真的比較少人做,如果可以以這種方式跟地方博物館或是當地的文化機構合作,讓原本埋沒的歷史重新以展覽的形式展現給大家知道。 有關地方史的東西,其實現在台灣各地都有努力。以中研院數位文化中心的開放博物館來說,他就集結了不少地方史的線上資料。這個網頁是該網站一些關於櫟社的照片,但是我覺得比較可惜的照片下沒有過多的敘述,可能是礙於沒有太多相關研究,這也是我覺得胡博士的研究很重要的原因,當開放博物館他們拿到這個資料時,他們應該不清楚櫟社之間的人物的關係,所以不會有太多的解釋,照片只會跟你講有誰而已,而且數量也不多,比如說這張林獻堂60歲生日,照片只會跟你講,從由左至右到誰,網站並沒有告訴我們這是第幾次聚會,他們發生了什麼事,或是說其中有哪一些人是特別來參加。雖然可能是礙於沒有史料,但是我覺得如果可以透過數學跟胡博士的研究重建的話,多少可以重建一些更有趣的東西。對地方博物館、圖書館也會有更多貢獻。 大家應該可以看到在開放博物館裡面資料很發散,沒有什麼記憶點,所以最後一個部分我想要跟大家討論線上平台和歷史普及,先給大家一個圖,不知道有沒有人看得出來,這是哪個博物館? 大英博物館。 對,大英博物館,以我在英國待了五年多的經驗,認為英國的博物館很棒,是因為他是免費參觀。如果大家去過歐洲的話,應該知道歐洲是教堂不收費,但博物館要收費的地方,但是英國比較世俗,教堂就要收錢,而且非常貴,之所以不用錢是因為英國認為公共教育不應該分階級,窮人也該有受公共教育以及藝術薰陶的權利,除非是私人博物館,國家建立的博物館全部都是免錢的。從大英博物館作為引子,今天演講最後這部分其從研究端進入到大眾端。前面兩個部分其實比較像是個人研究者的努力,但數位人文多數時候是從研究者自己有興趣的東西出發,而如何把自身研究藉由數位歷史從研究端帶到大眾端,就是博物館跟數位平台的責任,比如說開放博物館。這邊我也會先探討台灣的數位人文平台,並跟Google Arts & Culture以及Europeana做比較,我也會示範不少操作線上平台的方式,那如果各位都有手機的話,待會有一些推薦的程式,大家可以現場下載。再來我會討論各博物館的線上展覽,以及博物館對於AR、VR、MR的應用。 https://i.imgur.com/JFagnUZ.jpg (Photo by Lee Jeffs on Unsplash) 數位平台有研究取向也有大眾取向,以研究取向來說,就有王泰升老師就有參與淡新檔案的數位化,涵蓋下台灣大學的數位人文研究中心下,在早一點的中研院數位人文學研究也有許多研究端取向的資料庫,這對研究者來說非常好用,但一般人不會沒事拜訪中研院的網站。大部分民眾還是透過博物館或線上平台快速學習知識。 我們先從開放博物館開始,這是中研院數位人文中心之下的一個產品,我覺得做的非常好,先前故宮策展水沙連的時候,也跟開放博物館借了非常多的資源。大家也可以看到他的分類很有趣,有主題園區跟展覽,主題園區會再分類,像是自然環境、藝術與人文、民俗與宗教這樣,那我們就隨便點進去一個看好了,藝術與人文,很有趣的一點是,他的entry是以institute來分,比如說這邊就是中央嶺南美術館、故宮博物院、屏東縣政府等等,以一個一個博物館來分大概是因為還有授權跟法律上面的問題。這方面我們希望未來可以進一步整合,把各機構拿掉。 我們再看看開放博物館的線上主題展覽,以媽祖展覽為例,這個展覽做的蠻好的,資料比較多,策展人資源也比較多。這裡也可以連結到各大博物館,比如說鶯歌的陶瓷博物館近期就搭上新冠肺炎的時是列車,展出醫用陶。雖然開放博物館資料很多,但我覺得有一點雜,如果和 Europeana歐洲數位圖書館相比,就有不少進步空間。Europeana很像是歐盟整合概念,將文化歷史藝術的資源整合起來。我們先從他的exhibition開始看,以這個展覽為例,主要講述醫用的植物跟魔法之間的關係,網站提供完整的chapter,從Introduction到第二章、第三章,一直到十章,很像在看一本書。Europeana不止是涵蓋了主題展覽,他還有一個是Europeana classroom,他是給老師們用的,網站也會會介紹你最近的highlightg是什麼,或者是遠距教學有什麼資源可以用。下面會有一些app可以下載給學生玩,例如這個coloring book,可以免費下載整個pdf檔,都是黑白圖畫,然後可以自己去塗色,對於教學者,是一個很好用的數位工具。下面一個很有趣的東西叫get involve,比如說,你可以分享你的color book到平台上。網站也跟一些部落格做結合,例如這個flapper style,講述1920年代新女性的形象,比如說女性自主,flapper這個詞形容追求經濟獨立的女性。網頁中給了詳細介紹,包括影片,然後圖畫等等。那時候的女性其實都還蠻剪鮑伯頭,這東西他們也和時尚史結合一併展出,所以我覺得跟民眾的blog合作也是一個很好的方式。在分類上面,我覺得Europeana是做得比較好,比如說他的入口把institute拿掉了,不用從各機關去入手,直接去找。我再給大家看看他的gallery或是picture。 Gallery大家應該比較熟悉,他會有很多畫的,以這個主題為例,就是聖誕市集,網頁講述聖誕市集的歷史。旁邊這個Section則是有關陰陽太極,我覺得這個很有趣,以google arts來講,他有跟中國故宮合作,但google arts並沒有台灣的故宮合作,這是比較可惜的。從陰與陽這個展覽可以看出Europeana不止是整合了歐洲的東西,也是放了很多東方的元素。Europeana整體上每個作品或展覽的資料都很齊全,比起開放博物館,故事更多更強,那文字敘述也更多,另外互動是app上也做得很好,就是數位人文關鍵,因為他讓觀眾不再只是一個接受,而是主動者、發問者。 接下來要跟大家介紹Google Arts & Culture,先給大家看一下他的某一個展覽,這是我很喜歡的畫家是Botticelli, Google Arts & Culture以藝術品為大宗,集結了很多藝術品,而且這些藝術品可以放大看見畫的紋理,顯示油彩畫的色調。而這一幅the portrait of a lady,那Botticelli的另一幅,是我很喜歡的是春之三女神,可以用游標放大部分畫作,看到細節。但Google Arts & Culture一個最大的缺點是他的文字敘述方面是取自於Wikipedia,因為Wikipedia是任何人都能編輯的。Google Arts & Culture也有出互動的app或是遊戲,這個就是以名畫為濾鏡,讓使用者自拍。如維梅爾的戴珍珠耳環的少女,使用者拍起來就有金髮跟那個頭巾。之前也有梵谷的濾鏡。 (字數超過上限 所以後面放留言)


  回文

你可能有興趣的文章...

{{adMap.article_bottom.cta}}
{{adMap.article_bottom.title}}
{{adMap.article_bottom.content}}

全部留言

B1 (原 Po)   {{commentMoment( "2022-03-12T16:37:27.673Z" )}}

我們來是看看他的展覽入口,分類很多,先以museum為例稍微進去看一下。畫的解析度都可以到放大非常大,我覺得對於很多愛好藝術的者來說, Google Arts & Culture讓藝術就在手中,唾手可得。Google Arts & Culture他的介面做的很好,也很容易使用,主題方面也會跟上流行或時事,像是之前哈利波特的系列,怪獸與他們的產的上映,這裡就專們偶個展覽是介紹古代傳說中的怪獸。

我們來是看看他的展覽入口,分類很多,先以museum為例稍微進去看一下。畫的解析度都可以到放大非常大,我覺得對於很多愛好藝術的者來說, Google Arts & Culture讓藝術就在手中,唾手可得。Google Arts & Culture他的介面做的很好,也很容易使用,主題方面也會跟上流行或時事,像是之前哈利波特的系列,怪獸與他們的產的上映,這裡就專們偶個展覽是介紹古代傳說中的怪獸。
0
B2 (原 Po)   {{commentMoment( "2022-03-12T16:38:07.143Z" )}}

其實線上平台都有一個特色就是雜,但入口分的愈細愈好,也越容易使用。Google Arts & Culture還有一個是歷史事件綜觀section,也很不錯。他做一個時間軸,比如說我們就點1500年,看1500年會跑出什麼,比如說跑出了倫敦大火,倫敦大火其實是1666年,所以你可以看到他箭頭其實是在中間。其實我覺得Google Arts & Culture資料量沒有Europeana這麼大,可是他的重點放在藝術層面,你還可以用手機建立自己的收藏跟你自己的藝廊,他會把你曾經瀏覽過,然後你喜歡的作品,全都幫你做一個collection。如果對藝術特別有興趣的話,我覺得Google Arts & Culture應該是目前最好的一個線上平台。 中研院的開放博物館最大的缺點,就是他沒有做互動式的app,不像Europeana跟Google Arts & Culture有這麼多讓你下載互動的東西,我覺得這東西非常重要,對於想要學習這些知識的人,只要有手機,學習隨時可以發生。

其實線上平台都有一個特色就是雜,但入口分的愈細愈好,也越容易使用。Google Arts & Culture還有一個是歷史事件綜觀section,也很不錯。他做一個時間軸,比如說我們就點1500年,看1500年會跑出什麼,比如說跑出了倫敦大火,倫敦大火其實是1666年,所以你可以看到他箭頭其實是在中間。其實我覺得Google Arts & Culture資料量沒有Europeana這麼大,可是他的重點放在藝術層面,你還可以用手機建立自己的收藏跟你自己的藝廊,他會把你曾經瀏覽過,然後你喜歡的作品,全都幫你做一個collection。如果對藝術特別有興趣的話,我覺得Google Arts & Culture應該是目前最好的一個線上平台。 中研院的開放博物館最大的缺點,就是他沒有做互動式的app,不像Europeana跟Google Arts & Culture有這麼多讓你下載互動的東西,我覺得這東西非常重要,對於想要學習這些知識的人,只要有手機,學習隨時可以發生。
0
B3 (原 Po)   {{commentMoment( "2022-03-12T16:38:51.510Z" )}}

接下來要討論線上策展,目前台灣線上策展做得最好的還是故宮。這是故宮的首頁,故宮的小編很會用梗,像之前的朕知道了,也是跟上宮廷劇的梗,他的文物線上策展是資料量很多這,比如說這個展覽,升遷攻略,就是借用之前有名清宮劇延禧攻略的名字,展覽主要講述清宮升遷生態,網頁的圖也很大,我覺得這是線上展覽吸引觀眾很重要的特色,圖要大才能讓人想瀏覽,且要深入簡出。 https://i.imgur.com/5yOiY8k.jpg (Latinboy, CC BY-SA 3.0, via Wikimedia Commons)

接下來要討論線上策展,目前台灣線上策展做得最好的還是故宮。這是故宮的首頁,故宮的小編很會用梗,像之前的朕知道了,也是跟上宮廷劇的梗,他的文物線上策展是資料量很多這,比如說這個展覽,升遷攻略,就是借用之前有名清宮劇延禧攻略的名字,展覽主要講述清宮升遷生態,網頁的圖也很大,我覺得這是線上展覽吸引觀眾很重要的特色,圖要大才能讓人想瀏覽,且要深入簡出。 https://i.imgur.com/5yOiY8k.jpg (Latinboy, CC BY-SA 3.0, via Wikimedia Commons)
0
B4 (原 Po)   {{commentMoment( "2022-03-12T16:40:11.655Z" )}}

看完故宮,我們來看British Museum的線上展覽。以亞述文化為例,他提供 virtual tour,這是跟google street合作,所以可以直接可以看到大英博物館裡面長什麼樣子,這也體現了數位人文是整合學科的概念,將人文與科技結合。Virtual tour也對有嬰幼兒的家庭有幫助,藉由線上參觀展覽空間,父母可以思考適不適合帶小孩來這空間參觀。而在疫情期間,British Museum和Google Arts & Culture合作推出the world museum,以 3D時間軸以及五大洲分類,讓使用者可自由選擇想看的時段以及地區的展品。

看完故宮,我們來看British Museum的線上展覽。以亞述文化為例,他提供 virtual tour,這是跟google street合作,所以可以直接可以看到大英博物館裡面長什麼樣子,這也體現了數位人文是整合學科的概念,將人文與科技結合。Virtual tour也對有嬰幼兒的家庭有幫助,藉由線上參觀展覽空間,父母可以思考適不適合帶小孩來這空間參觀。而在疫情期間,British Museum和Google Arts & Culture合作推出the world museum,以 3D時間軸以及五大洲分類,讓使用者可自由選擇想看的時段以及地區的展品。
0
B5 (原 Po)   {{commentMoment( "2022-03-12T16:40:38.404Z" )}}

但線上展覽會衍生一個問題:當展品線上化後,是不是就沒有人願意進博物館了?畢竟博物館還是一個實體的地方,長期以來博物館也致力於吸引觀眾進博物館。因此現在不少博物館推出AR、VR跟MR,意即混合實境、擴增實境跟虛擬實境。這些科技應用目前在台灣做的最好還是故宮,之前水沙連展就應用不少AR。AR的實用最有名是寶可夢,VR則是一定要戴眼鏡才可以進入虛擬環境,MR則是戴眼鏡進入現實跟虛擬混合的環境。很多博物館將以上技術限定在博物館內方可使用,不能在家使用,以此來吸引觀眾,解決觀眾沒有誘因進博物館的問題。

但線上展覽會衍生一個問題:當展品線上化後,是不是就沒有人願意進博物館了?畢竟博物館還是一個實體的地方,長期以來博物館也致力於吸引觀眾進博物館。因此現在不少博物館推出AR、VR跟MR,意即混合實境、擴增實境跟虛擬實境。這些科技應用目前在台灣做的最好還是故宮,之前水沙連展就應用不少AR。AR的實用最有名是寶可夢,VR則是一定要戴眼鏡才可以進入虛擬環境,MR則是戴眼鏡進入現實跟虛擬混合的環境。很多博物館將以上技術限定在博物館內方可使用,不能在家使用,以此來吸引觀眾,解決觀眾沒有誘因進博物館的問題。
0
B6 (原 Po)   {{commentMoment( "2022-03-12T16:41:17.347Z" )}}

另外一個新的科技應用是Chatbot,Chatbot就是聊天機器人,利用深度AI學習讓機器人擔任導覽員。Chatbot在訓練過程中是由參展者問問題,問了問題之後,再由AI回答並學習。Chatbot是一個涵蓋許多層面的問題,例如屬於Chatbot應用的Cora,用在銀行客服上,不論是Cora還是Siri大部分語音客服的聲音都是女性,有關使用女性聲音為AI智能選擇這議題,就可以有不少討論。回到Chatbot在博物館的應用,阿姆斯特丹安妮法蘭克福博物館,就是利用Chatbot的AI學習,而且不適只單一回答問題,例如,當參觀者問,「告訴我你的歷史?」的時候,Chatbot會反問,「你想要知道的是哪一段的歷史呢?」,藉由回丟給參觀者不同問題,Chatbot也在深度的學習這樣子。

另外一個新的科技應用是Chatbot,Chatbot就是聊天機器人,利用深度AI學習讓機器人擔任導覽員。Chatbot在訓練過程中是由參展者問問題,問了問題之後,再由AI回答並學習。Chatbot是一個涵蓋許多層面的問題,例如屬於Chatbot應用的Cora,用在銀行客服上,不論是Cora還是Siri大部分語音客服的聲音都是女性,有關使用女性聲音為AI智能選擇這議題,就可以有不少討論。回到Chatbot在博物館的應用,阿姆斯特丹安妮法蘭克福博物館,就是利用Chatbot的AI學習,而且不適只單一回答問題,例如,當參觀者問,「告訴我你的歷史?」的時候,Chatbot會反問,「你想要知道的是哪一段的歷史呢?」,藉由回丟給參觀者不同問題,Chatbot也在深度的學習這樣子。
0
B7 (原 Po)   {{commentMoment( "2022-03-12T16:42:10.239Z" )}}

我在提幾個科技應用與博物館的例子。丹麥南日德博物館(Museum of Southwest Jutland)和一間名為Intertisement Aps合作,利用Beacon定位系統讓遊客看見一個地點在不同歷史時期所擁有的樣貌,例如,走到河畔旁,拿出手機可以看見十六世紀時商船熱絡的景象。而在藝術方面,菊園利用AR系統讓參展者看見一天內因陽光而變化的睡蓮,並看見莫內眼中的睡蓮。不論是線上展覽或是科技應用,可以看得出來博物館正朝就參與式前進博物館,讓參觀博物館遊戲化,然後強化參觀內容,而在加入AI後,就還可以幫助機器學習。這些努力都導向全面的手機的掃描+導覽,讓觀眾只要掃瞄作品即可看到介紹,這種方式也可壁面參觀群眾流失,因為這是on cloud + on site的方式,觀眾一定要進博物館。這種方式在疫情期間也可發揮作用,進一步避免群聚以及可能的飛沫感染。

我在提幾個科技應用與博物館的例子。丹麥南日德博物館(Museum of Southwest Jutland)和一間名為Intertisement Aps合作,利用Beacon定位系統讓遊客看見一個地點在不同歷史時期所擁有的樣貌,例如,走到河畔旁,拿出手機可以看見十六世紀時商船熱絡的景象。而在藝術方面,菊園利用AR系統讓參展者看見一天內因陽光而變化的睡蓮,並看見莫內眼中的睡蓮。不論是線上展覽或是科技應用,可以看得出來博物館正朝就參與式前進博物館,讓參觀博物館遊戲化,然後強化參觀內容,而在加入AI後,就還可以幫助機器學習。這些努力都導向全面的手機的掃描+導覽,讓觀眾只要掃瞄作品即可看到介紹,這種方式也可壁面參觀群眾流失,因為這是on cloud + on site的方式,觀眾一定要進博物館。這種方式在疫情期間也可發揮作用,進一步避免群聚以及可能的飛沫感染。
0
B8 (原 Po)   {{commentMoment( "2022-03-12T16:42:47.122Z" )}}

今天很發散的講了數位人文未來可能的發展的方向,最後要謝謝我的合作對象,師大物理博士後研究員胡耿名先生,東華大學物理博士後王世傑先生,以及麥德倫,中研院基因體研究中心的博士後,另外一位是在法國巴斯德研究中心的周百里先生,最後希望數位人文可以發展越臻成熟,謝謝。 出處:臺灣人工智慧行動網 網址: https://ai.iias.sinica.edu.tw/digital-humanities-and-popular-history/ 這是演講的紀錄 所以沒有跟上內文的圖片 抱歉了(´・ω・`) 會找這篇文章是因為這兩天都在接觸AI相關 這篇算蠻有趣的∠( ᐛ 」∠)_ 這類的文章看了很多 但報告還是擠不出來ಥ_ಥ

今天很發散的講了數位人文未來可能的發展的方向,最後要謝謝我的合作對象,師大物理博士後研究員胡耿名先生,東華大學物理博士後王世傑先生,以及麥德倫,中研院基因體研究中心的博士後,另外一位是在法國巴斯德研究中心的周百里先生,最後希望數位人文可以發展越臻成熟,謝謝。 出處:臺灣人工智慧行動網 網址: https://ai.iias.sinica.edu.tw/digital-humanities-and-popular-history/ 這是演講的紀錄 所以沒有跟上內文的圖片 抱歉了(´・ω・`) 會找這篇文章是因為這兩天都在接觸AI相關 這篇算蠻有趣的∠( ᐛ 」∠)_ 這類的文章看了很多 但報告還是擠不出來ಥ_ಥ
0
B9 {{commentMoment( "2022-03-13T11:53:01.205Z" )}}

我好想去大英博物館😢 想看埃及文物😂😂😂

我好想去大英博物館😢 想看埃及文物😂😂😂
要先有錢錢 才能談參訪_(:_」∠)_ 可惜我沒有
原 Po 回覆:

要先有錢錢 才能談參訪_(:_」∠)_ 可惜我沒有

0
B10 {{commentMoment( "2022-03-13T21:15:21.583Z" )}}

同意,我也沒有錢😢

同意,我也沒有錢😢
看來只能等未來了
原 Po 回覆:

看來只能等未來了

0


登入後發表留言






確定要刪除此文章?
#分享 數位人文下的歷史普及

數位人文下的歷史普及 Making the Future of the Past: Digital Humanities and Popular History 數位與人文講堂(二) 2021年1月6日(星期三) ◎ 主持人:李建良(中央研究院法律學研究所特聘研究員兼所長) ◎ 主講人:盧省言(英國倫敦大學高等歷史研究院博士) 引言 先說明主題的背景與意義。 我是政大歷史法律雙主修,之後獲愛丁堡念歷史碩士、倫敦大學歷史博士。我的專業是13世紀英格蘭婦女的財產權,博士論文是建構在使用許多寫在羊皮紙上的拉丁文史料。英國的傳統是普通法,就是case law,必須看那時候法庭案件的裁判。13世紀距今非常久遠,裁判都是寫在羊皮紙上的拉丁文,沒有index,也沒有翻譯,因此研究中世紀的學者必須要自己去看、去解讀每一個條目、每一個字,對於這領域的學者來說,這是窮極一生都做不完的事情。從這點出發,我們可以深入探討文件數位化的問題,也就是數位典藏。 早在1985年的時候,台灣就有「漢籍電子文獻資料庫」做史料的數位化。而關於我使用的手稿,目前由一個專門研究common law(共同法)的協會,稱作Anglo-American legal tradition,設立一個收錄英格蘭從12世紀到十九世紀,維多利亞女王時期的法律案件。案件呈現全部使用照片,以一張一張的圖像檔呈現。雖然該網站替研究者省去親自到檔案館調閱文件的時間,但也需要一個一個檔案研究,找出跟自己研究相關的案件。 從這點出發,以下討論我會分為點線面三個層次。 第一個點是,從研究者的角度出發,以自己研究取向的數位化;線的部分,我將介紹台灣的數位人文與數位平台,以及其對於台灣地方歷史的重建有什麼樣的幫助,包括中研院數位文化中心的開放博物館,和Google Arts & Culture(谷歌藝術與文化)以及Europeana(歐洲數位圖書館)做比較。接著討論博物館的線上展覽,例如:故宮、大英博物館以及羅浮宮的線上策展,希望透過多重比較,看看到底怎麼樣才可以讓台灣的數位人文做的更好。 https://i.imgur.com/hSkc7g2.jpg (Photo by Fabrizio Chiagano on Unsplash) 數位歷史 開始進入主題,我今天要討論的是數位歷史。數位歷史是數位人文的下位概念。不知道各位第一次接觸數位人文的感想是什麼,我覺得數位人文很包山包海,沒有辦法給他一個定義,因為什麼都可以定義成人文,你只要加上一點數位,一點科技,一些data,一些資料,好像你就可以把他放在數位人文裡面。我目前看到比較比較同意的解釋或是定義就是,一個可能在某個面向必須要借助科技才可以進行的人文研究。 以歷史學門來講,一開始數位化出來的時候,許多上個世代的的大老們非常的抗拒,他們覺得讀歷史應該從史料堆中去挖東西就對了,你不應該借助這種科技的東西。加上數位人文最早在歷史學門是由計量史學開始。 不知道各位是否聽過計量史學?計量史學即利用統計學的方法分析歷史事實,並進行歷史研究,但歷史學本身是一門很重視文本的學科,其實這是歷史跟考古最大的差別,考古是去挖東西,而歷史學是根據你的文本去做研究,那以歷史學的眼光來看,會覺得計量史學把所有東西都量化了,造成一個很大的擔憂是說,你會不會用這些數字去抹去一些當時可能會存在的現象,有很多東西是數字無法顯現的,因為你沒有去看文字,所以一開始歷史學對於計量史學有一股很反彈的聲音。 但我個人覺得數位人文發展到今天這個階段,對大部分歷史界的人來說,就是利用科技跟數位的方式建立一個統整資料庫,一方面你在搜尋的時候也比較容易。比如說,我用肉眼去看一百條資料好了,肉眼可能會錯失一些機會,但是我如果用電腦,用程式下去搜尋,我就不會去錯過任何資料(理想狀況)。 這邊以Anthony Grafton,一個美國歷史學家的話來說明,他說數位科技只是手段,而非目的。以我來說,我做13世紀英格蘭女性財產權,我關心的是,我能不能夠借用科技把我所要的資料全部都一筆一筆挑出來,這個是手段;那目的則是要釐清這些案件裡面講了什麼,跟當時的法條當中有什麼差異,或者是說我們財產權的行使在各地區的差異,就是以歷史學來說,你總是要返回到文本裡面去看,但是在手段方面,還是會希望會有一個比較快的方式,幫我把關鍵字挑出來。簡單介紹一下今天點線面的研究。我會以自己的研究作今天點的層面的研究,講述數位歷史的新可能。我剛剛提到我的博士論文使用大量拉丁文手稿,我讀博士的時候很辛苦,因為要不斷的去學習閱讀拉丁文。首先,你要學會讀拉丁文,那第二個你要學會看手稿,因為印刷體跟手稿是兩個完全不一樣的東西,我待會會給大家看手稿和印刷體的不同。手稿有非常多的縮寫,而且沒有索引,等於是說,我可能看了一百條資料,沒有一條可以用。所以我目前的研究是如何利用OCR光學辨識,辨識出拉丁文,建立索引,方便搜尋。 今天我的合作者也有到場,師大物理系博士後胡耿銘博士。我們構想以寫程式的方式,客製化做關鍵字的挑選。在線的方面,今天也會借重了胡博士他目前的研究討論數位方法與地方歷史。 台灣目前很多數位資料庫還只停在研究的面向,包括你去看中研院數位文化中心,他做的很多資料庫,尤其是GIS,比如台灣水圳系統的分布,以及唐宋詩詞的這些GIS分布,我覺得還是停留在研究端,如果要下放到大眾端的話,就所謂的大眾歷史的應用,你還是有賴於博物館他如何做一個主題性的特展,或是說博物館他如何利用線上策展的東西,把研究員的心血變成一個一般大眾,他可能閒暇的時候,或假日的時候,他會想要知道的東西。這就是我想討論的面的層次,比如說如何從博物館實體,然後下放到線上,或是手機上可以參展。 我們會從點開始講,目的是希望,數位歷史不只是典藏,但典藏很多時候,就只停留在照片,單獨的照片,其實你沒有辦法說成一個好的故事,在講歷史學的時候,沒有辦法建立他之間的關連性。那我希望做的是,把這些東西變成不再是典藏。 那稍微再講個一兩點就是說,歷史學一直非常不喜歡數位人文。老一輩的學者擔心檢索會讓年輕的學者以檢索替代閱讀。相信各位都有一個經驗,是在閱讀一些資料的時候,會突然發現新的方向,有B有C有D,可是當你用檢索的時候,你會錯過這個機會,錯過日後發展另外一條線的可能性。甚至老一輩的學者會認為,你就是沒有這個能力去閱讀,為了消除這種疑慮我們希望建立一個具互相關聯性的資料庫的話,比如將性質相同的東西放在一起。 以我自己的研究為例,十三世紀女性的財產權,當我就是把他歸類在財產權時,我也希望資料庫可以把他跟婚姻連在一起,或是列出相關財產權的訴訟標的物,資料庫的關聯性說越強,那對於歷史研究會更有幫助。再以GIS為例,在我自己的研究裡面,礙於研究史料完全沒有索引,所以沒有相關GIS系統告訴我訴訟發生的區域間如何分布,但我在閱讀時,我發現一件很有趣的事情是,比如中世紀英格蘭的婦女有一項財產權叫亡夫遺產權,意即在丈夫過世了之後,寡婦可以去請求這個亡夫生前所擁有的財產的三分之一,不論動產、不動產,全部加總的三分之一。而有些寡婦會放棄這個三分之一權利,用這個三分之一去幫土地耕種的佃農交換穀物或現金,請佃農每年上繳我多少的食物或是衣料,而在現今Cornwall的這個地方,就是英格蘭的西南邊這邊,很多時候寡婦不要衣料,他們要魚,因為Cornwall漁業發達,所以那邊有非常多靠海為生的人。因此,透過史料你看到寡婦交換的東西有時根據當地經濟狀況不一樣。 對我來說,因為我們資料量實在太大,也沒有索引可以方便做GIS系統,但若可以建立起案件的區域分布資料庫,那就可以進一步探討各地的經濟狀況。 而要建立這種系統,第一步必須有效地辨識各種手寫紀錄,這部分就是我要探討的點的部分。是我最近的project是在做我想要做光學辨識拉丁文的手稿。大家可以看到,右邊這就是手稿,其實他的狀況其實沒有算很好,而且以辨識來說,有過多的雜音。比如那些圖就是雜音。我剛開始想要做辨識拉丁文手稿時,有請教過法律所的詹朝慶先生,他那時候認為難度太高,建議我去找念神學的幫忙肉眼辨識。辨識手寫真的很難,連google現在都還在學習。例如:當你在訂台鐵車票的時候,輸入的辨識碼,其實都是在幫google認識,幫他幫助他學習那些手稿,所以手稿這東西真的非常非常困難,好。 https://i.imgur.com/tlfC3NT.jpg (Photo by Samir Bouaked on Unsplash) 螢幕上我列出三種不一樣的手稿,辨識手稿最難的地方在於他的風格非常非常不一樣,多數程式必須針對一種風格訓練,進而辨識,但是當你的風格很不一樣的時候,軟體難以開發,甚至可能造成在A風格的辨識率可以有百分之九十,可是辨識B風格辨識率可能就掉到百分之七十,或是可能更低。根據在做手稿辨識的人說,基本上你的辨識率如果沒有辦法到達九成以上,就都沒有用。接下來跟各位簡單介紹一下手稿。這個圖是Caroline Minuscule,就是卡洛里小寫,他會比較多的稜角。而上面這個圖是我在處理的史料,稱作court hand,他有非常多的縮寫,縮寫也是背景雜音的一種,會影響光學辨識字母。接下來我直接操作收錄史料的網頁給各位看。 AALT收錄了從英格蘭十三世紀到維多利亞女王時期的法庭史料,以拉丁文紀錄就到十七世紀左右,他的資料量很龐大,從理查一世1176年開始收錄,共計九百五十萬張照片檔。我做的研究集中十三世紀,跨越亨利三世到愛德華一世的時期,我們就隨便點JUST 1系列的一張進去看,如果對英美法有點熟悉的人應該知道,在共同法的歷史中,有個巡迴法庭,意即每隔六七年,國王會跟著他的法庭到各地去,那這個JUST 1就是所謂的巡迴法庭這樣子。這個系統在巡迴法庭上有分區域,下面標示年份。點進去有兩個分類,一個是正面,一個是反面。點進來後大家可以看到這個照片檔其實很人工,不是精細的掃描。 我們就隨便點一張,這張狀況比較糟。我跟大家介紹一下,寫在最前面這個是地名,像這個就是德文郡。那大家也可以看到很多縮寫,每一個記號縮起來的東西都不一樣,所以只能靠學者本身對於拉丁文的理解能力。像這個就是assize,就是法庭的意思,那這個,中間這個字就是venit。所以閱讀法庭紀錄要憑你自己的能力,每個做中世紀法律史的學者都要讀,但像各位看到的,它完全沒有index,所以會比較麻煩。接下來給大家看愛德華一世時期的案件。案件最旁邊會標示地方,像這個是Lincolnshire,林肯郡,而這個是Warwick,縮寫成war。接下來這個案子跟我的研究相關,第一個字是rosa,就是rose,這句在表達Rose曾經是誰的妻子,以這種句型開頭就代表這個女的是寡婦。紀錄的最後通常會記錄下次再開庭的日期,但因為在沒有任何的索引之下,我常常會找不到下次出庭的紀錄。而且因為人名一樣的不少,我下一個找到的 rose可能不是這個rose。 面對一生可能都研究不完的史料量,要怎麼樣才能幫助去挑出關鍵字,找出所有相關案件呢?其實在2016年有個辨識拉丁文手稿大賽,有兩個軟體脫穎而出,一個是DeepScript,一個是FAU,兩者其都是用深度AI學習的方式去,但兩者頂多能辨識手稿風格不一樣,就像我們剛剛秀給大家看,手稿他有很多不一樣的風格,這兩個軟體可以辨識出是哪個風格,他是利用字的向量跟梯度去辨識,各種風格的字體的向量跟梯度不同,以此為關鍵辨識。 到了2019年又有另外一款嘗試叫OCRopus,這是公開資源,可以下載,我在法國的合作者周百里先生之後會下載並嚐試跑這程式。但根據中研院數位文化中心找王翔安老師所說,如果辨識度沒有到9成,沒有辦法用,必須根據你像做的法律史料重新開發一程式。 但剛剛也說過,我使用的史料辨識難度很高,有過多的背景雜音,在第一階段一定要處理掉。雖然我一開始雄心大志,想要全部辨識,反正拉丁文就是英文的26個字母,但是經過跟有在做光學辨識跟物理系的博士們談時候才發現難度非常高,所以我們的目標就轉向為辨識關鍵字。比如說以我最關心的這個,就是所謂的亡夫遺產權,在拉丁文裡叫dos 。dos最初的意思有嫁妝,也有亡夫遺產,但在十三世紀英格蘭,用來指涉亡夫遺產較多,而此字在拉丁文手稿裡有很多變形,李老師應該知道拉丁文裡面有很多格式,所以拼法不同。有時是dos ,有時是dotem,根據其格式改變。再加上縮寫,dotem就會變成dote,然後上面一撇。手稿裡面通常M跟N會省掉。再看到這個ux是wife妻子的意思,為uxor的縮寫。 跟合作者們討論後,我們決定以抓關鍵字的方式,因為亡夫遺產權必定跟妻子這個字同時出現,因此目標是抓出uxor這個字。也就是我們大量的餵程式uxor這個字,讓它抓出所有有關妻子的案件,從這裡我們也能找出亡夫遺產權。 要辨識關鍵字也要從切字塊開始,切字塊的準確率要高才能辨識。胡博士有先幫我他利用去背程式先淨化圖檔,再上色。大家可以看到,在去完背跟上色之後,會有一些東西不見,比如說大家看左邊,這中間的字母會不見。再給各位另一個例子,比如說這個字是一個大寫的B,但去背上色之後,他變的很模糊,辨識度就會沒有這麼好。下一張圖是胡博士直接用google去幫我切的字塊,那我覺得準確率沒有那麼低,但是你看他這個,the wife of Simon,他就把這四個單字連在一個字塊裡面,我們可以發現,只用google去做的話,準確率沒有那麼高。接下來這張圖是胡博士做出來計算每個字塊之間的間距,而我們目前的進度是已經下載Anglo-American legal tradition兩萬多張的圖片,聽說中間有造成該網頁當機,他們可能有偵測到可能有駭客來了,我們總共耗時多久才下載完成? 50個小時。 50個小時,所以是兩天多,我們就下載了這麼多。我覺得這個計畫從小目標出發,先辨識出uxor跟dotem這兩個字就好了。另外,亡夫遺產權的案件有個模式,uxor這個字會出現在案件的第一行,是一大特徵,他有什麼好處是,他跟上面的間距比較大,所以在抓的時候可以把這特徵寫進辨識程式中。如果能夠先把辨識關鍵字做出來,基本上是可以把中世紀英格蘭法律史推進一大步,我相信大家對於法律史可能都有不同關心的地方,比如說李老師比較關心的是人身保護令,habeas corpus,如果我可以做出辨識關鍵字的話,下一步也許可以辨識habeas corpus,找這個字的起源。 https://i.imgur.com/BsJE3cT.jpg (Photo by Mika Baumeister on Unsplash) 這個網頁擁有龐大的資料量非常大,網頁其實設立了一個wikipedia區域,讓大家自由填寫學者個別翻出來的案件。而再我研究的亡夫遺產權部分,只有兩三個案件被填上,因此希望辨識能亡夫遺產權帶來更多認識。如果再進一步將辨識系統跟台灣連結,我們可以跟台史博合作,因為台史博希望能辨識荷領時期在台灣的荷蘭文史料,如果有辦法辨識出拉丁文,我覺得同樣手法可能可以辨識荷蘭文,那這對台灣史的研究也會推進一大步。 以上是以個人研究出發的數文人文以點開始的部分,那第二個部分是串起地方歷史的線,這部分借重胡耿明博士的研究。 胡博士本身是苑里人,所以它對日治時期再苑里創辦櫟社相當有興趣,櫟社是由林獻堂等人創辦的詩社。這個詩社以現在的話來講就浪漫廢柴,根據1921年史料紀載,櫟木這種木頭沒有什麼用,一個不材之木也,所以詩人們創社時就稱自己為廢青,這是一個日治時期的浪漫廢柴詩社這樣子。詩社有許多文裝抗日運動的領導者,像是有林獻堂或是蔡惠如等人,但裡面有一個人大家可能對他不熟悉,就是蔡正豐。 胡博士發現,在研究當蔡正豐先生的生平思想的時候,會發現他的資料很多被竄改過,而且很多謬誤跟殘缺。為了重建蔡正豐的生平,胡博士從苑里市場興建時的史料開始爬梳,因為這個蔡正豐先生曾經在19世紀末,寫了一個對苑里市場的建議,裡面提到他建議這個市場該怎麼蓋。蔡正豐也是櫟社詩人的,但他的很多東西在國民政府來樂後被刻意抹去痕跡,甚至是竄改,關於蔡正豐的敘述,在A史料跟B史料上的呈現會有一些衝突,因此,胡博士以苑里市場為中心,參考各種日記、詩集、聚會紀錄跟當時的台灣日日新報,然後以統計物理的方式重建這個詩社裡面的詩人在地方的這些活動跟地方的參與度,從中找出被抹去痕跡的蔡正豐。 胡博士就用了他原本的演算法分析把詩社的20場聚會,151個人物,重新建構起他們的關係圖。透過聚會出席紀錄算出詩社成員的親疏遠近,並重建他們當時的關係,還有對於地方建設的參與度這樣。以下這個圖是取自於胡博士的研究,圖中間的數值代表他們的親疏遠近,像這個以六代表的人,他跟每個人的關係都超過了一百,代表說關係非常非常遠,所以這圖告訴我們,其他這五個人比較親密,這五個人可能之間還有自己的小團體,但這個六可能就是一個陌生人,可能跟大家都不是很好,所以建構到最後,可以將他剔除。以一個歷史人來說,我不曾想過用數學以及統計物理的方式去重建,但胡博士進一步利用他們之間的關係圖,將其中的小圈圈全都列出來。我認為這個圖對於地方史的重建非常有用,畢竟目前地方史真的比較少人做,如果可以以這種方式跟地方博物館或是當地的文化機構合作,讓原本埋沒的歷史重新以展覽的形式展現給大家知道。 有關地方史的東西,其實現在台灣各地都有努力。以中研院數位文化中心的開放博物館來說,他就集結了不少地方史的線上資料。這個網頁是該網站一些關於櫟社的照片,但是我覺得比較可惜的照片下沒有過多的敘述,可能是礙於沒有太多相關研究,這也是我覺得胡博士的研究很重要的原因,當開放博物館他們拿到這個資料時,他們應該不清楚櫟社之間的人物的關係,所以不會有太多的解釋,照片只會跟你講有誰而已,而且數量也不多,比如說這張林獻堂60歲生日,照片只會跟你講,從由左至右到誰,網站並沒有告訴我們這是第幾次聚會,他們發生了什麼事,或是說其中有哪一些人是特別來參加。雖然可能是礙於沒有史料,但是我覺得如果可以透過數學跟胡博士的研究重建的話,多少可以重建一些更有趣的東西。對地方博物館、圖書館也會有更多貢獻。 大家應該可以看到在開放博物館裡面資料很發散,沒有什麼記憶點,所以最後一個部分我想要跟大家討論線上平台和歷史普及,先給大家一個圖,不知道有沒有人看得出來,這是哪個博物館? 大英博物館。 對,大英博物館,以我在英國待了五年多的經驗,認為英國的博物館很棒,是因為他是免費參觀。如果大家去過歐洲的話,應該知道歐洲是教堂不收費,但博物館要收費的地方,但是英國比較世俗,教堂就要收錢,而且非常貴,之所以不用錢是因為英國認為公共教育不應該分階級,窮人也該有受公共教育以及藝術薰陶的權利,除非是私人博物館,國家建立的博物館全部都是免錢的。從大英博物館作為引子,今天演講最後這部分其從研究端進入到大眾端。前面兩個部分其實比較像是個人研究者的努力,但數位人文多數時候是從研究者自己有興趣的東西出發,而如何把自身研究藉由數位歷史從研究端帶到大眾端,就是博物館跟數位平台的責任,比如說開放博物館。這邊我也會先探討台灣的數位人文平台,並跟Google Arts & Culture以及Europeana做比較,我也會示範不少操作線上平台的方式,那如果各位都有手機的話,待會有一些推薦的程式,大家可以現場下載。再來我會討論各博物館的線上展覽,以及博物館對於AR、VR、MR的應用。 https://i.imgur.com/JFagnUZ.jpg (Photo by Lee Jeffs on Unsplash) 數位平台有研究取向也有大眾取向,以研究取向來說,就有王泰升老師就有參與淡新檔案的數位化,涵蓋下台灣大學的數位人文研究中心下,在早一點的中研院數位人文學研究也有許多研究端取向的資料庫,這對研究者來說非常好用,但一般人不會沒事拜訪中研院的網站。大部分民眾還是透過博物館或線上平台快速學習知識。 我們先從開放博物館開始,這是中研院數位人文中心之下的一個產品,我覺得做的非常好,先前故宮策展水沙連的時候,也跟開放博物館借了非常多的資源。大家也可以看到他的分類很有趣,有主題園區跟展覽,主題園區會再分類,像是自然環境、藝術與人文、民俗與宗教這樣,那我們就隨便點進去一個看好了,藝術與人文,很有趣的一點是,他的entry是以institute來分,比如說這邊就是中央嶺南美術館、故宮博物院、屏東縣政府等等,以一個一個博物館來分大概是因為還有授權跟法律上面的問題。這方面我們希望未來可以進一步整合,把各機構拿掉。 我們再看看開放博物館的線上主題展覽,以媽祖展覽為例,這個展覽做的蠻好的,資料比較多,策展人資源也比較多。這裡也可以連結到各大博物館,比如說鶯歌的陶瓷博物館近期就搭上新冠肺炎的時是列車,展出醫用陶。雖然開放博物館資料很多,但我覺得有一點雜,如果和 Europeana歐洲數位圖書館相比,就有不少進步空間。Europeana很像是歐盟整合概念,將文化歷史藝術的資源整合起來。我們先從他的exhibition開始看,以這個展覽為例,主要講述醫用的植物跟魔法之間的關係,網站提供完整的chapter,從Introduction到第二章、第三章,一直到十章,很像在看一本書。Europeana不止是涵蓋了主題展覽,他還有一個是Europeana classroom,他是給老師們用的,網站也會會介紹你最近的highlightg是什麼,或者是遠距教學有什麼資源可以用。下面會有一些app可以下載給學生玩,例如這個coloring book,可以免費下載整個pdf檔,都是黑白圖畫,然後可以自己去塗色,對於教學者,是一個很好用的數位工具。下面一個很有趣的東西叫get involve,比如說,你可以分享你的color book到平台上。網站也跟一些部落格做結合,例如這個flapper style,講述1920年代新女性的形象,比如說女性自主,flapper這個詞形容追求經濟獨立的女性。網頁中給了詳細介紹,包括影片,然後圖畫等等。那時候的女性其實都還蠻剪鮑伯頭,這東西他們也和時尚史結合一併展出,所以我覺得跟民眾的blog合作也是一個很好的方式。在分類上面,我覺得Europeana是做得比較好,比如說他的入口把institute拿掉了,不用從各機關去入手,直接去找。我再給大家看看他的gallery或是picture。 Gallery大家應該比較熟悉,他會有很多畫的,以這個主題為例,就是聖誕市集,網頁講述聖誕市集的歷史。旁邊這個Section則是有關陰陽太極,我覺得這個很有趣,以google arts來講,他有跟中國故宮合作,但google arts並沒有台灣的故宮合作,這是比較可惜的。從陰與陽這個展覽可以看出Europeana不止是整合了歐洲的東西,也是放了很多東方的元素。Europeana整體上每個作品或展覽的資料都很齊全,比起開放博物館,故事更多更強,那文字敘述也更多,另外互動是app上也做得很好,就是數位人文關鍵,因為他讓觀眾不再只是一個接受,而是主動者、發問者。 接下來要跟大家介紹Google Arts & Culture,先給大家看一下他的某一個展覽,這是我很喜歡的畫家是Botticelli, Google Arts & Culture以藝術品為大宗,集結了很多藝術品,而且這些藝術品可以放大看見畫的紋理,顯示油彩畫的色調。而這一幅the portrait of a lady,那Botticelli的另一幅,是我很喜歡的是春之三女神,可以用游標放大部分畫作,看到細節。但Google Arts & Culture一個最大的缺點是他的文字敘述方面是取自於Wikipedia,因為Wikipedia是任何人都能編輯的。Google Arts & Culture也有出互動的app或是遊戲,這個就是以名畫為濾鏡,讓使用者自拍。如維梅爾的戴珍珠耳環的少女,使用者拍起來就有金髮跟那個頭巾。之前也有梵谷的濾鏡。 (字數超過上限 所以後面放留言)

檢舉{{reportFloor? '留言B'+reportFloor: '文章'}}
檢舉{{'回覆B'+reportFloor+'留言'}}
附件說明
插入圖片

請點文字方塊右下角的 插入圖片,或直接插入 imgur 圖片網址。

https://i.imgur.com/8wlRxfM.png
輸入
顯示

插入 Youtube 影片

直接將影片網址貼上。

https://www.youtube.com/watch?v=wvzfOyW0ZMo
輸入
顯示

分享 Meteor 文章

直接將文章網址貼上。

https://meteor.today/article/8ZgvtS
輸入
您即將進入之文章內容需滿十八歲方可瀏覽

根據「電腦網路內容分級處理辦法」修正條文第六條第三款規定,已於網站首頁或各該限制級網頁,依台灣網站分級推廣基金會規定作標示。若您尚未年滿十八歲,麻煩點選離開。若您已滿十八歲,一樣不可將本區之內容派發、傳閱、出售、出租、交給或借予年齡未滿18歲的人士瀏覽閱讀,或將本網站內容向該人士出示、播放或放映。

離開
回覆 B{{reply.floor}}