數位與人文,看似埋藏衝突、緊張關係的兩個領域,
如何建立合作的夥伴關係?這是本書最核心、也是最根本的提問。
數位科技與人文的結合,並非只是將人文研究引向科學化、實證化,而要帶來更為全面、也更為動態的宏觀式與多點式觀察;不僅有助於拓展人文研究的豐富性,也將刺激研究視角的轉變和研究議題的創新。數位人文學並非提供單一、或單向的研究取徑,更試圖讓不同學科在此一新興領域裡不斷地對話與緊密合作,建立各種維度的知識連結,為知識的創造開拓更多元、璀璨的光譜。
作者簡介:
項潔
國立臺灣大學資訊工程學系特聘教授暨中央研究院資訊科學研究所合聘研究員,同時也是臺灣大學數位典藏研究發展中心主任。他曾出任臺灣大學圖書館館長,投入臺大的數位典藏工作及相關研究應用已十餘年,不僅領導《淡新檔案》、臺灣古契書、日治時期統計資料等重要歷史文獻的數位化與資料庫開發建置工作,完成「臺灣歷史數位圖書館」(THDL),並協助臺灣省諮議會檔案資料庫、國民黨黨史館、慈林教育基金會典藏臺灣社運史料資料庫、和文建會國家文化資料庫的建置。
【作者】
項潔、陳麗華、王汎森、陳淑君、郭巧蓁、張素玢、李鈺淳、杜協昌、王昱鈞、呂翊瑄、蔡宗翰、劉青峰、金觀濤、劉昭麟、彭維謙、劉士綱、翁稷安、陳光華、闕慧貞、李家名、唐國銘、黃乾綱、彭煒明、何靜、宋繼華、胡佳佳
章節試閱
數位人文學之可能性及限制──一個歷史學者的觀察(摘錄)
王汎森(中央研究院院士暨副院長)
一、前言
在44 年前(1968),法國史家勒.華.拉杜里(Emmanuel Le Roy Ladurie)發表了一篇震動一時,卻只有薄薄數頁的短文〈史家與電腦〉。在這篇文章的末尾,他宣稱最遲到80年代,史學家如果想要生存,他或她必須同時是一個電腦程式設計者。我們細看他所列舉非使用資訊技術便無法研究的領域,大致集中在人口史、物價史、家庭史等高度需要計量的史學類別;批評者們則認為這與重視歷史解釋、重視歷史敘述、重視意義發掘的史學互相排斥。但是近十多年的發展,證明拉杜里反而把電腦的功能想得太窄了,電腦不只能計量,它還有許多功能。作為一個歷史學者,我個人完全了解過度依賴數位工具的危險,並且始終相信,對於文本細密而又富想像力地解讀,是研究人文學的首要條件,然而數位技術仍可以發揮畫龍點睛的輔助作用。電腦和史學的傳統技藝不一定互斥,甚至可以尋找到一個新的接榫點。
在下文中,筆者將試圖從一個觀察者的角度,以曾任國家型計畫「數位典藏與數位學習國家型科技計畫」推動者,以及作為歷史研究者的切身經驗,討論數位工具和史家之間的種種可能與限制。本文認為數位技術和歷史研究者之間,應該形成一種夥伴的關係;數位技術不應取代人們對史料的閱讀,而是幫助研究者處理浩如煙海的史料,如同SPSS(Statistical Product and Service Solutions)、SAS(StatisticsAnalysis System)等軟體成為社會學研究者所信任與倚賴的工具。在一般的想像中,往往認為數位領域和人文領域兩者在研究取向上隱藏著不可解的衝突和張力,然而正好相反,兩者應是相輔相成的,數位技術將有助於拓展人文研究的豐富性。只要人文學者善待數位技術這個新的夥伴,與之對話,開發合作的新可能,數位技術將可成為開啟人文研究新天地的重要關鍵與途徑。
二、數位技術應用於人文研究的優勢
一如大家所熟知的,數位技術的優勢在於處理大量資料,前輩史家呂思勉(1884-1957)曾經通讀二十四史,依他的經驗,他從十五、六歲時開始閱讀,至二十三歲始將二十四史通讀一遍。但因正史頗為零碎,匆匆閱覽,真正需要使用時,仍不得不重讀。偉大的史家呂思勉尚且如此,更遑論一般研究者,要在二十四史查找所需資料,是多麼困難與耗費時間。但今日只要在各種電子資料庫裡按下搜尋,便能迅速得到結果。這是過去歷史研究者所無法想像的便利。這並不表示說研究者可以不用閱讀原典,而是數位技術提供的便利,已成為史家在研究過程中重要的幫手和夥伴;我們可以將數位技術的優點,歸結如下。
1. 典藏上的優勢
將實物或文獻資料數位化後,進行典藏的優勢。一是打破儲存空間上的限制,要存放實體的物品或書籍,需要大量的空間,一旦數位化後,只需硬碟便能加以儲存;對個人使用者而言,只要連線至資料庫即可使用,並能將資料儲存至個人電腦或筆記型電腦中,大幅降低存放的限制,也更方便查找和整理。典藏上的另一優勢,在於資料流通的便利,通過網際網路,過去許多要親赴特定館藏地才能接觸、閱讀的資料,在數位化與公開化之後,現在研究者只需一臺能上網的電腦,即可加以使用,大幅增加一手資料取得的便利。很多過去百尋不得、難有機會閱讀的書籍,透過網路的開放和篩選,在今日都很容易取得。經由網路傳遞和篩取的機制,數位技術可以騰清看不見的史料倉庫,將過去被遺忘、不被重視的資料,一振而出,讓被埋沒的舊文獻成為新出的史料。
2. 速度上的優勢
針對檢索的速度而言,數位化拉進了研究者和一手資料的距離。隨著綜合型資料庫的出現,研究者可以同時用特定關鍵字檢索、搜尋多種不同的資料來源,並迅速獲得結果,有些資料庫甚至提供了全文的影像和文字檔,帶給研究者莫大的便利。在這裡要舉一個例子:我因研究清代政治壓力對文化活動的影響,曾經對「一髮千鈞」這個一語雙關的詞(一根毛髮有千鈞之重)是否能在髮禁嚴明的清代使用感到好奇,透過資料庫檢索很快得到結果,該詞在清代果然極少使用。如果單憑人力搜索,這可能要數年以上的時間。
3. 數量上的優勢
利用電腦處理巨量資料(big data)的優勢。如第二點提及的迅速搜尋,以人力閱讀要花費數日、數週,甚至數月的資料量,以電腦進行文字檢索或文字探勘可能在幾分鐘內便可完成。資料量越大,數位技術的優勢越明顯。除了資料量,對資料內部數量的統計,數位技術也有十足的威力,可以就資料中的內容或關鍵字,加以統計,做出量化的分析,可以讓研究者迅速掌握某些字詞背後觀念和現象的發展趨勢,此即由「定量」到「定性」的過程。諸如觀察某些詞彙在特定時代的出現或消失,可以看到時代觀念的變化。過去這個工作非常艱難,而且不容易做出合適的判斷。中研院故院士屈萬里(1907-1979)曾提醒研究者千萬不要輕易做出「沒有」的判斷,因為這是十分危險的。在數位資料庫的協助下,當然還是不能斷言「沒有」,但卻可以指出某些詞彙或現象是相當稀少或近乎於零,數量多寡本身便可以成為歷史解釋的參考或依據。
4. 交流上的優勢
打造一個交流的平臺。提供研究成果發表的管道,諸如網路刊物、電子書、個人部落格、社群網站……,都可以讓研究者發表個人研究或意見,並促成社群的對話。我所服務的史語所,過去曾針對敦煌文書解讀上的一些困難,透過網路廣徵國際專家的意見,很快便得到解答。這並不是說研究者就不用與人接觸;和人交談討論是重要的,胡適考證《紅樓夢》的過程中有一個重要突破,是來自於他在圖書館中偶然與張中孚先生的對話,知道敦敏、敦誠兄弟與曹雪芹的關係,使得他的紅樓研究向前推進一大步。舉此一例可以知道面對面的交流非常必要,但虛擬世界的交流也在不斷擴大其影響,帶來新的對話可能。
5. 教育上的優勢
透過多媒體或如地理資訊系統(Geographic Information System,GIS)等特定軟體,人文研究的成果可以擺脫過去偏重文字呈現的方式,將圖像、影音帶入其中,擴充各種展示的可能。不受限於文字的呈現,不單有助於研究的表達,對於人文教學的貢獻更大,今日的人文教學,圖像、影片、聲音等等不同的表達形式,都已包含在教學者的選項中。譬如「蘭嶼原住民資料庫」裡面記錄了年長婦女教導族人編織的情形。蘭嶼傳統的織布方法正在消失中,過去利用文字描寫要花費極大的篇幅,卻只能收到很有限的成效,現在透過影片紀錄和數位的典藏、傳播,可以很快的收到傳習效果。又或者像3D掃描和印刷技術的發展,對古器物學、美術史、建築史的學習會帶來巨大的改觀。
除了上述五項優點,以下還要進一步申論:在數位時代,史家和史料、史家和歷史解釋、史家和歷史意義的建構和發掘,其間的關係正在巧妙的變化中。如前述的定量到定性,便是很值得注意的例子。郭沫若(1892-1978)在〈金文所無考〉一文,提出「古文獻中有習見之事物而為金文所絕無者,此可為判別典籍之真偽及時代先後之標準。」的主張,並列舉了許多例子,這種從史料所缺之處進行思考,是十分有創意的研究。可是在過去想斷言某樣事物不存在於歷史紀錄中,或非常稀有罕見是十分困難的,如今藉助數位技術處理大規模史料的優勢,人們比較可以有信心地討論史料中所無或所缺少的部分。換句話說,歷史的「空白」處有了重要意義,沒有證據即是一個重要的證據,這是以前不容易辦到的事。雖然我們不敢單憑資料庫就判定有無,但史料分布的稀少和眾多,都將提供研究者各種解釋的可能。
史學研究者總有一種先天的恐懼,想像有些未知的史料藏在不知名的某處,研究者永遠無法知曉其深淺,深怕自己做出推論的依據,只是史料之海的一些片面,擔心還有另一批可以反駁自己的關鍵史料,像潛水艇般潛伏於汪洋的深處,無聲無息,隨時準備偷襲自己。透過資訊科技,研究者和史料間的關係,正逐漸改變,如果史料數位化到一個程度,則史家可以對資料的分布有個大致的了解,知道約略的梗概,就像替史家的武器配上新的準星,以應付龐大史料所構成的「無知之幕」。
數位人文學之可能性及限制──一個歷史學者的觀察(摘錄)
王汎森(中央研究院院士暨副院長)
一、前言
在44 年前(1968),法國史家勒.華.拉杜里(Emmanuel Le Roy Ladurie)發表了一篇震動一時,卻只有薄薄數頁的短文〈史家與電腦〉。在這篇文章的末尾,他宣稱最遲到80年代,史學家如果想要生存,他或她必須同時是一個電腦程式設計者。我們細看他所列舉非使用資訊技術便無法研究的領域,大致集中在人口史、物價史、家庭史等高度需要計量的史學類別;批評者們則認為這與重視歷史解釋、重視歷史敘述、重視意義發掘的史學互相排斥...
作者序
從全球各國數位典藏發展的歷史來看,臺灣開始的不算太早,但也不算晚。暫且不論個別學校、單位或個人的研究和努力,從國科會在1998年以「數位博物館計畫」開始投入國家資源,有系統地發展數位典藏來算,到現在也已將近15年了。在這段不算短的時間裡,我國投入了大量經費,也將大量的文化資產數位化,其中最重要,從2002年開始執行的「數位典藏國家型計畫」,更產生了指標性的作用,讓「數位典藏」在臺灣成為一個大眾語言內的詞彙。
數位典藏國家型計畫的成功,至少有一部分歸功於許多資深且傑出的研究人員,尤其是人文學者,不計報酬地全心投入。但是從大約2005年開始,我們漸漸發覺這些優秀的學者在他們本身的研究中,似乎並沒有充分利用他們花了大量精力數位化的檔案;這令我感到困惑,因為這樣不是事倍功半嗎?為什麼不能將數位化工作和本身的研究結合在一起呢?觀察到這個現象後,我開始去探討它的環節。我發現其中的一個重要原因是數位典藏系統的設計往往沒有考慮到使用者──尤其是研究者──的需求,以致於一直到現在絕大多數的研究者還是認為檢索系統只能幫他們找資料罷了,而不能幫忙整理或分析資料。這是很可惜的,因為許多資訊技術已經十分成熟,如果能夠與數位檔案結合並有效地運用在這些系統中,應對人文研究產生非常大的助益。在更進一步的探討後,我發現這個問題並不是臺灣獨有的,在國外亦有學者思考這個問題,而且已有一個研究社群,那便是「數位人文」。
用最簡單的話來講,「數位人文」就是結合大量數位材料,運用資訊科技,來從事人文研究。顧名思義,這是一項跨領域整合的工作。要達到這個目標,除了要有大量高品質的數位資源可供使用外,更需要人文學者與資訊學者密切的互動與合作。有鑑於此,國立臺灣大學數位人文研究中心從2009年開始舉辦的「數位典藏與數位人文國際研討會」,希望藉由這個會議,不但能夠介紹世界最新的研究成果,並能提供國內外人文與資訊學者交流的機會,讓臺灣的數位人文研究能夠遍地開花,並與國際接軌。
《數位人文研究叢書》即是會議產出的一項成品。叢書中的每一篇文章均在研討會中發表過,再經修改及至少兩位審查人的審查通過。在此特別感謝臺大數位人文研究中心的蔡炯民博士、陳怡君小姐與全體同仁對本叢書投注的心力。我們希望透過這個系列的叢書,提升國內學界對數位人文的認知,並激發進一步的研究。
項潔
2011年9月於臺大
從全球各國數位典藏發展的歷史來看,臺灣開始的不算太早,但也不算晚。暫且不論個別學校、單位或個人的研究和努力,從國科會在1998年以「數位博物館計畫」開始投入國家資源,有系統地發展數位典藏來算,到現在也已將近15年了。在這段不算短的時間裡,我國投入了大量經費,也將大量的文化資產數位化,其中最重要,從2002年開始執行的「數位典藏國家型計畫」,更產生了指標性的作用,讓「數位典藏」在臺灣成為一個大眾語言內的詞彙。
數位典藏國家型計畫的成功,至少有一部分歸功於許多資深且傑出的研究人員,尤其是人文學者,不計報酬地...
目錄
序
Preface
導論
Introduction
數位人文:學科對話與融合的新領域
An Interdisciplinary Dialogue through Digital Humanities
◆項潔、陳麗華
數位人文學之可能性及限制──一個歷史學者的觀察
The Possibilities and Limitations of Digital Humanities: A Historian's Perspective
◆王汎森
Part I 知識組織
Knowledge Organization
數位典藏的知識組織系統之模式建構與應用研究──以故宮中國節慶詞彙為例
A Study of Knowledge Organization System for Digital Archives in the National Palace Museum Collections of "Chinese Festivals"
◆陳淑君、郭巧蓁
資料擷取與描述比對──清代臺灣方志物產篇分析系統之建置與解釋
Data Extraction and Mapping: The Taxonomy of Fauna and Flora of Taiwan Local Gazetteers in the Qing Dynasty
◆張素玢、李鈺淳
Part II 文本探勘
Text Mining
利用文本採礦探討《紅樓夢》的後四十回作者爭議
A Text-Mining Approach to the Authorship Attribution Problem of Dream of the Red Chamber
◆杜協昌
漢文文獻之外來語音譯詞擷取方法
Transliteration Extraction Methods for 19th Century Chinese Literature
◆王昱鈞、呂翊瑄、蔡宗翰、劉青峰、金觀濤、劉昭麟
自動擷取中文典籍中人名之嘗試──以PMI(Pointwise Mutual Information)斷詞於《資治通鑑》的應用為例
Automated Name-extraction in Chinese Classics: Applying PMI (Pointwise Mutual Information) Segmentation to Zizhi Tongjian
◆彭維謙、劉士綱、杜協昌、翁稷安、項潔
Part III 語料分析
Corpus Linguistics
藏漢佛教語料品目之自動對列
Automatic Chapter-level Alignment for Tibetan and Chinese Buddhist Texts
◆陳光華、闕慧貞、李家名、唐國銘、黃乾綱
句本位語法圖解析句系統的設計與實現
The Design and Implement of Diagrammatical Sentence-based Grammar Parsing System
◆彭煒明、何靜、宋繼華
漢字構形系統的網絡分析──以《說文解字》小篆構形系統爲例
Network Analysis of Chinese Ideography : The Formaiton of Seal Script in Shuowen Jiezi
◆胡佳佳
序
Preface
導論
Introduction
數位人文:學科對話與融合的新領域
An Interdisciplinary Dialogue through Digital Humanities
◆項潔、陳麗華
數位人文學之可能性及限制──一個歷史學者的觀察
The Possibilities and Limitations of Digital Humanities: A Historian's Perspective
◆王汎森
Part I 知識組織
Knowledge Organization
數位典藏的知識組織系統之模式建構與應用研究──以故宮中國節慶詞彙為例
A Study of Knowledge Organization System for Digital Archives in the National Palace Museum Col...
購物須知
電子書閱讀方式
您所購買的電子書,系統將自動儲存於「我的電子書櫃」,您可透過PC(Windows / Mac)、行動裝置(手機、平板),輕鬆閱讀。
- Windows / Mac 電腦
- 請先安裝瀏覽器,並以Chrome開啟我的電子書櫃後,點選『線上閱讀』,即可閱讀您已購買的電子書。建議使用 Chrome、Microsoft Edge有較佳的線上瀏覽效果。
- 手機/平板
- 請先安裝 電子書APP後,依照提示登入「會員中心」→「電子書管理」→「電子書APP通行碼/載具管理」,取得APP通行碼再登入APP,下載您所購買的電子書。完成下載後,點選任一書籍即可開始離線閱讀。 APP 適用版本:iOS 14.2 或以上版本,Android 6.0 以上版本。
注意事項:
使用讀冊生活電子書服務即為同意讀冊生活電子書服務條款。
下單後電子書可開啟閱讀的時間請參考:不同的付款方式,何時可開啟及閱讀電子書?
因版權保護,您在TAAZE所購買的電子書/雜誌僅能以TAAZE專屬的閱讀軟體開啟閱讀,無法以其他閱讀器或直接下載檔案。
退換貨說明:電子書、電子雜誌商品,恕不提供10天猶豫期退貨,若您對電子書閱讀有疑慮,建議您可於購買前先行試讀。並於訂購本商品前請務必詳閱電子書商品退換貨原則。