本書由數位治理學界以及實務界專家所共同攜手打造完成,結合數位治理的理論與實務的內容,為一本兼具知識性與應用性的學術專書。而全書分為十六章,前八章為理論建構的篇章,將介紹資料治理策略、管理、技術與法律等四大面向的發展,而後八章則為實務個案演練的篇章,則將分享中央政府與地方政府在資料治理應用上的經典成功案例,包括健康保險、緊急醫療、防災救災、長期照顧、環境保護、社會企業、交通運輸、民意陳情等不同個案。期待透過本書的討論,能使讀者與世界接軌,並瞭解資料治理的加值效果,迎向數位科技新時代。
作者簡介:
主編群簡介
朱斌妤、陳敦源、黃東益 教授
蕭乃沂、廖興中 副教授
國立政治大學公共行政學系
曾憲立 助理教授
國立臺南大學行政管理學系
黃妍甄 博士候選人
國立政治大學公共行政學系
推薦序
推薦序──資料治理有智,數據公益有理/唐鳳
本書是繼《政府數位轉型:一本必讀的入門書》之後,數位治理學界與實務界再次攜手共創的智慧結晶。這次作者群聚焦於「政府資料治理」,再度展現出深厚的專業素養。
如果把數位轉型比擬為工業革命,資料正是轉動時代巨輪的新能源;也如能源的開發與運用,攸關產業發展的成敗一樣,資料治理可謂數位轉型的關鍵基石。
今日,隨著影音及語言模型的普及,舉凡翻譯、客服、行銷、創作等各行各業,都受到生成技術的衝擊。猶如精煉技術的躍升,讓化石燃料擺脫點燈取暖等原始用途,不但煉製出陸海空載具的強大動力,更產生無數塑化產品,進入食衣住行育樂各個生活層面;基礎模型(foundation models)的盛行,促使全球爭相投入資料的應用發展,揮灑出無窮無盡的創意。
然而,正如石化產品引發氣候危機與生態浩劫,以致追求潔淨能源成為世紀挑戰;基礎模型從訓練到應用都與巨量資料息息相關,如果沒有良善的治理基礎,數位生態浩劫可說是迫在眉睫,眼前的互動深偽詐騙只是冰山一角。
有幸的是,國際間正高度關注治理議題,期待法制倫理與技術齊頭並進。今年4月底在日本舉辦的七大工業國(G7)數位技術部長會議,即發表聯合聲明,宣示將促進「以人為本」的公益價值,反對威脅民主、自由、人權的不當應用。聲明呼應了《民主峰會宣言》與《未來網際網路宣言》的精神,指出建構「數據自由流通可信」(data free flow with trust, DFFT)的機制,是跨境協作的首要之務。
換句話說,面對基礎模型等快速發展的技術,即便對人權與民主的侵害存有疑慮,「自由流通」仍然是跨境資料治理的首要價值,而非深溝高壘地打造孤島,更不會返祖地透過政府監管,一昧拒卻數據流通,讓先進國家變成「先禁」國家。
聲明提出的「運用創新機會」、「法治」、「正當程序」、「民主主義」、「尊重人權」五大原則,一言以蔽之,就是「以人為本」—堅定捍衛個人作為資料主體的價值與保障。如同家喻戶曉的寓言故事,各國政府如果不能誠懇面對遺落的鐵斧頭,也就不可能得到金銀斧頭的獎賞。
數位發展部在各界期待下成立,肩負「政府數位服務、資料治理與開放」使命。作為法制與倫理規範的輔佐,我們推動隱私強化技術(PETs)、積極輔導電商及物流業者導入,正是為了降低個資外洩的風險。
而觀察國際趨勢,歐盟近來提倡透過隱私強化處理,主動將高應用價值的資料,轉化為無涉個資的資料(即「數據」,non-personal data),以促進各界應用、創造公共利益。
以我國而言,舉凡氣候環境、災害防救、交通運輸、健康醫療、能源管理、社會救助等公益應用,在data.gov.tw平臺上都有對應的「高應用價值」主題,啟發源源不絕的創新方案。過去十年,平臺吸引了1億1,300萬次瀏覽、下載超過1,900萬次,更透過「總統盃黑客松」等活動,成為全民共創的實踐。
換言之,本書引述的「石油論」怕只說對了一半;石油與礦產是競爭財,然而數據正好相反,具備「非排他性」和「非競爭性」,在健全法制與隱私強化技術打造的治理環境下,更能發揮「反競爭財」(anti-rival good)的特性:愈分享價值愈高,對個人和世界都有貢獻。
也就是說,只有在自由流通的可信環境裡,歐盟《資料治理法》(Data Governance Act, DGA)提出的「數據公益」(data altruism)理念,才有落實的可能:由各方持有者自願提供數據,帶動社會發展,提升公共服務品質。
隨著基礎模型普及,本書第十章「資料民主化」的願景即將實現,每個人都可望成為生產者和使用者,「資料治理」也一躍成為數位發展的核心議題。相信本書的出版,必定能引領各界,讓資料治理有智有理—惟有集眾人之智,才能連結彼此、促成良善的共創協作關係,成眾人之事,實現有理有節的「數據公益」。是為序。
推薦序/行政院人事行政總處人事長 蘇俊榮
2022年11月底,ChatGPT面世,在兩個月內吸引了超過1億人使用,帶起勢不可當的狂潮。雖然以AI技術發展進程而言,ChatGPT當時只是多前進了一小步,但是這一小步為世界帶來無盡可能:有些人討論著各種運用和「咏唱」的可能性,編織起無限的想像;也有些人懷疑著,擔憂著人類是否即將被AI給取代,甚至主宰。無論樂觀或悲觀、保守或激進,不可否認地,科技的發展,正在以無與倫比的速度帶著我們向前,無論是主動躍進或是被被動牽引。
然而,我們也需要明白,成就AI如此強大的基礎,「資料」是必要的。如同人類需要透過經驗學習累積知識、養成技能,AI,或者是演算法,如果沒有資料輸入,其本身就只是作為「工具」的意義存在,無法成就「價值」。如果接收的是錯誤不全的資料,也只會garbage in, garbage out,產出無意義的結果。「資料」是重要的,從過去到現在都是。過去,政府機關、私人企業需要保存資料,以備業務需要時查證考據。現在,政府機關、私人企業需要保存資料,是因為透過資料的發掘,可以更客觀地瞭解過去,改善現況,有時甚至能夠洞察先機。甚至我們可以說,「資料」的價值,遠比過去所想像重要得多!關於這件事,善於盜取機密、竊賣個資的間諜、駭客,可是早就清楚得很!
二十多年前起,財政部陸續推動電子發票及網路報稅系統,就是從規劃、取得、處理、分析、保存到分享,讓資料走出檔案室的深宮秘院、步上雲端,透過積極建立跨單位、跨機關的橫向連結,充分運用政府資料,提供民眾更好、更便捷的服務,創造更多公共價值。如今,公部門數據分析應用當道,業界更是毋庸多提,早已先行在前。那麼當新的時代來臨,大家都在摩拳擦掌、躍躍欲試時,難道說,只要say yes 就能從此一切順利、幸福美滿?究竟,需要什麼樣的認知和準備?
本書從資料生命週期的觀點切入,結合國內及歐美國家的管理實況,從策略面、管理面、技術面和法律面帶領著讀者思考資料治理的本質,以及公部門資料治理的現狀、所面臨的挑戰和可能的方向。除此之外,亦納入了健保署、交通部、雙北、高雄等中央與地方、行政與醫療、服務與執法等不同面向的實務案例。透過結合理論和實踐個案的探討,相信將有助讀者對「政府資料治理」,描繪出更具體、清晰的輪廓。
推薦序──資料治理有智,數據公益有理/唐鳳
本書是繼《政府數位轉型:一本必讀的入門書》之後,數位治理學界與實務界再次攜手共創的智慧結晶。這次作者群聚焦於「政府資料治理」,再度展現出深厚的專業素養。
如果把數位轉型比擬為工業革命,資料正是轉動時代巨輪的新能源;也如能源的開發與運用,攸關產業發展的成敗一樣,資料治理可謂數位轉型的關鍵基石。
今日,隨著影音及語言模型的普及,舉凡翻譯、客服、行銷、創作等各行各業,都受到生成技術的衝擊。猶如精煉技術的躍升,讓化石燃料擺脫點燈取暖等原始用途,不但煉製出陸海...
作者序
編者序──資料治理,政府數位轉型的絕對必要基礎建設!
主編群
朱斌妤、陳敦源、黃東益、蕭乃沂、廖興中、曾憲立、黃妍甄
「資料是人工智慧發展的營養,
當人工智慧只能吃垃圾食物時,別期待它會有優質的表現。」
──馬修.艾馬瑞克;美國籍資料品質分析師
●資料是什麼?一個尋找理論與實務知識進化的基準點(datum)
很多人可能不知道,英文的“data”是一個複數形式,它的單數形是“datum”,這個字來自拉丁文“datum”,其意義是「一個既存的基礎」(a given),它可以是一組不能隨意修改的標準,或是人類之間進行知識溝通時大家所同意的資訊基礎。比方說,文藝復興時代藝術家畫透視圖時會先畫出兩條「基準線」(datum line),就是這個意思;另外,在工程領域,所謂「工程基準」(an engineering datum),意指在幾何學的框架中,先設定一組基準點或架構,以利於工程師在開發物件時進行測量或評估的標準;甚至在20世紀上半葉,當時科學管理的風潮正夯,社會科學領域意圖向自然科學看齊,希望可以為自己領域找出類似自然科學學者溝通研究內涵時之一組屬於社會科學知識領域的「基準焦點」(primary datum; Bloch, 1943),作為知識進步的基礎;從上述所謂資料的語意考究之後,我們可以看見在知識發展的過程中,資料不只是一組被機器儲存的數字,而是隱含了人類知能進化的奧祕。
早在這一波1990年代末期因數位化快速進展而出現的大數據(big data)風潮之前,美國政府在1970年代就已經意識到政府當中儲存的大量資料,除了放在倉庫裡當作檔案之外,應該可以經過整理對於政府公共政策決策進行「事實的服務」(fact service; Wood, 1977: 33),它是政府資訊機構除了蒐集與儲存資料外,應用資料提供政府政策制定時「答案服務」(answering service),很明顯地,這是一種政府內部的幕僚服務,其目乃是經過系統性應用政府的資料,用以增加政府決策的客觀性的價值,以期能夠平衡公共決策時單單以政治權力競逐為決策的考量,如此才能真正處理棘手的公共問題;事實上,那時的有識之士早已看見,這將會是影響並且改變政府結構、過程與任務的一項不折不扣的「資料革命」(Shuman, 1975),這個預言在1990年代因為儲存科技的不斷精進、個人裝置的普及化以及運算能力的不斷突破下,資料革命重新以「大數據」之名,而真正降臨到人間。
●人與資料之一:懷疑是智能的開端?(Wonder is the beginning of wisdom.)
21世紀資通訊科技快速發展下,深深影響人類社會未來各個層面的福祉,政府高唱「數位轉型」(digital transformation)之下,一方面,不論政府想要追求什麼新興資通訊科技的做法,手中資料的良窳是數位創新成功與否的關鍵,英國政府資訊辦公室於2020年出版了一本名為《公部門AI應用指引手冊》(A Guide to Using Artificial Intelligence in the Public Sector)中,開宗明義就提出,AI看似萬能,但卻無法在缺乏「量大、相關且質精的資料」(without a large quantity of relevant, high quality data; p. 10)下好好發揮;另一方面,當資料被政府用來推行疾病偵測、政治課責、新聞傳播、學術發表、競爭標準、犯罪防治等各方實務應用時,人類當然不會只是接受資料控制,像是一個服膺廣博理性假設下的「理性笨蛋」(Sen, 1977)而已,相反地,即便有資料,人們還是會判斷錯誤,或是以隱藏、美化、甚至造假的手法來意圖影響他人。嚴格說起來,炫麗的科技樂觀論,需要扎實的資料治理來避免淪為幻想。
很多討論AI應用的科普書籍都會提到一匹名叫漢斯的馬兒,他是19世紀末20世紀初德國飼主奧斯丁先生(Wilhelm von Osten)的一匹馬,牠因為能在大庭廣眾面前算數而成名,人們不但稱這匹馬為「聰明的漢斯」(clever Hans),也對於動物智能的發展充滿期待。奈何一位名叫方格士特(Oskar Pfungst, 1873-1932)的心理學家用證據點出,那匹馬與飼主之間有特殊的暗號連接,因此他認為這不是訓練動物變聰明的技術,而是應該放到馬戲團來取悅觀眾的魔術。準此,政府導入AI技術協助治理(比方說,2022年底面世即爆紅的ChatGPT),不論是政府官員還是一般民眾,對於整個過程中機器是如何被訓練的認知是空白的,因此我們無法排除爆紅AI的戲碼存在被心理學稱為「聰明漢斯效果」(The Clever Hans Effect;意指生物或機器智能現象的成因,可能非自主地來自於其創造者的影響)的可能,而旁觀者無知的肇因之一,正是很少懷疑資料處理過程的黑箱裡到底藏了什麼東西。
●人與資料之二:你不知道你無知的事?(You Don’t Know What You Don’t Know)
當然,即便前述聰明漢斯的主人有欺騙的意圖,但是當人們將手邊既有的資料餵給機器,希望它們可以學人一樣長大的想法,也有發生無知偏誤的可能;事實上,不論機器學習的場域是在「監督或非監督式」(supervised vs. unsupervised learning)的場域中,為各種物質、生物、甚至人類自己進行分類命名,仍然是非常龐雜與困難的工作,不論是機器學習的監督者或是讓機器自己產生,都會有人類無法察覺的偏誤;這就是為什麼前面提及英國政府2020年提出的《公部門AI應用指引手冊》中,也有特別提到,政府導入AI處理公共事務,應該也像人辦事一樣,需要滿足「可解釋與透明性」(explainability and transparency; p. 12)的公共價值要求,其目的是讓該項含有AI輔助的政府服務或管制項目,對利害關係人(stakeholders)來說都應該是輕鬆可知的,這個時候,政府一方面應用手邊的資料協助治理的工作,另一方面要面對利害關係人訂出一套可以讓資料產製與使用過程完全公開之治理資料的行政流程。
在機器學習圈一直流傳著一個很有趣的實驗:「哈士奇或野狼」(husky or wolf),它是來自三位美國華盛頓大學(University of Washington)教授的研究(Ribeiro et al., 2016)。他們用非監督的方式訓練一個電腦圖像辨識系統(classifier),目標是分辨照片中的動物是野狼還是哈士奇。他們故意餵給機器的野狼照片的背景都是在雪地,很成功地完成測試後問同學對這個辨識系統的看法,大家看到結果後都表達非常相信AI能做這樣的事;當老師使用一張哈士奇在雪地的照片而AI錯誤指認為狼時再提問,同學仍舊相信這樣的錯誤本來就是可以被容忍的。不過,當老師將這個辨識系統到底是看見什麼畫面做判斷公布出來時(圖2),大家才明白AI在有偏誤的資料庫中做出看似高機率的正確判斷時之內在邏輯可能根本是錯的;不過,即便是如此直接告知,還是有大約一成的學生仍然相信這個「偏誤」的辨識系統。因此,面對機器學習,我們不會知道我們無法窺知的機器分類細節是否是錯誤的。
●資料治理:開啟起資通訊科技有效應用的核心管理武器?
有趣的是,如果我們把本序一開頭所引用的論述,與前面談到「聰明的漢斯」及「哈士奇或野狼」的故事連接起來看,政府組織面對日新月異的資通訊科技發展,不論在人力資源的才能(talent)還是創新知識的獲取上,都存在明顯的落差,因此,要如何確定漢斯的主人沒有譁眾取寵、或漢斯吃到的飼料是否能增長智慧的關鍵,在於政府組織是否能夠從內到外,建構一套嚴謹靈活的資料治理政策框架;接著再配合上業務專業、資訊科技、財務資源、方案管理、組織設計,以及績效評估等綜合性的能力,協助組織在「數位轉型」的大旗下,當資料治理在政府導入各種AI工具時,不但可以知道資料的來源、品質與其限制,還能夠藉由對外公開資料處理的過程資訊,讓使用者可以迅速找出資料本身、演算法或資料處理流程中偏誤之所在,當然,正因為政府應用資料的處理過程是可解釋且透明的,受決策影響之利害關係人會因權益被充分保障而信任政府科技應用的相關作為。
本書的出現,剛好是在2022年下半年中央政府成立數位發展部之後,除了早已經宣示未來在數位轉型上的政策:「資通安全」、「資訊產業發展」(數位發展部數位產發展署專門負責軟體部分)等大方向之外,臺灣數位治理研究中心藉本書提出「資料治理」當作數位發展部另一個業務的重點,以延續過去從政府辦公室自動化、電子化政府,到數位治理的過程中,政府應用資通訊科技推進變革的傳統;當然,這也代表過去十五年間,本中心與政府協力推進各種數位轉型變革經驗累積下的一個綜合性倡議;事實上,正如前述“data”的字根意義,資料治理就是政府數位轉型在理論與實務上的「知識基準點」,雖然政府在資料治理的議題上已經零星地推動了開放資料及其相應辦法來回應所面臨的相關問題,而本書希望讓這些回應行動更加系統化,包括資料的法規、資料的跨域協調、資料的生產—保存—銷毀,以及資料庫維持的經費與人才管理,我們認為,資料治理不但是政府走向循證決策的關鍵,也是追求智慧政府的下水道工程。
本書囊括了九位不同領域的學者、七位政府第一線的實務工作者以及兩位實務工作者的集體智慧,以理論、行政、技術與法治的10個章節為經,另外以實務的八個個案章節為緯(包括健保、災防等領域),編織出共16章近20萬字組成的政府數位轉型之知識基準點,其目的有三:其一,如果智慧政府是各國無法回頭的未來政府發展態勢,那推動的公務人員們一定要有「沒有好的資料治理就無法建構智慧政府」的認知;其二,如果資料是未來世界的新能源,政府管理最重要的任務之一,就是推動政府組織新能源的良善開採、精煉與應用的功夫;其三,如果資料治理是政府數位轉型的核心任務之一,推動的過程需要結合跨領域的知識才能成功落實其良善的本質,綜括來看,本書的基礎框架都在鋪陳在第一章之中,因此,我們強烈建議讀者應先讀完第一章,以便能迅速進入本書對於政府資料治理的論點經緯;最後,我們要感謝本書一年多來的成形過程中參與寫作的實務專家與學校老師們的大力協助,還有黃妍甄博士候選人以及數位治理研究中心相關人員在幕僚作業與聯絡上的幫忙,以及五南圖書劉副總編輯靜芬與其編輯團隊的大力協助,沒有你們本書是無法上市的。
2023年3月8日完稿於貓空山下的政治大學
編者序──資料治理,政府數位轉型的絕對必要基礎建設!
主編群
朱斌妤、陳敦源、黃東益、蕭乃沂、廖興中、曾憲立、黃妍甄
「資料是人工智慧發展的營養,
當人工智慧只能吃垃圾食物時,別期待它會有優質的表現。」
──馬修.艾馬瑞克;美國籍資料品質分析師
●資料是什麼?一個尋找理論與實務知識進化的基準點(datum)
很多人可能不知道,英文的“data”是一個複數形式,它的單數形是“datum”,這個字來自拉丁文“datum”,其意義是「一個既存的基礎」(a given),它可以是一組不能隨意修改的標準,或是人類之間進行知識溝...
目錄
推薦序/唐鳳
推薦序/蘇俊榮
編者序
作者群簡介
PART1 理論建構
策略篇
第1章 何謂資料治理?/朱斌妤、李洛維
第2章 為何資料治理是政府數位轉型成敗的關鍵?/陳敦源
管理篇
第3章 資料治理對政府組織的影響與挑戰/曾憲立
第4章 政府如何克服資料治理的挑戰:策略、程序與實踐/蕭乃沂、黃東益
技術篇
第5章 Open Data分析運用理想與現實的貼近/廖興中
第6章 從資料治理到風險管理/劉嘉凱
法律篇
第7章 歐盟資料開放邁向資料治理法制對我國之啟示/戴豪君
第8章 人工智慧與資料主權/張濱璿
PART2 個案演練
第9章 健保資料治理、利用與跨域合作/衛生福利部中央健康保險署
第10章 救急救難一站通:資料開放、資料民主與資料治理的公私協力旅程/陳昭文
第11章 一站式智能防災利器:全災型智慧化指揮監控平臺(EDP)/羅凱文
第12章 銀髮天使:銀髮安居需求指數/饒志堅
第13章 智慧空氣品質監測資訊服務/黃俊銘
第14章 小驢行:新北市長照交通大平臺/侯勝宗
第15章 交通部運輸資料流通服務(TDX)/王穆衡
第16章 HELLO TAIPEI:臺北市單一陳情系統/黃銘材
推薦序/唐鳳
推薦序/蘇俊榮
編者序
作者群簡介
PART1 理論建構
策略篇
第1章 何謂資料治理?/朱斌妤、李洛維
第2章 為何資料治理是政府數位轉型成敗的關鍵?/陳敦源
管理篇
第3章 資料治理對政府組織的影響與挑戰/曾憲立
第4章 政府如何克服資料治理的挑戰:策略、程序與實踐/蕭乃沂、黃東益
技術篇
第5章 Open Data分析運用理想與現實的貼近/廖興中
第6章 從資料治理到風險管理/劉嘉凱
法律篇
第7章 歐盟資料開放邁向資料治理法制對我國之啟示/戴豪君
第8章 人工智慧與資料主權/張濱...
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。