「出一張嘴」就能做到一切的時代即將來臨,
聲控將取代觸控,語音裝置將取代智慧型手機!
◆第一本關於聲控經濟的重量趨勢書◆
◆2019美國消費性電子展(CES)最熱話題◆當搜尋只能提供一個答案,搜尋排名與關鍵字廣告該何去何從?
當語音機器人直接告訴消費者答案,消失的網站流量會造成多大衝擊?
當語音助理可以為使用者服務一切,誰還需要下載五花八門的App?……
下一波最主要的科技變革,將為你我帶來全新的衝擊與想像!
●2021年,全球語音識別市場將逼近160億美元
●2020年,50%的手機搜尋是透過語音進行
●遊戲、搜尋、購物、外送、App使用行為將徹底變革
你是否想像過靠語音開啟的一天?語音助理在預設的時間喚醒你,提醒你今天早上的會議地點,順便幫你在星巴克訂購一份早餐,為你規劃不塞車的通勤路程,同時告知哪裡還有空的停車位……。
這些囊括生活每個層面的商機,早已是Google、亞馬遜(Amazon)、蘋果(Apple)與微軟(Microsoft)的兵家必爭之地,
下一波科技巨浪──語音運算(voice computing),將引發購物、搜尋、廣告、語音助理等眾多產業的海嘯,
例如語音購物的總產值現在是一年20億美元,到了2022年將成長到400億美元;
家裡有亞馬遜Alexa裝置的人,每年花費在亞馬遜商城的錢更比一般消費者多出66%!
本書全面而完整地探討聲控經濟,從第一篇的科技巨頭之戰,到第二篇的語音技術如何突破,再到第三篇聲控對於人類生活的深層影響,
包括聲紋紀錄造成的隱私議題,語音助理的情感倫理問題,甚至聊天機器人如何讓已逝者永垂不朽……,
本書將讓我們看見這波驚人的商機與石破天驚的變化。
作者簡介:
詹姆士.弗拉霍斯James Vlahos
知名科技記者,於《紐約時報雜誌》(New York Times Magazine)、《科學大眾》(Popular Science)、《科學美國人》(Scientific American)、《國家地理》(National Geographic)等著名媒體,皆有刊載採訪報導。2017年,他運用聊天機器人技術創造出模仿父親的「爸爸機器人」(Dadbot),讓逝去的父親陪伴在自己身邊,整個故事刊載於《連線》(Wired)雜誌後,獨樹一格的新意與感人肺腑的字句,迅速引爆廣泛迴響與媒體關注。本書即是他長期以來針對語音人工智慧的第一手訪談與研究資料的精華。
譯者簡介:
孔令新
.國立台灣師範大學翻譯研究所會議口譯組
.第七屆海峽兩岸口譯大賽一等獎得主
專業中英會議口譯員,從事自由口筆譯,認為語言是人類獨有的天賦,口筆譯師在兩種語言、兩種文化之間來回穿梭,把一方的想法與故事分享給另一方,是個任重而道遠的工作。
章節試閱
各大企業爭相成為使用者的單一介面
一九九○年代,網路世界是一個封閉的地方。許多使用者都用像是美國線上這類入口網站來管理自己的網路瀏覽需求,把資訊都集中在同一個入口網站上,並且列出有用的外部網站,藉此瀏覽體育資訊、金融資訊等。使用者大多都是在封閉的環境裡上網,這種生態也因此稱為「圍牆花園」(walled garden)。後來,Google用鐵鎚擊破圍牆,推出搜尋引擎,讓大家可以自行在網路世界裡輕易找到想要的網頁。從此以後,我們便能在整個網路世界裡自由翱翔。
但是過去幾年來,有一件奇怪的事發生了。Google和亞馬遜竟然在重建花園的圍牆。Google推出即時回答,讓使用者有時候不需要跳出搜尋結果頁面,就可以得到想要的資訊。Google和亞馬遜也都設計出自家的語音助理。語音助理就是一種入口網站,像是數位行銷商Huge的創意總監蘇菲‧柯列伯(Sophie Kleber)說道:「Alexa就是語音世界的美國線上。」
Google助理與Alexa平台上許多熱門的應用程式,也都是Google或亞馬遜自行設計的。要用第三方應用程式,使用者必須先經過Google助理或Alexa。例如,使用者通常會用所謂的「呼喚語」(invocation phrase)呼叫Alexa技能。使用者可能會說:「Alexa,我要聽《華盛頓郵報》的頭條」,或是「Alexa,玩《危險邊緣》」。同樣地,Google助理的使用者也會說:「打開Yelp」或「ESPN上有什麼新聞?」
如果使用者知道自己要用哪一個語音應用程式,這樣的模式就沒有什麼問題;但是如果使用者不知道自己要用的是什麼,會如同矇上眼睛在飛行,就像在沒有搜尋引擎協助的情況下,要找到新的網站。如果使用者詢問的問題或是說出的指令沒有指明要用哪一個應用程式,Alexa或Google助理就會自行決定該如何回答問題或執行指令。如此一來,Google和亞馬遜就握有強大的權力,能夠主導語音流量的去向。
這樣的模式看起來就很像是以前的圍牆花園,會形成這樣的模式,其實也不一定是因為亞馬遜或Google本身渴望握有控制權,但是這些企業肯定很享受這樣的權力所帶來的利益。在語音的世界裡,本來就適合以單一數位實體掌控一切,Siri的原始研發團隊肯定支持這樣的想法。如果沒有一個主宰的語音助手,所有的語音應用程式都會是獨立開發,這樣一來,每個應用程式都有自己的名字、自己的獨特功能、自己的一套指令。「我覺得大家不可能記住數萬個不同的名字和數萬套不同的指令。」切爾說道:「這種模式先天就無法規模化。」
切爾與基特勞斯離開蘋果後,創辦Viv。Viv追求的是另外一個目標:創造獨立運作、全知全能的助理。Google和亞馬遜雖然很明顯地漸漸在扮演資訊守門人的角色,但是它們本身不想要被大眾當成資訊守門人。但是Viv不一樣,該公司開宗明義就明白宣告,他們的目標就是要做出全能的助理——終極的電腦,有了它,就不需要其他的電腦了。的確,Viv的科技其實已和第三方應用程式配合,畢竟切爾一直以來的運作模式都是如此,但是第三方應用程式都是在背後暗中來,使用者不會看到。使用者只會和一個助理互動。Viv在二○一八下半年推出,裝載在全世界數百萬台三星裝置上。
「這是一場競賽。」吉特勞斯說道:「各大企業相爭成為使用者的單一介面。」
各大科技公司表現大盤點
Viv擁有強大的科技,因為它使用的科技是語音助理這個領域最初的先鋒所研發的,但是因為進入市場時間較晚,算是競賽中的一匹黑馬,和其他競爭者競逐成為主導介面。這場競賽在幾年前還似乎比較開放,大家都可以來競爭,但是現在競賽已經比到某種程度,占有優勢的參賽者已經出線了。
現在,我們來盤點每家公司的表現。首先是蘋果,Siri是全世界普及的數位助理,平均每個月接獲的指令數高達一百億則,而且支援二十多種語言。
這是好消息,但壞消息是蘋果並未遵照原始創辦團隊的構想行事,所以Siri並沒有發揮應有的實力。許多科技評論家都開始批評Siri,Siri儼然成為語音人工智慧界的眾矢之的。評論寫道:Siri「很糊塗」又「很難堪」(《華盛頓郵報》);「蘋果錯失的最大契機」〔《休士頓紀事報》(Houston Chronicle)〕「有重大缺陷」(《紐約時報》)。科技分析家傑雷米‧歐陽(Jeremiah Owyang)在接受《今日美國》(USA Today)訪談時表示:「感覺蘋果好像完全放棄了Siri。」
這麼說是有點過頭了,但是蘋果的確該受到批評。蘋果原本是語音人工智慧的領頭羊,但是現在卻落後了。蘋果直到二○一八年二月才推出自家的智慧音響HomePod,比Google Home慢了將近一年半,比亞馬遜Echo慢了整整三年半。HomePod推出後,評論家對其音質表示讚賞,但也提到HomePod價格高昂的問題——一台HomePod要價三百四十九美元,亞馬遜Echo只要九十九美元;而且許多評論家也對Siri提出批評,表示HomePod上的Siri性能很差勁。到了二○一八年六月,HomePod在美國智慧居家音響市場的市占率只有四%。
針對語音科技,蘋果採取的策略其實和公司的本質定位有關。蘋果的本質是電子裝置製造商,因此把Siri當成自家裝置上的優秀功能,而不是把Siri當作獨立出售的產品。然而,Google與亞馬遜都預測在未來環繞運算會成為主流。如此一來,語音科技確實會為蘋果帶來風險。在未來,聰明的人工智慧住在雲端上,透過價格低廉的商品和使用者講話,而蘋果專門販賣高價裝置,在這種情境下,蘋果的地位會受到極大的衝擊。
接下來是微軟。微軟有一個世界級的人工智慧部門,部門裡有八千名員工。微軟有搜尋強大的引擎Bing,提升語音助理的問答能力,而且微軟的虛擬助理Cortana已經確立了自己的地位。
但是,微軟提升Cortana在消費者市場的市占率方面遇上了困難。Bing或Skype都支援Cortana,但是這兩個平台的用戶量卻遠遠不及Google或Messenger。Windows Phone上也能使用Cortana,但是它的市占率一直無法脫離個位數,甚至只有個位數出頭,所以在二○一七年停產了。在智慧音響的戰場上,Cortana裝載在哈曼卡頓的智慧音響Harman Karton Invoke裡,但是這款音響的市占率小到幾乎無法計算。開發人員不想花時間為一個很少人用的平台設計語音應用程式,所以大多數都選擇避開Cortana。
儘管面臨這些挑戰,微軟並沒有放棄。Cortana裝載在Windows作業系統上,而且每個月有一億四千五百萬名活躍用戶。微軟並不是把Cortana定位成全能、全民型的人工智慧,而是定位為職場助理,這很符合微軟近期的總體經營策略:專門為企業提供軟體與雲端服務,而人工智慧語音科技就是其中一種。所以,微軟即便在語音科技的戰場上並沒有總體優勢,但是在企業領域裡,有條件成為一支精實勁旅。
再來是臉書,臉書在語音世界的未來很難預測。如果說全世界都和中國一樣,有十億人都在用微信,並把微信當成整個網路世界的入口,臉書的條件就很好,因為Messenger上已經有許多強大的機器人。不過,未來的趨勢會不會如此,現在仍然難以預料。
除了Messenger以外,臉書也做了不少對話式人工智慧的研究,但並不是很積極把成果轉換為產品。根據傳聞,臉書已經研發出自己的智慧居家音響,但是後來因為爆發劍橋分析醜聞,引爆隱私爭議,於是便暫緩發表。所以,目前臉書的得分是「不完整」。
剩下Google和亞馬遜。無論用什麼指標衡量,這兩家公司目前是競賽中最具優勢的。二○一八年,支援Cortana的裝置只有區區三十九個,支援蘋果和Siri的裝置有一百九十四個,支援Google助理的裝置超過五千多個,而支援Alexa的裝置則達到兩萬個。Google助理有超過一千七百個應用程式,而Aelxa在全球則有五萬個應用程式。在美國,亞馬遜的智慧居家音響市占率為六五%,Google則為二○%。
既然Google和亞馬遜是前兩大競逐企業,最好的評估方法就是檢驗兩家公司分別有什麼方法可以透過語音賺取利潤。如果你把獲利的問題拿來詢問這兩家公司的高層,他們會緊張地說出一連串的陳腔濫調,表示現在這項科技還處於早期階段,公司目前正在想辦法提升使用者體驗,等使用者體驗做到最好之後,自然就會有獲利。這種回答雖然是在閃避問題,但是其實不假。目前這些公司都在搶地盤,擴大用戶量,因為它們知道擁有主導地位的平台,自然會有各種方法大發利市。
但是就連在現階段,公司高層也已經在思考各種商業模式了。最直接的獲利方法,就是藉由販賣裝置賺取營收,亞馬遜賣Echo,Google賣Home。但是有別於蘋果,這兩家公司對這個選項似乎不是特別感興趣,因為現在它們都刻意壓低裝置的價格,用以提升市占率。有一家獨立研究公司把Echo Dot拆開檢查,評估所有的組件加起來的成本是三十五美元,加上間接成本與運送費用,總成本還要更高。不過,亞馬遜Echo Dot的定價最低,為二十九點九五美元。「公司是靠著消費者使用我們的服務賺錢,而不是靠著消費者購買裝置賺錢。」Alexa設計與發表過程負責人葛雷格•說道。
下一個獲利選項就是廣告,公司可以付錢給平台,讓語音助理回應前或回應後播放廣告。目前Google和亞馬遜尚未開放這種模式,但是在未來,這種模式幾乎是遲早的事,而問題在於,哪家公司會受不了,率先開放呢?「誰都不想成為第一個,因為這樣一來,另外一家公司就會說:『大家快看,他們有打廣告,我們沒有。』」對話式人工智慧創業家亞當‧馬奇克(Adam Marchick)說道。
語音廣告的潛力評估
然而,語音廣告的獲利能力似乎不如線上廣告或手機廣告。在語音的世界裡,廣告欄只有一個,傳統的搜尋引擎則能有很多個。假設你在Google搜尋引擎上查詢便宜的機票,Google就可以丟出四個付費廣告,放在搜尋結果的上方;但是在語音搜尋的世界裡,如果使用者要先聽四則廣告才能聽見一則回答,應該就不會有人想用語音搜尋了。
這對Google來說是一大問題,該公司現在大部分的收入都來自廣告,這種廣告模式靠著消費者在搜尋結果頁面駐留,這樣廣告才能曝光。但是早在行動裝置興起後,消費者逗留搜尋結果頁面的時間已經減少了。隨著語音搜尋的興起,廣告的曝光就會愈來愈少。「如果你是Google,現在就會想著:『哇!如果大家都用語音搜尋,我們傳統的商業模式就沒有了,因為語音搜尋很難做廣告。』」佛瑞斯特研究機構(Forrester Institute)市場分析師詹姆士‧麥奎維(James McQuivey)說道。
要透過語音獲利,最大的機會或許就是購物了,這對亞馬遜顯然有利。無論是在家中哪一個地方,你都可以用語音購買東西,可以買紙巾、洋芋片、新的烤麵包機。有一項市場研究指出,語音購物的總產值現在是一年二十億美元,到了二○二二年,則會成長到四百億美元。另外一項研究發現,家裡有Alexa裝置的人,每年花費在亞馬遜商城的錢會比一般消費者多出六六%。
亞馬遜的優勢還不只這一點,消費者如果用語音查詢商品資訊或訂購商品,但卻沒有指明品牌的話,亞馬遜就會挑選第一順位的商品。當然,消費者如果聽了不喜歡,也可以請Alexa提供其他選項,但是消費者這麼做的機率極低。這讓許多企業感到害怕,同時也讓亞馬遜握有更大的權力。「如此一來,你買的就不是品牌了。」馬奇克說道:「你買的是亞馬遜叫你買的東西。」
廠商的產品如果列在第一順位或前幾個順位,銷售量可能就會比其他排名較低的產品高出許多。所以許多企業就會樂意付錢給亞馬遜,請亞馬遜把它們的產品放在前面,因為如果自己的商品沒有放在虛擬貨架上,就幾乎等於是不會曝光。再者,亞馬遜也有數量超過一百個的自家品牌,從童裝到狗食都有,而且以後會更多。在語音搜尋的商品排行中,亞馬遜大概會優先挑選自家品牌。
亞馬遜尚未公開宣布是否會開放語音搜尋贊助排行,如果要開放的話,就必須秉持公開透明的原則,不然消費者肯定會覺得自己受騙。不過,贊助排行其實也不是什麼新模式,早就有明確的先例了:螢幕版的亞馬遜商城裡,廠商會付費給亞馬遜,亞馬遜就會把他們的商品放在其他搜尋結果的上方。
Google也明白,要透過語音獲利,最好的方法或許就是電子商務。Google找到許多受到共同敵人亞馬遜威脅的企業,並和它們組成聯盟,包括沃爾瑪(Walmart)、塔吉特(Target)、好市多(Costco)、柯爾百貨(Kohl’s)、史泰博(Staples)、Bed Bath & Beyond、PetSmart及沃爾格林(Wallgreens),這些企業都可以滿足Google語音裝置接到的訂購指令。此外,Google也可以擴充自己的購物購物〔Google購物(Google Shopping)〕,讓平台更完善,與亞馬遜競爭。然後,可以採用潛在客戶開發商業模式(lead generation model),Google每把一位使用語音搜尋的顧客導向零售商,零售商就要付費給Google。
總而言之,在語音的競賽中,Google目前排名第二,而且極具潛力,進展快速。不過目前為止,排名第一的仍是Alexa,因為Alexa在市占率與獲利模式的選擇上都占有優勢。「地球上每家想要從事語音的公司,都是找亞馬遜。」麥奎維說道:「每個想要參與語音未來發展的研究生,都是找亞馬遜……亞馬遜在語音上占盡優勢。剩下要看的就是,亞馬遜如何運用這些優勢,以及運用的時機了。」
各大企業爭相成為使用者的單一介面
一九九○年代,網路世界是一個封閉的地方。許多使用者都用像是美國線上這類入口網站來管理自己的網路瀏覽需求,把資訊都集中在同一個入口網站上,並且列出有用的外部網站,藉此瀏覽體育資訊、金融資訊等。使用者大多都是在封閉的環境裡上網,這種生態也因此稱為「圍牆花園」(walled garden)。後來,Google用鐵鎚擊破圍牆,推出搜尋引擎,讓大家可以自行在網路世界裡輕易找到想要的網頁。從此以後,我們便能在整個網路世界裡自由翱翔。
但是過去幾年來,有一件奇怪的事發生了。Google和亞馬遜竟然在重...
目錄
前 言 靠語音控制的世界
第一篇 從Siri到Alexa的平台大戰
第一章 推動巨變的語音革命
第二章 為你服務一切的虛擬助理
第三章 亞馬遜、蘋果到Google的軍備競賽
第二篇 突破人機互動的創新
第四章 從說話機器到聊天機器人
第五章 辨識發展的技術難題
第六章 性別、個性與人格
第七章 人機對話的世界
第三篇 聲控革命
第八章 數位分身與機器友人
第九章 機器先知如何顛覆傳統商業模式
第十章 監視、竊聽,甚至騷擾、霸凌
第十一章 不會消逝的數位靈魂
後 記 語音世界的未來潛力
前 言 靠語音控制的世界
第一篇 從Siri到Alexa的平台大戰
第一章 推動巨變的語音革命
第二章 為你服務一切的虛擬助理
第三章 亞馬遜、蘋果到Google的軍備競賽
第二篇 突破人機互動的創新
第四章 從說話機器到聊天機器人
第五章 辨識發展的技術難題
第六章 性別、個性與人格
第七章 人機對話的世界
第三篇 聲控革命
第八章 數位分身與機器友人
第九章 機器先知如何顛覆傳統商業模式
第十章 監視、竊聽,甚至騷擾、霸凌
第十一章 不會消逝的數位靈魂
後 記 語音世界的未來潛力