如果A片能換上任何人的臉

上禮拜國陣競選宣言引起議論紛紛,不只因為內容。在網上可以下載的宣言文檔中,第十七頁有兩張圖,顯示現在和未來的吉隆坡市景。眼尖民眾注意到,圖中好像少了點什麼?第一張張圖中,我們還可以看到國油雙峰塔下半身的一點點,上面明顯P掉了。第二張圖中,可以清楚看到吉隆坡塔,但不見雙峰塔。取而代之的是106交易塔。

像某國陣公關所說,這是無關緊要的美術問題。宣言內容才是重點!雖然如此,我剛在大西洋月刊裡讀到《假影片時代崛起》一文,講到現在科技能像P圖那樣輕易修改影片中移動的內容,我就再次想起國陣宣言裡消失的雙峰塔。

宣言裡那兩張圖片有99%可能是用Photoshop弄的。多虧有電腦,今天只要有少少技巧,P圖只需幾分鐘,學生都可以做。

不過,修圖比電腦古老得多。在十九世紀,人們為了藝術商業或政治目的,用墨水、油漆、雙重曝光、拼接照片等方法修改照片內容。最顯眼的一些例子是在政治宣傳和修飾歷史。例如在斯大林統治下的蘇聯和毛澤東時的中國,每當有共產黨黨員遭到清算,宣傳單位就會確保這些人從官方照片和檔案中消失,讓他們不曾存在。這些人很多曾是斯大林毛澤東的戰友,就像被視為雙峰塔幕後主腦的馬哈迪,也曾是納吉所屬巫統的領袖。但過去只是為了服務現在,一翻臉歷史也得跟著改寫。

我上面說到大西洋月刊中《假影片時代崛起》一文。文中提及,去年有人開發了軟件,可以輕易把別人的臉「換」到影片中演員的身上。軟件會分析當事人大量照片,製造出他的各種立體表情,然後移花接木到片中角色的臉上。不知情者看了,還以為當事人參與了影片演出。

這科技有可怕的應用。舊情人可以把女子的臉轉接到A片裡,然後放上網。這不是危言聳聽,這款軟件目前最受歡迎的應用就是把明星的臉轉接到A片演員身上,來滿足某些人的幻想。這種影片叫deepfake,名字源自軟件中的深度學習(deep learning)演算法。雖然很多社交媒體禁止了這些影片,上網還是不難找到。因為效果驚人地自然真實,如果沒人說,觀眾會以為明星真的參與了片中動作。

也不是全部人用這軟件於不正當或色情用途。很多人用它純為娛樂,如把政客的臉轉接到電影角色身上。也有人研發怎樣把這科技用在對的地方,如心理治療時當事人可以在和醫生的視頻對話中隱去臉部,以維持隱私。不過,這些正當用途可以彌補這項科技可能帶來的傷害嗎?木已成舟,我們又怎樣阻止人們濫用科技呢?

當然,修改影片內容不是新東西。電影向來有用特效,否則就沒有《魔戒》那類電影了。但是特效需要昂貴器材軟件和大量時間,拍攝要安裝綠屏後製要請人。Deepfake的開發者則承諾,有普通電腦的人都能免費使用這款開源軟件。想想一個癡漢把迷戀對象的臉接到A片裡面。想想一個政治狂熱份子可以修改錄像,用WhatsApp散播經過修改的影片,說是現場拍攝。一旦這科技普及,我們不只要擔心自己突然出現在別人的性愛影片中,我們也不再能輕易判斷任何影片的真偽。

迄今為止,如果有政客否定指控,但有廣泛流傳的影片顯示他犯罪,那多數人會相信影片。在多數人眼裡,錄像就是真相,可以擊破任何謊言,因為我們知道:照片易改影片難改。但如果連修改影片內容也變得容易,不只政客的話不能相信,照片不能隨便相信,錄音不能隨便相信,現在影片也難分真偽。除非人在現場,不然有誰能相信什麼呢?

當自己所見的都不能完全相信,我們會更謹慎,怕那段網上流傳的影片有少少可能是經過修飾,還是別分享或評論。對統治者來說,這種真相瓦解的時代真好。如果老百姓不再相信自己的眼睛,統治者就能肆意替我們決定什麼真什麼假。這官員召妓的影片是是假的!分享者要坐牢。那段顯示反對黨領袖犯罪的影片,政府發表過文告說是真的,大家放心登放心播放心分享!與其創造真相來對抗對自己不利的真相,不如讓天下不存在真相,所有信息都有那麼一點點可能是假新聞。

中國想掌控人工智能

2017年9月俄羅斯總統普汀說,誰先掌握人工智能,他就能統治世界。

2017年最後一天,習近平發表新年賀詞影片。眼尖網民注意到習主席書架上多了兩本有關人工智能的書,一本是Pedro Domingos的《掌握運算法則》(The Master Algorithm),另一本是Brett King的《增強:智能生活》(Augmented: Life in the Smart Lane)。

這兩本書出現在書架上絕非意外,也不是中國首次對人工智能展示興趣。去年10月習近平在中共十九大上就說過,中國會推動人工智能等科技和實體經濟融合。中國國務院去年7月也定下目標,要讓國內人工智能產業在2030年價值達1,500億美元,讓中國成為世界主要的人工智能創新中心。

很顯然,中南海相信人工智能是中國必須掌控的關鍵技術。但重視人工智能的不只有中國。全球首要IT服務供應商高知特的戰略主管弗蘭克(Malcolm Frank)就認為,中國印度和美國在人工智能開發皆有強項,呈現鼎足三分之勢;其中印度已有價值1,430億美元的人工智能外包行業,為德意志銀行、洛克希德-馬丁、IBM微軟和美國陸軍等全球頂尖機構企業提供服務。至於美國,矽谷勢頭依然強勁,是全球科技的領頭羊。

今天不說印度,我們看看中美這兩大競爭對手。

的確,特朗普不看重科學,大幅削減科研經費,無疑影響美國的人工智能開發。但谷歌、臉書、亞馬遜、蘋果、IBM、微軟等矽谷巨擘研發人工智能已久。一家企業用數據訓練人工智能越久,人工智能變聰明的速度就越快,提供的服務也就越好,消費者又會自願為優越服務提供更多數據,讓人工智能學得更快。如此循環,好比寬度不斷翻倍的護城河,讓新興競爭者望塵莫及。

谷歌是人工智能最早最堅定的信徒,它毫無保留研發能整理全球資訊並從中學習的人工智能。去年谷歌AlphaGo戰勝圍棋世界冠軍,過幾個月谷歌又推出比AlphaGo更強的下棋軟件;如果Skynet或HAL 9000誕生,它挺可能打著谷歌商標。

不過科技唯一不變的真理就是變,鹿死誰手尚難論斷。百度和阿里巴巴等中國科技企業時間上落後了,但除了政府資助,還有一大優勢:中國的十三億人口,包括7.3億名中國網民。人口可以轉換成數據,給人工智能處理越多數據,它就學得越快。對人工智能開發者來說,中國十三億人口是誘人的一塊肥肉。

數據看量也看質。因為沒有舊科技包袱,中國人比歐美民眾更熱情擁抱新科技。從叫車網購到吃飯結帳,今天中國人萬事用手機搞定。智能手機無時無刻收集各種精準的個人資料,包括地理位置、社交圈子、音樂品味、消費習慣、照片內容以至健康情況和臉部特徵。加上中國隱私法律薄弱,在騰訊等科技企業配合下,政府長期收集每一個公民的信息,甚至落實人臉識別監控系統、互聯網實名制和「社會信用系統」監控民眾言行。所以,跟政府關係密切的百度阿里巴巴等擁有讓任何矽谷企業都要眼紅的海量精準數據。

雖然這樣,我們也別高估中國的人口優勢。除了中國朝鮮伊朗幾個國家,全世界都用谷歌和臉書(俄羅斯沒禁臉書,但VK是最受歡迎的社媒)。目前在中國翻牆上谷歌和臉書屬違法。與此同時臉書全球活躍用戶超過20億人,全中國包括不上網的人口才13億。谷歌搜索是全球最多人上的網站,每日流量是百度的1.46倍;第二多人遊覽的YouTube也屬谷歌旗下。百度阿里巴巴和騰訊要在人工智能上和谷歌臉書等角力,就必須放眼全球,讓旗下產品在海外競爭。例如近期騰訊和阿里巴巴把各自的「生態鏈」引進大馬和泰國,是實現這目標的關鍵一步。

另外,中國政府雄心勃勃投入以十億計金錢資助國內企業開發人工智能,但研發需要頂尖人才。中國在吸引培育人才方面有待進步。領英前年10月調查顯示,中國從事人工智能科技相關工作的只有5萬人,遠低於美國的85萬人,也只有印度的三分之一。

上面提到中國監控民眾,以我所見,中國政府跟谷歌臉書有玩味的共同點。他們都迷戀大數據和科技,相信全知就全能,想知道每一個人的日常生活,想掌握他的喜怒哀樂,想讓他成為不多思考的知足消費者,想在任何趨勢發芽前主導它控制它或消滅它。但谷歌臉書對數據的飢渴是為了賣廣告,中南海則是為政治穩定。過去十年證明,新科技是武器,能顛覆任何政權;對中國政府來說,比美俄更快掌控人工智能是生死問題。當資訊時代把特朗普等民粹政客推上世界舞台,難怪中國相信它必須主導全球科技發展的大方向,把開放化為封閉,把自由化作監控,讓消費取代求知,讓信息對付批評者而非統治者,才能避開來自內部或外部的顛覆。

不管鹿死誰手,我們還不能預料人工智能對社會的影響。隨著人工智能滲透社會,我們會面對種種道德難題,甚至重思人的價值。SpaceX首席執行官馬斯克(Elon Musk)警告,各國之間的人工智能競爭可能引發第三次世界大戰。很多人擔心人工智能會消滅人類統治地球。這是杞人憂天嗎?也是,也許不?在人工智能尚不發達的今天,科技已取代無數工作,資訊時代帶來種種問題。企業或國家不該為軍備競賽盲目開發人工智能,我們必須慎思它的方向和後果。

書與谷歌

柏拉圖討厭人們寫字和讀書。

他抱怨說,人們讓文字取代了記憶。他還說,文字讓人在無老師指導下得到知識。人們以為學到很多,但那不是智慧,那只是罐頭知識。真正的智慧只能由大師口授。

話說很諷刺,跟他師傅蘇格拉底不同,柏拉圖有把想法寫下來。因為這樣,他是那時代極少數作品保存至今的哲學家。

不管怎樣,柏拉圖活在兩千幾百年前,但他對文字的看法跟今天很多人抗拒谷歌的理由一樣。人們怕科技讓人健忘,怕愚民上網得到不全面甚至虛假的資訊,還自以為有知識,讓真正的專家失去權威。

所以,科技有那樣的問題嗎?當然有。柏拉圖抗拒文字的理由合理嗎?也很合理。人們發明印刷術時,也很多人怕廉價書本讓人懶惰思考不再服從教廷讓不道德內容散;收音機開始普及時,評論者也大肆炒作收音機的假消息問題,說收音機洗腦愚民助長法西斯主義。這些指控不是無中生有,但也凸顯了這類批評跟文字一樣古老。

另外,我不喜歡「讀實體書才有用,網上都不是知識」的陳腔濫調。我見過太多濫竽充數的實體書,內容不比很多網上文字可靠或有深度。一流的書作者也有偏見。盡信書不如無書,看書跟用谷歌都一樣要自己判斷分辨比較思考。

但我們需要書本。古人的智慧不寫下來早就失傳。口授?玩過傳話遊戲嗎?口授未必能讓對方全面理解,人們又愛加鹽加醋,一代傳一代知識肯定面目全非。多虧有文字,千年後我們還能讀古人自己用的字眼,不是聽別人亂講孔子講過什麼。

這是文字的優點,但也是缺點。當一段知識記錄成文字,它就像封在琥珀裡的古代昆蟲,永遠保存那時代的特色。它不能與時俱進,會變得不合時宜。後人可以寫本新書去更新補充那舊知識,但除非你是秦始皇,我們不能消滅不合時宜的舊文字。當有人沈迷於古文又不善變通,他也會成為不合時宜的人。

好玩的是,互聯網等現代科技反而讓一小撮人更不合時宜。他們上網讀到一兩千年前的經文,並自行詮釋,沒有老師引導。結果全單照收經文,回到聖戰和殉教的時代。宗教可以與時俱進,經文不能。這些古老的文字將永遠保留某個時代的色彩,尷尬地與現代文明並存。

人存在了至少20萬年,六千年前才有文字。有了文字才有歷史,人才有了記憶。至於人為什麼發明文字?文字本來不用來紀錄歷史和想法,也不用來溝通,是用來記錄和處理資料,尤其是數字。人把文字跟嘴上的話綁在一起並用來寫情詩,是後來才有。從這角度來看,電腦跟當初文字的角色一樣。它可以紀錄和處理海量資料,而且比人快一億倍又更精準。它幫我們省去繁瑣的工作,減輕人腦負擔,讓人專注於我們擅長的,如創意和思考怎樣變通。

跟文字一樣,我們用電腦來做越來越多事情。我們讓文字取代講話,讓文字取代記憶,讓文字取代人與人的互動。為了效率,今天我們不也我們讓微信取代講話,讓谷歌取代記憶,讓臉書取代互動?

互聯網和谷歌,是跟文字和書本一脈相承的科技。

不管是文字書本活字印刷術還是互聯網,它們都把我們推向同一個方向:知識成為共享資源。普通人不用什麼事都花錢請教師傅,人不再受限於有限的記憶,我們隨時都可以去圖書館查東西,或者上網。如果不是因為文字書本互聯網,今天還是大師說了算老百姓皆無知的時代。

但柏拉圖的擔憂不是沒有道理。

自從我們有了文字書本和互聯網,知識不再有人把關。我們可以自己看書自己上網自行學習。但閱讀是困難的藝術,我們的理解通常不全面。當每個人都可以寫書,可以寫部落格寫臉書狀態,資訊和意見就氾濫。我們對知識的吸收越來越多卻也越來越偏狹,人人只汲取感興趣的資訊,只聽自己認同的想法。我們不再耐心思考複雜的概念,只吸收入腦即化的資訊碎片。我們也難以分辨資訊真偽,更無法在雜音中找到智慧。我們知道更多,但我們懂得更少。

套用米蘭·昆德拉在《笑忘書》中的話:總有一天每個人會發現自己是作家。這一天來臨時,人們會進入一個全面聾聵全面誤解的年代。

他是對的,我們進入了昆德拉預言的年代。人人包括我都發表偉論,但不聆聽。在很多人眼裡,資訊時代是個群魔殿。也難怪最近《紐約時報》說,當民粹主義伴隨互聯網所帶來的資訊自由崛起,連西方左派也開始相信應該控制資訊,特別是他們眼中的假新聞和仇恨言論。

的確,資訊氾濫帶來了很多問題。但當我們開始躲避它,而不是學會怎樣應付,我們會來到一個全新而且危險的轉折點。

我今年較早寫過人工智能的問題。谷歌近年來致力發展人工智能。以前我們用谷歌找資料,它不會給一個明確答案,只會展示一系列包含搜索字眼的網站。我們需要一個個點進去看,判斷哪個網站可靠。但今天,谷歌旗下產品如Google Assistant嘗試給我們明確簡短容易消化的答案。我問:納吉多少歲?谷歌瞬間在網上找到答案,判斷哪一個答案最可靠,然後信心滿滿地說:64歲。

但這只是個簡單、答案明確的問題。很多問題沒有明確答案。我們今天難想像有人問谷歌大神,以你對我的認識,我該支持什麼黨?但誰知道呢?人們招架不住資訊氾濫,日益渴望黑白分明的答案。或許有一天我們會希望專家幫我們決定一切,渴望谷歌大神幫我們判斷是非。我不確定我們會四分五裂下去,大家活在不同的真相裡?還是我們會放棄思考能力,任由統治者和科技決定什麼是真相?這些判斷會來自誰,是政府,是掌控科技的資本家,是我們的社交圈子,是電腦的演算法?如果科技終於取代我們的判斷能力,這或許是最高級也最可怕的效率了。