第98章
書迷正在閱讀:知更鳥、死對頭老公出軌觀察日記、707公交游客守則[無限]、我們不熟(一見鐘情 1v1 h)、百慕(1V2 h)、何所欲也、乖乖女(SM)、未來前夫失憶了(1v1)、背德專題(短篇合集)、養成日記gl (簡體版)
寇局長心道“女人的視角真特別”,嘴上贊道:“王老師,你應該到信安部來工作!這種灰歷史、黑材料,我的分析師守著那么大數據庫都拿不出來。他們只知道這次美國軍方反對戈德曼出席,但議會和情報社團支持,完全倒過來了。這也很奇怪。” “我知道的其實都是公開信息,雞零狗碎泡在媒體里面。我每天至少讀三個小時西方媒體。職業病,對心理健康很不好。” 張翰看了幾眼大人物們,忽然在王招弟耳邊道:“等下我換到第六排來,坐你旁邊。行不行?” 「–」 國務卿和蘭道中將目不斜視穿過了拱門。戈德曼停在圖海川面前。四周的人群都靜下來,豎起耳朵。 “你第一個講,我第二個講。對嗎?” 圖海川點頭:“是的。現在我們就別廢話了。” 戈德曼眼中放光,拍拍圖海川的肩膀,昂首進門。 第24章 造物 圖海川獨坐講臺,當真一句話都不肯浪費。 「–」 “2025年,我受命為阿里集團正在運作的國際網購平臺開發一款多語言翻譯系統。當時我還不是項目負責人,只是技術方面的總設計師。設計目標有兩個:一是自動翻譯所有的網頁界面文字,二是為作為阿里旺旺的內嵌翻譯支持,讓使用各種語言的人可以直接交談,同時處理語音和文字翻譯。你們有些人可能沒聽說過旺旺,因為它已經被這個內嵌反過來吞并了。網購平臺也是這樣——本來它定了個名字叫‘世界寶’。現在,這些都通稱‘萬國寶’。所以先澄清一點:現在我談到的萬國寶,不是指網購平臺也不是從前的旺旺,專指我設計的人工智能翻譯系統。到這個定義需要改變的時候,我會提醒你們。 “這個項目本來不應該存在。因為在2025年,谷歌的人工智能翻譯技術已經很成熟。集團內部開預研會,我的第一反應是:為什么還要自己發明輪子?把谷歌翻譯嵌進去不就行了嗎?當時谷歌的自然語言翻譯產品除了谷歌翻譯,還有谷歌數字助理、谷歌duplex。三個內核揉在一起再進行二次開發,恰好能滿足我們的需求。這些產品的接口也非常友好。 “開完會我就明白為什么了。萬國寶能夠出生,還得感謝您。”他向國務卿點了點頭,“那時美國商務部由您主持,認定谷歌的自然語言人工智能是戰略技術。可以讓我們當用戶,但不能嫁接在與美國企業競爭的阿里平臺上。那個合作才談了個意向,就被你砍掉了。我們只能另起爐灶。” 美國代表團的譯員非常出色,幾乎同時說完。國務卿毫不介意,也笑著點頭。 “怎么做呢?還得用谷歌的東西。因為那時候谷歌的tensorflow平臺幾乎統一了機器學習開發模式,已經為自然語言ai提供兩種架構。我們用它搭好架子,搞自己的局部算法就行了。2027年我們的系統已經上線試運行。水平還真的不錯,比谷歌翻譯公開版的正確率和擬人度還高一點。當時,我和谷歌的朋友霍桑聊天,在背后笑話你。我說你砍了商務項目,但沒法砍谷歌的開放ai標準,這等于強行給我灌輸美國技術思想的精華。霍桑說你不但讓谷歌少掙了錢,又逼著中國ai產業補短板,將來還不受限制,都是‘開槍射自己的腳’。他已經過世了,我不妨告訴你。” 這次國務卿面無表情。張翰相當吃驚:什么時候圖海川說話這么囂張過?他現在腦漿溫度是有多高? “2027年的事你們應該還記得。阿里低估了關稅問題和跨國物流的復雜。加上那時候世界很亂,各大市場的準入標準也被人為收緊了。整整一年,各國先爭吵,再談判,越談越糊涂。‘世界寶’上不了線,一拖就是十年,直到把自己的名字都拖沒了。萬國寶項目組倒是閑了下來。原先趕進度,有很多功夫沒有做到位。從2028年開始可以坐下來慢慢改進、反復琢磨。但是,到年底我就撞上了墻。 “那時的萬國寶翻譯網購平臺文字界面,幾乎做到了完美。不僅是標準文字,一張商品圖片上的中文它都可以立即識別、翻譯、改圖嵌入。麻煩出在真人交流,尤其是語音會話。當時困擾我的有三個大問題:第一,它搞不懂諷刺。第二,它無法處理很多種修辭,特別是隱喻和指代。第三,遇到語境決定語意的情況就犯蒙。 “前兩個問題我用一個真實的內測例子說明。測試員作為中國賣家掛出了恐龍蛋化石商品,一個美國買家向他詢問來源和真偽。中國賣家一番解釋之后,美國買家說:‘yeah right! i too have an o front in nevada to sell you.’萬國寶的翻譯:‘真不錯!我在內華達州有一套海景房,也可以賣給你。’中國賣家聽了非常興奮,催他下單,說下單之后大家可以聊房地產。” 聽眾已經笑倒了一片,譯員們笑得尤其厲害。 圖海川一本正經繼續:“后來的萬國寶是這樣翻譯的:‘老板實在!我有塊地皮在中南海,你買不買?’在座的人類很容易理解,這才是美國買家的本意。那么我們和后來的萬國寶有什么共同點?和以前的萬國寶又有什么不同?我們知道內華達不靠海。我們起碼經歷過幾百次別人說yeah right的場合。后來的萬國寶會把英語隱喻置換成類似的漢語隱喻,甚至使用類似的土鱉語氣,就像各位譯員剛才腦子里轉的彎。 “當時我設想的解決方法是:把yeah right之類的常用短語,以及后面那個土味濃厚的美國俗語,分別歸入‘諷刺’和‘俗語’類型,各自用一個深度學習網絡層處理。但這也不能完全解決問題——你架不住隨時有人發明新俗語、新黑話。更架不住真的有人說yeah right,表示同意。這就是我剛才說的第三個問題:語境決定語意。這才是最廣泛、最無解的問題。漢語中尤其嚴重,‘大勝’等于‘大敗’之類,例子太多我就不啰嗦了。