第223章 提前宣布(第一更4000字!)
42%的勝率,並不是說還有四成贏的機會,而是在對手不犯錯誤的情況下,必輸的意思。
alphaGo真的要輸了?而且還是執白輸?
要知道,在deepmind內部的測評中,在黑棋貼7.5目的現代規則中,相當於沒開始下,黑棋就已經損失了一塊地盤,白棋的勝率顯著高於黑棋。
機器對弈下,alphaGo持白棋戰勝自己的勝率超過55%。
其實這幾年人類圍棋界也有相同的看法,尤其在古傑異軍突起後。
古傑去年執白全年只輸過一盤,白棋勝率百分之九十七,而他執黑棋的勝率一下子就跌到了百分之六十。
而現在,阿法狗在執白的情況下,居然要輸了?
而且還是在沒有出現bug的情況下輸掉了?
贏不了了。
當黑棋第125手的飛再次分割了白棋之後,就連只有業餘四段實力的哈薩比斯也看出來,整盤棋面上,白棋的劣勢已經非常明顯。
而到了白棋第146手之後,阿法狗的自評勝率已經跌到了12%以內。
但阿法狗仍舊還在竭力抵抗,但誰都能看的出來,沒有什麼希望了。
它的對手太強大了!
怎麼可能!?
怎麼可能有這樣的棋手?
哈薩比斯完全無法理解。
手持白棋不停落子的黃世傑同樣也無法理解。
他是業餘六段,阿法狗的實際開發人,沒有人比他更理解阿法狗的棋力,哪怕面對的是李世實這樣的頂尖棋手,他也能自信的說,他對AI思路的理解比李世實更準確。
但現在,黃世傑完全看不懂對手的棋路,也不敢說自己能夠看得懂阿法狗的思路。
哪怕到了幾十手之後,他都仍舊看不懂雙方為什麼會這麼下。只知道莫名其妙的,黑棋似乎就占據上風了。
為什麼下的很多招式是自己之前從未見過的?
對面的,真的是一個人類嗎?
不,哪怕是AI,也一樣是要用人類棋譜進行學習的,招數並沒有真正的脫離人類的思考範疇,只是把人類的招數探索到了極致而已。
但現在在這個對手,所使用的招數,無論從布局,還是局部定式,完全和人類既有套路不一樣。
除非……對方真的是個AI,並且從未學過任何人類的招數,只憑自我對弈,自我學習,自我推理,掌握了這個遊戲!
黃世傑被自己的想法嚇了一大跳。
如果他的猜測是真的,那就意味著,對方不止是在訓練上走在了deepmind前面,在算法上,更是把deepmind遠遠甩在了後面!
此前他們也曾經設想過讓alphaGo完全自我對弈來掌握圍棋,但效果非常糟糕。
在實驗中,他們發現,alphaGo所用的策略梯度算法在平衡探索新策略與利用已知策略之間存在嚴重的不穩定性,導致AI無法從整局優勢的角度上去考慮勝負優勢。
而且,圍棋的勝負信號噪音太強了,如果沒有初期的既有知識引導,會導致模型在初期訓練階段無法有效學習。
除此之外,還需要解決神經網絡的「災難性遺忘」問題和沒有初始策略下的大量隨即走子的問題。
可以說,這裡面任何一個問題,可能都需要大量的人力物力和極為聰明的大腦來花費幾個月的時間進行解決。
尤其是「災難性遺忘」,這種學了新知識就忘了舊知識的現象在深度學習領域非常常見,可以說,整個深度學習領域迄今都沒有找到太好的辦法應對各種原因所造成的災難性遺忘。
最終,alphaGo團隊仍舊只能用人類棋譜訓練alphaGo,當其成長到一定程度後,再讓其自我對弈,疊代進化。
而現在這個對手……
但願他是一個人類吧。
黃世傑雖然不需要考慮棋盤上的複雜變化,但額頭上仍舊滲出了一層汗珠。
——
「嗨,各位,臉色怎麼這麼差?」謝爾蓋布林和拉里佩奇剛剛趕回監控室,就看到deepmind每一個人都臉色鐵青,沉默不語的盯著桌子上並排擺放的十幾台顯示器。
「白棋很危險啊,看來對方馬上就要投了。」謝爾蓋布林也會下圍棋,而且水平還可以,有業餘一二段的水平,一眼就看出白棋很危險。
「嗨,高興一點,你們創造了歷史!夥計們,三比零打敗了李世實,這不是人類的失敗,而是人類的另一場勝利!」謝爾蓋布林用力拍了拍離得最近的大衛席爾瓦的肩膀。
他這話一說,大衛席爾瓦的臉色就更難看了。
監控室中更是一片安靜。
「謝爾蓋,alphaGo……是白棋。」哈薩比斯艱難的擠出一句話。
阿法狗是白棋?謝爾蓋布林不由得愕然,仔細看了一眼屏幕,果然,阿法狗今天持白。
「是被對手找到了bug嗎?」拉里佩奇不懂圍棋,但他同樣很清楚阿法狗的強大,在此前的模擬對弈中,除非被對手找到了bug,否則阿法狗幾乎不可能輸棋。
「沒有。」大衛席爾瓦硬著頭皮道,「今天對方下的棋很怪,在前30手就有3手棋出現在阿法狗的預判範圍之外,到了第53手,雖然對手仍舊下出反常棋,但從價值網絡上看,阿法狗的應對仍舊是合理的。」
大衛席爾瓦眉頭緊皺,偷偷看了一眼兩位老闆:「今天賽後,我們還會重新再分析這局棋,到時候才能知道阿法狗到底出現了什麼問題。」
謝爾蓋布林抓了抓凌亂的頭髮:「你的意思是說,對方的棋力已經超過了阿法狗?有這樣的棋手嗎?」
聽到希爾蓋布林的話,幾乎deepmind所有人在心裡突然都想起了上午范輝說到的那個名字。
橘子。
這個神秘外援是你嗎?
伱是人類……還是……
也正在這時,屏幕之上,阿法狗的勝率終於降至了1%。
AlphaGo resigned!
alphaGo在邊角處隨意下了一顆棋後,屏幕上蹦出了一行盎文。
alphaGo認輸了!
黃世傑從棋盒中拿出兩個白棋,手指微微顫抖,擺在棋盤上。
所向無敵的alphaGo,居然真的輸了。
謝爾蓋布林看到屏幕上的「阿法狗認輸」這幾個字,摸了摸自己的鬍子。
原定自己也要參加的賽後發布會,還要不要去?
謝爾蓋布林突然有些猶豫。
莫名其妙的,謝爾蓋布林突然想起了今天在電梯中碰到的那個亞裔青年說的那句話。
「希望晚上你們仍舊能有好心情。」
原本覺得輸一盤也沒什麼的謝爾蓋布林,突然心情真的變得不好了。
還是等真的贏下這場比賽,再出來參加發布會吧。
——
「勝里黑塔(勝利的高麗語)!!!」現場的高麗記者們一片歡騰,幾乎所有的演播室中也都是欣喜不已。
「扎勒黑塔(幹得好)!!!」
「李九段!對今天的勝利你有什麼感想!?」
「請問今天的相談棋取得了勝利,是否說明過去的兩場失利是因為你對AI招法的不習慣而導致的輸棋?」
「請問李九段,今天坐在你旁邊戴口罩的人是誰?他似乎並非職業棋手,你能介紹一下嗎?」
「今天你的棋風似乎和過去相比有了很大變化,這是你對AI思考出來的秘密武器嗎?」
「哈薩比斯先生,對於阿法狗今天輸棋,你有什麼看法?」
李世實和一臉晦氣卻還要勉強保持風度的哈薩比斯對視一眼,似乎都在啊對方眼中看到了無奈。
「今天這局棋非常精彩,我們需要回去仔細檢查一下,alphaGo今天到底出現了什麼問題。」哈薩比斯拿起話筒乾巴巴的說了一句,便不再說話,看向了李世實。
他早就準備好了今天獲勝後的感言和記者可能會問到的問題。
但現在輸了,他也不知道該說什麼不該說什麼。
如何面對媒體,是一項專業技能,同樣也是要訓練的,很不巧,哈薩比斯到現在還沒真正熟練掌握這項技能。
絕世天才也不是什麼都擅長的。
相比之下,自小就面對媒體的李世實就要遊刃有餘多了。
「非常抱歉,我必須先聲明,今天的相談棋,並非我個人的實力。」
「根據我與高麗棋院達成的協議,由於前兩局我失敗了,而且,第二局是完完全全的敗了。因此,這一局的主導權並不在我這裡。我今天的角色和黃博士是一樣的,我對這一局的驚訝並不比大家少。」李世實細聲細氣道。
李世實這句話一說出來,現場媒體已是一片譁然。
誰都沒想到如此驕傲的李世實竟能夠將主弈權真的讓出來。
究竟發生了什麼?又有哪個棋手能這麼強大,可以讓天不怕地不怕的李世實甘心交出主弈權?
「至於我的搭檔,我並沒有見過他,他應該也沒有在現場。」
「我身旁的那位先生,只是根據這位搭檔實時傳遞過來的信息告知我落點。至於我搭檔的名字,我相信很多棋迷都知道他,也猜出了今天是他在替我完成比賽,他就是兩個月前在網絡上先後擊敗古傑和我的神秘棋手,橘子。」
橘子!!!
這個聽上去就像跟風蘋果的名字正式出現在大眾媒體面前。
此前橘子擊敗古傑和李世實,只是一小部分圍棋愛好者中知道這件事,古傑獲得夢百合冠軍的時候雖然也說了一句,但影響力顯然和現在是不能比的。
現在面對的可是全球媒體!
已經可以想像得到,不出兩個小時,這個名字就會傳遍整個世界,占領無數熱搜!
李世實面色淡然。
「至於橘子究竟是什麼身份,一會兒大家可以詢問我旁邊的這位華先生。」李世實指了一下藏在不起眼角落裡的華澤成。
閃光燈咔嚓咔嚓的對仍舊戴著口罩的華澤成一通拍。
「請問,橘子到底是誰?既然他有這麼強大的棋力,為什麼不自己親自挑戰alphaGo?」
「有人說橘子是人工智慧,請問是真的嗎?」
「你如何看待這場勝利?」
……
華澤成被記者們如圖其來的問題一下子搞的有些懵。
他頭上戴的耳機中突然傳來了聲音。
華澤成凝神傾聽,不由得露出驚訝的表情,看了一眼仍舊坐在椅子上的方豫,卻見方豫向他點了點頭。
「是的,橘子確實是人工智慧。」華澤成摘下口罩,拿起話筒,簡明扼要的回覆了一句,「橘子是柚子科技研發的,全球第一個真正意義上人工智慧大模型。」
哈薩比斯如遭雷亟。
柚子科技?
那個古狗本來就想收購的柚子科技?橘子是他們開發的?
大模型又是什麼東西?
該死!
一瞬間,哈薩比斯就想明白了所有的事情。
壞了!這是有預謀的!
deepmind被狙擊了!
哈薩比斯臉色瞬間白了起來。
被氣的。
早知道不簽那份賽前協議了。
大意了啊。
——
「怎麼樣!?我就說吧!?」演播廳中,古傑激動得騰一下蹦了起來,對著空中打了幾拳,就像一隻一米八幾的猴子。
這幾天他可是被罵壞了,他就不明白了,這麼明擺著的事情,怎麼這麼多人還都看不出來呢?
叫你們罵我!?
打臉了吧?
「這、這……」演播廳里其他三名主持人都瞠目結舌。
「呃,劉教授。剛剛採訪里說橘子人工智慧是這家名叫柚子科技的公司開發的,對這家公司,你有了解嗎?」陳穎趕忙轉換話題,給劉子慶遞了個瓢把兒。
「啊?」劉子慶還傻著呢,你這不是哪壺不開提哪壺嗎?
我特麼哪知道柚子科技是幹嘛的?
——
「柚子科技!」
「哐!」
吳恩德懊惱的在桌面上重重錘了一拳,也不再顧慮其他,拿起電話就給Robert撥了過去。
「Andrew,我知道你要說什麼,我會給你一個交代。」吳恩德還沒說話,就已經聽到電話那邊Robert溫和但卻堅定的聲音,「千尋,現在必須All in AI!」
——
「不是說最後一戰再公布嗎?」沈舒窈拉了拉方豫,閃著一雙桃花眼,悄聲問道。
方豫搖搖頭:「不了,剛剛我看了一下現場氛圍,過猶不及。」
「原本我是想要李世實被三比零擊敗後才插手的,但沒想到李世實這麼快就失去了戰意,提前宣布了相談棋。」
「如果只有兩場比賽,而且是勝負已分之後的比賽,搞點噱頭還可以。但現在,第三場比賽橘子提前介入,讓所有人看到了人類獲勝的希望,這時候再藏著掖著,到了最後一場結束後再公布,會被人抨擊成為了噱頭戲耍觀眾,那就很難辦了。」
「所以,只能現在就宣布,隨後正面挑戰阿法狗!」
說罷,方豫就用袖子裡的維爾德溺愛朝著華澤成施展了一個四環的「巧言令色」。
注1:現在的大模型LLM指的是大語言模型large language model,主要使用了transformer架構。
LLM的概念,在2017年才正式出現。
但書中的橘子大模型,和gpt這種主要依靠注意力機制的transformer架構大語言模型並不一樣,而是基於柚子的底層法則而構建的,並由柚子重新開發出對應的神經網絡算法搭建而成。因此,這裡的大模型指的並非大語言模型,而是指的大參數模型。
(本章完)