
文章來(lái)源:星陣圍棋
近期星陣專業(yè)版上線測(cè)試后,廣受高水平棋手和普通圍棋愛(ài)好者的好評(píng)。與此同時(shí),網(wǎng)絡(luò)上出現(xiàn)了一些關(guān)于星陣的不實(shí)信息,其中很多言論與事實(shí)明顯不符?,F(xiàn)選取比較有代表性的幾點(diǎn)質(zhì)疑進(jìn)行回應(yīng),以正視聽。為了更客觀地還原事實(shí)真相,這幾天來(lái)我們尋找了大量的資料,包括之前的新聞報(bào)道、棋譜等最直接的證據(jù)。本文中的幾點(diǎn)質(zhì)疑由網(wǎng)友“百年孤獨(dú)”陳列,并均為其原話。
質(zhì)疑1:“由說(shuō)katago是星陣一年前的技術(shù),也就是去年9月份就有的技術(shù)。令人存疑,據(jù)我所知,星陣的任意路數(shù)也是11月份以后,8月份的9路大賽,星陣下出的棋負(fù)于人類,和katago差不少,而且卡塔狗支持任意路數(shù)(大于19也支持,還有長(zhǎng)方形棋盤),在去年的宣傳中,星陣方面并沒(méi)有說(shuō)過(guò)支持任意棋盤,也沒(méi)有說(shuō)過(guò)支持19路以上的棋盤,我懷疑星陣支持小棋盤用的縮圖法,并不是卡塔狗方法。”
回應(yīng):事實(shí)上在2018年4月人機(jī)大戰(zhàn)時(shí),星陣已經(jīng)擁有任意路數(shù)的技術(shù)。目前搜索當(dāng)時(shí)的新聞仍然可以找到相關(guān)報(bào)道,在此僅舉一例:
澎湃新聞:柯潔執(zhí)白不敵國(guó)產(chǎn)人工智能“星陣”,但他的勇氣格外珍貴http://news.sina.com.cn/o/2018-04-27/doc-ifztkpip3073988.shtml
此時(shí)并沒(méi)有公開測(cè)試,但中間有多位棋手參與了私下的測(cè)試。之后經(jīng)過(guò)多次測(cè)試改良,在2018年8月南寧中國(guó)圍棋大會(huì)上進(jìn)行了公開9路挑戰(zhàn)賽,在2018年12月在弈客進(jìn)行了天弈17路挑戰(zhàn)賽。并且在弈客的比賽籌劃階段曾經(jīng)在17路和21路之間選擇,后來(lái)因?yàn)?1路一盤棋時(shí)間較長(zhǎng)因此沒(méi)有進(jìn)行比賽。關(guān)于星陣支持任意路數(shù)的方法,早在2018年9月的相關(guān)新聞中就已經(jīng)有明確報(bào)道:
新浪體育:劉鶴副總理視察星陣圍棋 并與人工智能現(xiàn)場(chǎng)對(duì)弈(圖)
http://finance.sina.com.cn/china/gncj/2018-09-19/doc-ihkhfqns7459116.shtml
以上證據(jù)可以說(shuō)明所謂“星陣的任意路數(shù)也是11月份以后”、“去年的宣傳中星陣方面并沒(méi)有說(shuō)過(guò)支持任意棋盤”說(shuō)法不實(shí)。希望今后再有此類疑問(wèn)時(shí)首先查閱公開資料,不要人云亦云。
質(zhì)疑2:“星陣比賽(2018年4月星陣對(duì)leelazero七番棋)的時(shí)候?yàn)槭裁匆髄z公布權(quán)重,而且lz公布權(quán)重和實(shí)際權(quán)重不一樣的時(shí)候反而取得了勝利,這個(gè)很容易讓人有針對(duì)性訓(xùn)練的遐想?!?/p>
回應(yīng):公布權(quán)重是星陣方向組織者弈客提出的,目的是賽后驗(yàn)證招法真實(shí)性和數(shù)據(jù)分析,為了人機(jī)大戰(zhàn)做準(zhǔn)備,得到了leelazero方代表的同意。并且規(guī)則只要求公布權(quán)重信息(而且是賽前半小時(shí)),沒(méi)有對(duì)leelazero使用權(quán)重的選擇做出任何限制(包括賽前不公開的權(quán)重)。所謂“l(fā)z公布權(quán)重和實(shí)際權(quán)重不一樣的時(shí)候反而取得了勝利”更是缺乏說(shuō)服力。這里找到了2、3、4局的權(quán)重公示情況。
第2局:
https://home.yikeweiqi.com/#/gonews/detail/16941?type=1
第3局:
https://home.yikeweiqi.com/#/gonews/detail/16972?type=1
第4局:
https://home.yikeweiqi.com/#/gonews/detail/16995?type=1

可以看到第2局和第3局均沒(méi)有使用官方權(quán)重(星陣方不清楚這兩個(gè)權(quán)重賽前是否公開),第4局公示使用官方權(quán)重但據(jù)說(shuō)實(shí)際使用的是非官方權(quán)重并取得勝利(問(wèn)題的由來(lái))。首先比賽前半小時(shí)才會(huì)公示使用權(quán)重,每一局leelazero使用的均是不同權(quán)重,而且很多權(quán)重是當(dāng)天才更新。本身就不存在針對(duì)性訓(xùn)練這種技術(shù),更何況權(quán)重賽前未知、并且不斷更新。而且從棋的內(nèi)容看,前三局星陣贏的并不輕松,第四局也是苦戰(zhàn)惜敗,不存在明顯的差別。所謂“公布權(quán)重和實(shí)際權(quán)重不一樣反而取得了勝利”只是一種巧合衍生出的猜測(cè)。
質(zhì)疑3:“星陣最開始說(shuō)租機(jī)是最新權(quán)重,然后后來(lái)用ox測(cè)試,ox并不弱,然后立刻改口說(shuō)穩(wěn)定版權(quán)重,在索要ox權(quán)重后,進(jìn)行升級(jí),突然對(duì)ox碾壓,根據(jù)實(shí)際elo曲線,如果不靠針對(duì)性方法這個(gè)進(jìn)步至少200分以上,能在短時(shí)間內(nèi)進(jìn)步200分,這種神奇的速度,然而比賽仍負(fù)絕藝,令人費(fèi)解?!?/p>
回應(yīng):首先拿來(lái)測(cè)試的據(jù)我們所知被稱為oxb02權(quán)重,和ox有所區(qū)別。并且某棋友當(dāng)時(shí)在野狐公開測(cè)試星陣12x對(duì)5卡2080ti的oxb02權(quán)重戰(zhàn)成1:1平,之后當(dāng)晚24x執(zhí)黑0:1 oxb02。然而第二天開始有人開始在各個(gè)qq群微信群大肆宣傳,聲稱“oxb02同配置2:0星陣”。
我們得知這一消息后,馬上進(jìn)行自查。通過(guò)在野狐測(cè)試和自戰(zhàn)測(cè)試發(fā)現(xiàn)最新權(quán)重可能存在一定問(wèn)題。為了保險(xiǎn)起見(jiàn)把權(quán)重回退到最新的穩(wěn)定版權(quán)重(8月份比賽版本)。因此在10月19日之后到目前為止,網(wǎng)頁(yè)版使用的均為8月份的穩(wěn)定版權(quán)重,那么8月份的星陣是如何針對(duì)后面出現(xiàn)的ox(b02)進(jìn)行針對(duì)性訓(xùn)練的?如果有興趣驗(yàn)證的話,由于權(quán)重時(shí)間較早,網(wǎng)頁(yè)版目前開局階段黑棋勝率整體比當(dāng)時(shí)所謂“2:0星陣”時(shí)要高,可以和當(dāng)時(shí)“第一視角”截圖做對(duì)比。同時(shí)還可以拿目前的網(wǎng)頁(yè)版來(lái)分析9月份在野狐上“FuzzyPants”賬號(hào)的招法重合度。各種證據(jù)都可以說(shuō)明網(wǎng)頁(yè)版是回退到舊權(quán)重,而不是所謂的“升級(jí)”,“針對(duì)性訓(xùn)練”謠言不攻自破。
從另一個(gè)方面看,星陣出道以來(lái)在大賽中多次戰(zhàn)勝非開源AI,在決賽番棋中以較大優(yōu)勢(shì)戰(zhàn)勝過(guò)AQ、小愛(ài),同時(shí)星陣也是在鳳凰圍棋后唯一在正式比賽贏過(guò)絕藝的AI。同時(shí)ELF(賽后放出最新權(quán)重v1)、Leelazero等開源AI在比賽中均使用了未公開的權(quán)重,可以說(shuō)在AI大賽中本來(lái)就不存在公開權(quán)重的AI,如果星陣是靠所謂的“針對(duì)性方法”提升水平,那么是如何在歷屆AI大賽中面對(duì)各種對(duì)手都取得好成績(jī)的?
質(zhì)疑4:“星陣認(rèn)為已經(jīng)超過(guò)zero的天花板,這個(gè)并未有證據(jù)?難道星陣自己跑到過(guò)zero的天花板?如果沒(méi)有,如何認(rèn)為zero天花板沒(méi)有master方法高?”
回應(yīng):首先zero指的是AlphaGoZero論文中40B模型,想對(duì)比的是該模型的水平而不是算法的優(yōu)劣。比較水平最直接的方法是對(duì)戰(zhàn),但是這個(gè)驗(yàn)證方式基本不可能實(shí)現(xiàn)。該論文中包含各版本的等級(jí)分推算,可以看到Raw network也就是純神經(jīng)網(wǎng)絡(luò)輸出的水平是3055elo分(這里是goratings的分?jǐn)?shù),并不是中國(guó)圍棋等級(jí)分)。而星陣對(duì)應(yīng)的Raw network就是星陣陪練小程序9d所使用的。從小程序的使用反饋以及其他相關(guān)的對(duì)比測(cè)試,猜測(cè)星陣的Raw network可能超過(guò)了3055分,并不是嚴(yán)格的證據(jù),星陣也從未發(fā)表過(guò)“證明了”超過(guò)AlphaGoZero這種言論。
關(guān)于zero天花板的master對(duì)比,論文中沒(méi)有提到過(guò)AlphaGo Master的模型大小,主流的非官方消息為20Block。而論文中并沒(méi)有提到20Block的zero版本與master版本的棋力對(duì)比,因此只看論文無(wú)法說(shuō)明zero天花板高于master。星陣只發(fā)表過(guò)類似“master方法天花板不一定低于zero方法”的言論,所謂“認(rèn)為zero天花板沒(méi)有master方法高”完全是曲解原意。
質(zhì)疑5:“星陣支持日本規(guī)則尚存疑問(wèn),日本規(guī)則雙活無(wú)目,請(qǐng)問(wèn)如何用中國(guó)規(guī)則模擬日本規(guī)則,如果只是看誰(shuí)收后的方法,不是真正意義上的日本規(guī)則?!?/p>
回應(yīng):日本規(guī)則是一種存在大量人為規(guī)定棋例的規(guī)則,本身很難程序化,星陣也沒(méi)有聲稱過(guò)支持“真正意義上的日本規(guī)則”。星陣設(shè)計(jì)了一種“實(shí)戰(zhàn)解決的數(shù)目法”,與日本規(guī)則近似度很高,并在17路挑戰(zhàn)賽中使用,并不是簡(jiǎn)單的只看誰(shuí)收后的方法。在2019年3月日本進(jìn)行的人機(jī)配對(duì)賽中,星陣和搭檔芮乃偉老師執(zhí)黑半目(盤面7目)險(xiǎn)勝對(duì)手,過(guò)程中星陣判斷精準(zhǔn),已經(jīng)可以說(shuō)明問(wèn)題。如果一定要較真的話,星陣確實(shí)支持不了“真正意義上的日本規(guī)則”。
質(zhì)疑6:“去年5月ai大賽,星陣10卡打單卡elf(雖然elf是v100,但是計(jì)算速度其實(shí)并不高),星陣宣稱那時(shí)候已經(jīng)達(dá)到elf水平,最終結(jié)果確是2:3險(xiǎn)勝。”
回應(yīng):“雖然elf是v100,但是計(jì)算速度其實(shí)并不高”這個(gè)前提毫無(wú)根據(jù)。根據(jù)elf公開的論文https://arxiv.org/abs/1902.04522,50秒約計(jì)算80000個(gè)盤面,折合1600playouts/sec。而星陣的10卡是1080ti,平均速度為1500 playouts/sec,考慮到elf模型較小,性能上星陣可以算稍占優(yōu)勢(shì),3:2的比分也說(shuō)明了當(dāng)時(shí)星陣與elf水平相近。
后記:星陣團(tuán)隊(duì)近期正在全力開發(fā)星陣網(wǎng)頁(yè)版,目的是讓每個(gè)喜歡圍棋的棋友都能無(wú)門檻用上高水平的圍棋AI。從星陣圍棋在去年4月公開亮相開始,各種陰謀論的猜測(cè)就陸續(xù)出現(xiàn)了。多次世界圍棋AI大賽星陣均取得了上佳的成績(jī),對(duì)人類的讓先、17路、讓二子挑戰(zhàn)賽也表現(xiàn)出色,同時(shí)今年開放的微信小程序“星陣陪練”(純神經(jīng)網(wǎng)絡(luò))也受到廣大棋友的一致好評(píng),其中的9D水平被公認(rèn)明顯強(qiáng)于已有的任何開源AI的純神經(jīng)網(wǎng)絡(luò),這些都證明了星陣的水平和技術(shù)創(chuàng)新。
然而不斷有人刻意忽略部分事實(shí),例如將“星陣12x 1:1、24x 0:1 5卡”的結(jié)果宣傳為“2:0同配置星陣”。還將星陣團(tuán)隊(duì)成員的一些正常言論進(jìn)行“加工”,去掉上下文、曲解原意,修改變成有爭(zhēng)議的言論并廣為傳播。包括本次質(zhì)疑的內(nèi)容,其中有很多前提就存在明顯的錯(cuò)誤,由此推論出的星陣種種自然毫無(wú)說(shuō)服力可言。為了澄清這些質(zhì)疑,盡量還原事情的真相,我們力求每一個(gè)問(wèn)題都找到當(dāng)時(shí)的新聞報(bào)道、對(duì)局記錄等,做到言之有據(jù)。
關(guān)于網(wǎng)頁(yè)版的水平,較少盤數(shù)水平的測(cè)試原本就存在較大波動(dòng),對(duì)星陣有利的結(jié)果被歪曲成“星陣使用了各種不光彩的手段”,對(duì)星陣不利的結(jié)果自然被解釋成“星陣就是這個(gè)水平”。并且先后出現(xiàn)了大量自相矛盾的說(shuō)法:當(dāng)有人詢問(wèn)星陣水平的時(shí)候,可以說(shuō)“星陣同配置與XX權(quán)重差不多”;為了說(shuō)明星陣“針對(duì)性訓(xùn)練”,又會(huì)說(shuō)“星陣碾壓XX權(quán)重”。
星陣團(tuán)隊(duì)認(rèn)可每一個(gè)開源AI對(duì)圍棋所做的貢獻(xiàn),肯定每一個(gè)開源AI的實(shí)力。同時(shí)歡迎客觀公正的對(duì)比測(cè)試,接受合理的意見(jiàn),為廣大真正熱愛(ài)圍棋的愛(ài)好者們做出自己的貢獻(xiàn)。
