打敗DOTA2頂級玩家的機器人到底強在哪？

2017-08-21 來源：網(wǎng)絡(luò)采編編輯：蘇輕衣分類：DOTA2

　　最近AI圈發(fā)生了兩件大事。第一件是DeepMind、Facebook等AI巨頭對《星際爭霸》研究興趣濃厚，公開發(fā)布研究工具和數(shù)據(jù)；第二件是Open AI的機器人在dota2比賽中戰(zhàn)勝了人類頂級職業(yè)玩家。Q1j中國電競網(wǎng)

　　至此，繼橫掃人類國際象棋大師和圍棋大師后，人工智能如今又將風(fēng)靡全球的電子競技游戲Dota2攻陷�？梢灶A(yù)見，在很短的將來，萬眾矚目的《王者榮耀》頂級玩家，也會被人工智能打敗。Q1j中國電競網(wǎng)

　　DeepMind等公司已經(jīng)在《星際爭霸》上研究了一段時間，但目前為止，根據(jù)前不久剛剛發(fā)布的最新進展，相關(guān)研究還沒有取得重大突破。Q1j中國電競網(wǎng)

　　倒是OpenAI公司打敗DOTA人類頂級職業(yè)玩家，率先取得令人興奮的成就，一躍成為AI圈中的熱點。Q1j中國電競網(wǎng)

　　回顧賽事，OpenAI公司的機器人表現(xiàn)可以說是非常“強悍”，出手“快”、“準”、“狠”，手法嫻熟，不僅會卡兵、補刀，還會取消掉技能抬手，而且具有強烈的攻擊性，連續(xù)兩局狂虐Dendi。Q1j中國電競網(wǎng)

　　OpenAI的工程師表示，他們對機器人訓(xùn)練了2周，就獲得了足以擊敗全球最佳Dota 2專業(yè)玩家的能力。Q1j中國電競網(wǎng)

　　伊隆·馬斯克看了戰(zhàn)況之后，抑制不住內(nèi)心激動，在推特上公開宣稱：OpenAI搞出了史上首個擊敗電子競技頂級玩家的人工智能。這比搞國際象棋和圍棋什么的復(fù)雜多了。Q1j中國電競網(wǎng)

　　這次打敗DOTA人類選手比賽的難度究竟有多大？Q1j中國電競網(wǎng)

　　雖然OpenAI公司沒有公布更多細節(jié)，不過，我們可以根據(jù)已有的信息進行客觀評價。Q1j中國電競網(wǎng)

　　1、屬于多人在線戰(zhàn)術(shù)競技游戲（MOBA）中的單人模式。這次是在中路進行影魔的SOLO對決，屬于1V1遭遇戰(zhàn)模式，需要戰(zhàn)爭迷霧隱藏的信息較少，與5V5模式在難度上還有較大差距。Q1j中國電競網(wǎng)

　　正常的DOTA 2游戲中，2支對抗隊伍各由5名玩家組成，游戲過程中需要隨時調(diào)整作戰(zhàn)策略、需要大量的團隊溝通和協(xié)調(diào)，任意一名玩家都可以隨時根據(jù)戰(zhàn)況，召喚其他隊友組織支援、抓捕或埋伏，突發(fā)情況多、對抗較為激烈，相互配合和節(jié)奏的把握非常重要，比賽時長通常要45分鐘。Q1j中國電競網(wǎng)

　　在1v1模式中，擊敗對手主要靠機械技能和短期策略，并不涉及長期規(guī)劃和協(xié)調(diào)，而后者才是對當前AI技術(shù)來說最具挑戰(zhàn)性的部分。因此，OpenAI計劃在明年推出可以進行5V5協(xié)同作戰(zhàn)的更高智能的機器人。Q1j中國電競網(wǎng)

　　2、相比圍棋，DOTA對戰(zhàn)中機器人的反應(yīng)時間占據(jù)優(yōu)勢。AlphaGo和柯潔對戰(zhàn)時，雙方時間都是3小時，時間的增加，有利于人類棋手發(fā)揮。Q1j中國電競網(wǎng)

　　實際上，時間長短對于AlphaGo來說并不重要，因為它每一步棋的決策時間最多只需10秒。這次DOTA對戰(zhàn)則不同，人類選手直面機器人，需要幾乎在一瞬間大致估計出與對手之間的距離，是否進行攻擊、是否值得背水一戰(zhàn)，再通過神經(jīng)系統(tǒng)發(fā)出信號控制雙手操縱鼠標和鍵盤，這一連串的動作需要耗費大量時間。Q1j中國電競網(wǎng)

　　OpenAI機器人可以獲得精準的對手位置、技能冷卻時間信息，并迅速計算出準確的攻擊時間節(jié)點，確保將對手一擊致命。仔細觀察對戰(zhàn)過程，你可以看到，機器人有幾次攻擊都是在最大距離上展開，最后在短短10分鐘贏得對戰(zhàn)。Q1j中國電競網(wǎng)

　　為何馬斯克對機器人的這次成功這么看重？Q1j中國電競網(wǎng)

　　“自我對局”（Self-play）的理念是OpenAI研發(fā)的關(guān)鍵。OpenAI的機器人整個學(xué)習(xí)過程隨機開始，并且通過和自己對抗進行學(xué)習(xí)。OpenAI的CTO Greg Brockman介紹，技術(shù)人員通過神經(jīng)網(wǎng)絡(luò)對機器人進行了數(shù)千次的自我對局進行訓(xùn)練。自我對局的參與人選擇針對其對手的平均行為的最佳反應(yīng)。Q1j中國電競網(wǎng)

　　因此，OpenAI研發(fā)的機器人，可以從完全的隨機狀態(tài)一步步發(fā)展到如今的世界頂級水平。雖然這并不是最新最前沿的理論，但令人的震驚的是，機器人學(xué)會了人類玩家已經(jīng)在使用的技術(shù)，并吸收為自己所用，并用來打敗人類玩家。Q1j中國電競網(wǎng)

　　谷歌公司開發(fā)的AlphaGo在打敗了人類頂級選手李世石、柯潔之后，宣布永久退出圍棋比賽。同樣，OpenAI公司開發(fā)這樣一個機器人，并不是為了打敗DOTA人類職業(yè)玩家這么簡單。Q1j中國電競網(wǎng)

　　自主學(xué)習(xí)游戲規(guī)則，通過自我對局進行訓(xùn)練，能夠掌握復(fù)雜***游戲的機器人可以有其他更廣闊的用途。最直接的例子是，圍棋選手已經(jīng)開始學(xué)習(xí)AlphaGo機器人的下棋方式。Q1j中國電競網(wǎng)

　　同樣，一些DOTA游戲玩家開始利用OpenAI公司機器人進行日常訓(xùn)練。智能機器人可以為游戲娛樂產(chǎn)業(yè)提供更多價值，游戲娛樂也會助推人工智能技術(shù)快速發(fā)展。Q1j中國電競網(wǎng)

　　AI公司的目標：建立更加通用的智能系統(tǒng)Q1j中國電競網(wǎng)

　　顯然，OpenAI公司的雄心不止于此，“我們所建立的是一個普遍的學(xué)習(xí)系統(tǒng)，盡管它在很多方面仍然受到限制，但它仍然能擊敗最優(yōu)秀的人類專家，”Brockman說，“這是朝著向建立更通用的系統(tǒng)邁出的關(guān)鍵一步，它可以學(xué)習(xí)真正復(fù)雜的、重要的現(xiàn)實世界里的任務(wù)，比如做一名外科醫(yī)生。”Q1j中國電競網(wǎng)

　　不僅在電子競技、醫(yī)療領(lǐng)域，OpenAI公司的這項技術(shù)在家政服務(wù)機器人領(lǐng)域和軍用機器人領(lǐng)域可能會發(fā)揮更大的價值。Q1j中國電競網(wǎng)

　　最近人民網(wǎng)報道，有網(wǎng)友買掃地機器人后淚崩，仿佛買了一個智障，肆意展示各種蠢萌技能：掃地2年了，每天都會在在盥洗室地毯上被卡住，在沙發(fā)拐角上被卡住，在各種意想不到的角度上被卡住，和各種桌子腿過不去。Q1j中國電競網(wǎng)

　　目前在售的這類掃地機器人有一個救命技能，被卡住了就發(fā)求救信號，讓人把它搬出來，感覺它的主業(yè)不是打掃衛(wèi)生，而是負責搞笑賣萌。Q1j中國電競網(wǎng)

　　可以預(yù)見，采用“自我對局”（Self-play）理念來提升掃地機器人的學(xué)習(xí)能力，可以在隨機探索整個室內(nèi)環(huán)境的過程中，通過和自己、和家庭環(huán)境進行對抗學(xué)習(xí)，不斷提升對整體環(huán)境的感知應(yīng)對能力，最終達到人類保潔水平。Q1j中國電競網(wǎng)

　　進行更大強度的訓(xùn)練，甚至可以成為一個頂級的家庭衛(wèi)生保潔員，避免因為被卡住頻頻向人類求助的窘迫，成為真正意義上的智能家居產(chǎn)品。Q1j中國電競網(wǎng)

　　在軍用領(lǐng)域，“自我對局”（Self-play）的設(shè)計理念同樣大有可為。2015年9月，美國海軍陸戰(zhàn)隊開始測試谷歌旗下機器人公司波士頓動力開發(fā)出的新一代機械狗Spot，而這款機械狗的“前輩”BigDog早就在2014年在夏威夷投入使用了。Q1j中國電競網(wǎng)

　　這只機器狗只是被看成是可以執(zhí)行偵察和搜索任務(wù)軍犬的替代品。準確來說，這不僅僅是一條軍犬，進行深度改造后，可以變?yōu)橐粋€可以在戰(zhàn)區(qū)和災(zāi)區(qū)提供導(dǎo)航，執(zhí)行搜索任務(wù)，排查建筑物危險，裝備上武器就可以作戰(zhàn)的超級士兵。Q1j中國電競網(wǎng)

　　同樣是激烈的對戰(zhàn)環(huán)境，在DOTA2中可以迅速準確評估戰(zhàn)況、動作靈活、攻擊性強的OpenAI公司機器人給我們展示了其強大的學(xué)習(xí)、超越能力，借鑒和改進機器人背后的通用學(xué)習(xí)系統(tǒng)，用來提升軍用機器人的學(xué)習(xí)能力、偵查作戰(zhàn)能力，對于保存軍隊有生力量具有重要意義。Q1j中國電競網(wǎng)

　　創(chuàng)辦特斯拉公司大獲成功的硅谷奇才伊隆·馬斯克，可能正是看中了這項技術(shù)蘊含的潛在巨大商業(yè)價值而興奮不已。Q1j中國電競網(wǎng)

聲明：中國電競網(wǎng)（5asj.com）登載此文出于傳遞更多信息之目的，并不代表本站立場