2017-08-21 來源:網(wǎng)絡(luò)采編 編輯:蘇輕衣 分類:DOTA2
最近AI圈發(fā)生了兩件大事。第一件是DeepMind、Facebook等AI巨頭對《星際爭霸》研究興趣濃厚,公開發(fā)布研究工具和數(shù)據(jù);第二件是Open AI的機器人在dota2比賽中戰(zhàn)勝了人類頂級職業(yè)玩家。
至此,繼橫掃人類國際象棋大師和圍棋大師后,人工智能如今又將風(fēng)靡全球的電子競技游戲Dota2攻陷?梢灶A(yù)見,在很短的將來,萬眾矚目的《王者榮耀》頂級玩家,也會被人工智能打敗。
DeepMind等公司已經(jīng)在《星際爭霸》上研究了一段時間,但目前為止,根據(jù)前不久剛剛發(fā)布的最新進展,相關(guān)研究還沒有取得重大突破。
倒是OpenAI公司打敗DOTA人類頂級職業(yè)玩家,率先取得令人興奮的成就,一躍成為AI圈中的熱點。
回顧賽事,OpenAI公司的機器人表現(xiàn)可以說是非常“強悍”,出手“快”、“準”、“狠”,手法嫻熟,不僅會卡兵、補刀,還會取消掉技能抬手,而且具有強烈的攻擊性,連續(xù)兩局狂虐Dendi。
OpenAI的工程師表示,他們對機器人訓(xùn)練了2周,就獲得了足以擊敗全球最佳Dota 2專業(yè)玩家的能力。
伊隆·馬斯克看了戰(zhàn)況之后,抑制不住內(nèi)心激動,在推特上公開宣稱:OpenAI搞出了史上首個擊敗電子競技頂級玩家的人工智能。這比搞國際象棋和圍棋什么的復(fù)雜多了。
這次打敗DOTA人類選手比賽的難度究竟有多大?
雖然OpenAI公司沒有公布更多細節(jié),不過,我們可以根據(jù)已有的信息進行客觀評價。
1、屬于多人在線戰(zhàn)術(shù)競技游戲(MOBA)中的單人模式。這次是在中路進行影魔的SOLO對決,屬于1V1遭遇戰(zhàn)模式,需要戰(zhàn)爭迷霧隱藏的信息較少,與5V5模式在難度上還有較大差距。
正常的DOTA 2游戲中,2支對抗隊伍各由5名玩家組成,游戲過程中需要隨時調(diào)整作戰(zhàn)策略、需要大量的團隊溝通和協(xié)調(diào),任意一名玩家都可以隨時根據(jù)戰(zhàn)況,召喚其他隊友組織支援、抓捕或埋伏,突發(fā)情況多、對抗較為激烈,相互配合和節(jié)奏的把握非常重要,比賽時長通常要45分鐘。
在1v1模式中,擊敗對手主要靠機械技能和短期策略,并不涉及長期規(guī)劃和協(xié)調(diào),而后者才是對當前AI技術(shù)來說最具挑戰(zhàn)性的部分。因此,OpenAI計劃在明年推出可以進行5V5協(xié)同作戰(zhàn)的更高智能的機器人。
2、相比圍棋,DOTA對戰(zhàn)中機器人的反應(yīng)時間占據(jù)優(yōu)勢。AlphaGo和柯潔對戰(zhàn)時,雙方時間都是3小時,時間的增加,有利于人類棋手發(fā)揮。
實際上,時間長短對于AlphaGo來說并不重要,因為它每一步棋的決策時間最多只需10秒。這次DOTA對戰(zhàn)則不同,人類選手直面機器人,需要幾乎在一瞬間大致估計出與對手之間的距離,是否進行攻擊、是否值得背水一戰(zhàn),再通過神經(jīng)系統(tǒng)發(fā)出信號控制雙手操縱鼠標和鍵盤,這一連串的動作需要耗費大量時間。
OpenAI機器人可以獲得精準的對手位置、技能冷卻時間信息,并迅速計算出準確的攻擊時間節(jié)點,確保將對手一擊致命。仔細觀察對戰(zhàn)過程,你可以看到,機器人有幾次攻擊都是在最大距離上展開,最后在短短10分鐘贏得對戰(zhàn)。
為何馬斯克對機器人的這次成功這么看重?
“自我對局”(Self-play)的理念是OpenAI研發(fā)的關(guān)鍵。OpenAI的機器人整個學(xué)習(xí)過程隨機開始,并且通過和自己對抗進行學(xué)習(xí)。OpenAI的CTO Greg Brockman介紹,技術(shù)人員通過神經(jīng)網(wǎng)絡(luò)對機器人進行了數(shù)千次的自我對局進行訓(xùn)練。自我對局的參與人選擇針對其對手的平均行為的最佳反應(yīng)。
因此,OpenAI研發(fā)的機器人,可以從完全的隨機狀態(tài)一步步發(fā)展到如今的世界頂級水平。雖然這并不是最新最前沿的理論,但令人的震驚的是,機器人學(xué)會了人類玩家已經(jīng)在使用的技術(shù),并吸收為自己所用,并用來打敗人類玩家。
谷歌公司開發(fā)的AlphaGo在打敗了人類頂級選手李世石、柯潔之后,宣布永久退出圍棋比賽。同樣,OpenAI公司開發(fā)這樣一個機器人,并不是為了打敗DOTA人類職業(yè)玩家這么簡單。
自主學(xué)習(xí)游戲規(guī)則,通過自我對局進行訓(xùn)練,能夠掌握復(fù)雜***游戲的機器人可以有其他更廣闊的用途。最直接的例子是,圍棋選手已經(jīng)開始學(xué)習(xí)AlphaGo機器人的下棋方式。
同樣,一些DOTA游戲玩家開始利用OpenAI公司機器人進行日常訓(xùn)練。智能機器人可以為游戲娛樂產(chǎn)業(yè)提供更多價值,游戲娛樂也會助推人工智能技術(shù)快速發(fā)展。
AI公司的目標:建立更加通用的智能系統(tǒng)
顯然,OpenAI公司的雄心不止于此,“我們所建立的是一個普遍的學(xué)習(xí)系統(tǒng),盡管它在很多方面仍然受到限制,但它仍然能擊敗最優(yōu)秀的人類專家,”Brockman說,“這是朝著向建立更通用的系統(tǒng)邁出的關(guān)鍵一步,它可以學(xué)習(xí)真正復(fù)雜的、重要的現(xiàn)實世界里的任務(wù),比如做一名外科醫(yī)生。”
不僅在電子競技、醫(yī)療領(lǐng)域,OpenAI公司的這項技術(shù)在家政服務(wù)機器人領(lǐng)域和軍用機器人領(lǐng)域可能會發(fā)揮更大的價值。
最近人民網(wǎng)報道,有網(wǎng)友買掃地機器人后淚崩,仿佛買了一個智障,肆意展示各種蠢萌技能:掃地2年了,每天都會在在盥洗室地毯上被卡住,在沙發(fā)拐角上被卡住,在各種意想不到的角度上被卡住,和各種桌子腿過不去。
目前在售的這類掃地機器人有一個救命技能,被卡住了就發(fā)求救信號,讓人把它搬出來,感覺它的主業(yè)不是打掃衛(wèi)生,而是負責搞笑賣萌。
可以預(yù)見,采用“自我對局”(Self-play)理念來提升掃地機器人的學(xué)習(xí)能力,可以在隨機探索整個室內(nèi)環(huán)境的過程中,通過和自己、和家庭環(huán)境進行對抗學(xué)習(xí),不斷提升對整體環(huán)境的感知應(yīng)對能力,最終達到人類保潔水平。
進行更大強度的訓(xùn)練,甚至可以成為一個頂級的家庭衛(wèi)生保潔員,避免因為被卡住頻頻向人類求助的窘迫,成為真正意義上的智能家居產(chǎn)品。
在軍用領(lǐng)域,“自我對局”(Self-play)的設(shè)計理念同樣大有可為。2015年9月,美國海軍陸戰(zhàn)隊開始測試谷歌旗下機器人公司波士頓動力開發(fā)出的新一代機械狗Spot,而這款機械狗的“前輩”BigDog早就在2014年在夏威夷投入使用了。
這只機器狗只是被看成是可以執(zhí)行偵察和搜索任務(wù)軍犬的替代品。準確來說,這不僅僅是一條軍犬,進行深度改造后,可以變?yōu)橐粋可以在戰(zhàn)區(qū)和災(zāi)區(qū)提供導(dǎo)航,執(zhí)行搜索任務(wù),排查建筑物危險,裝備上武器就可以作戰(zhàn)的超級士兵。
同樣是激烈的對戰(zhàn)環(huán)境,在DOTA2中可以迅速準確評估戰(zhàn)況、動作靈活、攻擊性強的OpenAI公司機器人給我們展示了其強大的學(xué)習(xí)、超越能力,借鑒和改進機器人背后的通用學(xué)習(xí)系統(tǒng),用來提升軍用機器人的學(xué)習(xí)能力、偵查作戰(zhàn)能力,對于保存軍隊有生力量具有重要意義。
創(chuàng)辦特斯拉公司大獲成功的硅谷奇才伊隆·馬斯克,可能正是看中了這項技術(shù)蘊含的潛在巨大商業(yè)價值而興奮不已。
聲明:中國電競網(wǎng)(5asj.com)登載此文出于傳遞更多信息之目的,并不代表本站立場
關(guān)于我們 | 商務(wù)洽談 | 聯(lián)系我們 | 友情鏈接 | 版權(quán)聲明 | 站務(wù)聯(lián)系QQ:8896 - 0575 Copyright © 2015-2018 中國電競網(wǎng) m.sdoldhj.cn V2.0 打造最專業(yè)的電競游戲門戶網(wǎng)站