IT之家 7 月 11 日消息,騰訊官方今日宣布,騰訊 AI 登頂國際麻將平臺,在日本麻將天鳳平臺特上房達到穩(wěn)定段位 10.68 段,刷新了 AI 在麻將領(lǐng)域取得的最好成績。
據(jù)騰訊官方介紹,騰訊 AI 絕藝 LuckyJ 之所以去日本打比賽,是因為“天鳳”是知名的日本麻將競技平臺,擁有較為體系化的競技規(guī)則和專業(yè)段位規(guī)則,受到“職業(yè)麻將界的廣泛認可”,全世界的麻將 AI 基本都在這里進行訓練和打段。
天鳳平臺按照 1 段 — 11 段來進行排位,其中 7 段以上 3037 人,約占百分之一,而能達到 10 段的只有 27 人(含 AI),只占不到萬分之一,相當于王者榮耀里的榮耀王者段位。
IT之家從騰訊官方了解到,目前排名前三的麻將 AI 分別為絕藝 LuckyJ、Suphx 以及 NAGA。絕藝 LuckyJ 花了一千多局就達到了 10 段,在特上房所有對戰(zhàn)數(shù)超過 1000 把的注冊玩家,穩(wěn)定段位歷史排名第一。
值得一提的是,絕藝 LuckyJ 不僅達到日本麻將天鳳十段,之前還在國標麻將線下邀請賽中戰(zhàn)勝了 6 位國標麻將職業(yè)選手,成為首個戰(zhàn)勝國標麻將頂尖職業(yè)選手的麻將 AI。
為了達到理想效果,騰訊 AI 采用了一種新型策略優(yōu)化算法 ACH(actor critic hedge),基于“強化學習和遺憾值最小化”的自我博弈技術(shù),使得 AI 能從零開始“自我學習和提高”,并最終收斂到一個最強的混合策略。同時該公司基于“樂觀價值估計的思想”,提出了一種高效的“非完美搜索方法”,使深度強化學習結(jié)合非完美信息搜索成為可能。
騰訊稱,訓練麻將 AI,其實就是在訓練 AI 更好地去認識人類的世界。 最終讓 AI 能早日走進那些人類生活中,比如金融交易、自動駕駛、交通物流、拍賣系統(tǒng)等,解決真實世界的復雜問題。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。