設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色
雷军回武汉大学发了 100 万奖学金    DeepSeek V3“小版本升级”

騰訊 AI 登頂國際麻將平臺并刷新全球最好成績,此前已戰(zhàn)勝多個職業(yè)選手

2023/7/11 14:16:09 來源:IT之家 作者:浩渺(實習) 責編:汪淼

IT之家 7 月 11 日消息,騰訊官方今日宣布,騰訊 AI 登頂國際麻將平臺,在日本麻將天鳳平臺特上房達到穩(wěn)定段位 10.68 段,刷新了 AI 在麻將領(lǐng)域取得的最好成績

圖片 1

▲ 圖源騰訊,下同

據(jù)騰訊官方介紹,騰訊 AI 絕藝 LuckyJ 之所以去日本打比賽,是因為“天鳳”是知名的日本麻將競技平臺,擁有較為體系化的競技規(guī)則和專業(yè)段位規(guī)則,受到“職業(yè)麻將界的廣泛認可”,全世界的麻將 AI 基本都在這里進行訓練和打段

天鳳平臺按照 1 段 — 11 段來進行排位,其中 7 段以上 3037 人,約占百分之一,而能達到 10 段的只有 27 人(含 AI),只占不到萬分之一,相當于王者榮耀里的榮耀王者段位。

圖片 1

IT之家從騰訊官方了解到,目前排名前三的麻將 AI 分別為絕藝 LuckyJ、Suphx 以及 NAGA。絕藝 LuckyJ 花了一千多局就達到了 10 段,在特上房所有對戰(zhàn)數(shù)超過 1000 把的注冊玩家,穩(wěn)定段位歷史排名第一。

值得一提的是,絕藝 LuckyJ 不僅達到日本麻將天鳳十段,之前還在國標麻將線下邀請賽中戰(zhàn)勝了 6 位國標麻將職業(yè)選手,成為首個戰(zhàn)勝國標麻將頂尖職業(yè)選手的麻將 AI

圖片 1

為了達到理想效果,騰訊 AI 采用了一種新型策略優(yōu)化算法 ACH(actor critic hedge),基于“強化學習和遺憾值最小化”的自我博弈技術(shù),使得 AI 能從零開始“自我學習和提高”,并最終收斂到一個最強的混合策略。同時該公司基于“樂觀價值估計的思想”,提出了一種高效的“非完美搜索方法”,使深度強化學習結(jié)合非完美信息搜索成為可能

騰訊稱,訓練麻將 AI,其實就是在訓練 AI 更好地去認識人類的世界。 最終讓 AI 能早日走進那些人類生活中,比如金融交易、自動駕駛、交通物流、拍賣系統(tǒng)等,解決真實世界的復雜問題。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:麻將,騰訊AI,絕藝 LuckyJ
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知