設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Tachyum 公布 Prodigy 通用 128 核 CPU 規(guī)格:高達(dá) 5.7GHz、TDP 950W、16 個(gè) DDR5 通道

2022/6/13 14:02:47 來源:IT之家 作者:瀟公子 責(zé)編:瀟公子
感謝IT之家網(wǎng)友 溯波 的線索投遞!

IT之家 6 月 13 日消息,據(jù) tomshardware 報(bào)道,當(dāng) Tachyum 在 Hot Chips 18 上推出其 Prodigy 通用處理器的概念時(shí),它的芯片設(shè)計(jì)允許使用動(dòng)態(tài)二進(jìn)制轉(zhuǎn)換器運(yùn)行任何代碼,這引起了轟動(dòng)。它在執(zhí)行本機(jī)代碼和翻譯代碼時(shí)表現(xiàn)出了高性能。Tachyum 公司花了一段時(shí)間來設(shè)計(jì)實(shí)際的硬件,接受評(píng)估套件的預(yù)訂;該公司還披露了其 Prodigy 確切規(guī)格。它們看起來確實(shí)令人印象深刻,但每個(gè)芯片 950W 的散熱設(shè)計(jì)功率(TDP)也令人恐懼。

每個(gè) Tachyum Prodigy 處理器具有多達(dá) 128 個(gè)專有內(nèi)核,與 16 個(gè) DDR5 內(nèi)存通道(用于 1024 位接口)配合,支持高達(dá) 7200 MT / s 的數(shù)據(jù)傳輸率(因此提供高達(dá) 921.6 GBps 的帶寬)以及 64 個(gè) PCIe 5.0 通道。此外,該芯片總共支持高達(dá) 8TB 的 DDR5 內(nèi)存,這與其他制造商即將推出的服務(wù)器 CPU 一致。至于時(shí)鐘頻率,Tachyum 的 Prodigy 設(shè)計(jì)運(yùn)行頻率高達(dá) 5.7 GHz,是臺(tái)積電性能優(yōu)化的 N5P 工藝技術(shù)的產(chǎn)物。

在性能方面,Tachyum 預(yù)計(jì)其旗艦 Prodigy T16128-AIX 處理器可為 HPC 提供高達(dá) 90 FP64 TFLOPS 以及高達(dá) 12 “AI PetaFLOPS”用于推理和訓(xùn)練,(大概是在運(yùn)行本機(jī)代碼時(shí))根據(jù)發(fā)布的規(guī)格功耗高達(dá) 950W(并使用液體冷卻)。同時(shí),Tachyum 的 Prodigy 處理器可以在 2 路和 4 路配置下工作。作為對(duì)比,AMD 的 Instinct MI250X 在大約 560W 的 HPC 中具有 96 FP64 TFLOPS 的峰值吞吐量。相比之下,Nvidia 的 H100 SXM5 可以在 700W 下為 AI 提供高達(dá) 20 INT8 / FP8 PetaOPS / PetaFLOPS(稀疏時(shí)高達(dá) 40 PetaOPS / PetaFLOPS)。然而,計(jì)算 GPU 都不能用于通用工作負(fù)載。這正是它變得有趣的時(shí)候。

Tachyum 的 Prodigy 是一款通用同質(zhì)處理器,最多可容納 128 個(gè)專有的 64 位 VLIW 內(nèi)核,每個(gè)內(nèi)核具有兩個(gè) 1024 位矢量單元和一個(gè) 4096 位矩陣單元。此外,每個(gè)內(nèi)核都有一個(gè) 64KB 指令緩存、一個(gè) 64KB 數(shù)據(jù)緩存、1MB L2 緩存,并且可以利用其他內(nèi)核未使用的 L2 緩存作為 L3 緩存。

Tachyum 首席執(zhí)行官兼聯(lián)合創(chuàng)始人 Radoslav Danilak 與 Golem.de 交談時(shí)表示,Tachyum 的 VLIW 內(nèi)核是有序內(nèi)核,但當(dāng)編譯器制造商進(jìn)行適當(dāng)優(yōu)化時(shí),它們可以支持 4 路無序。他還再次強(qiáng)調(diào),Prodigy 指令集架構(gòu)可以通過使用所謂的 poison bits 軟件實(shí)現(xiàn)非常高的指令級(jí)并行性。

據(jù)該公司稱,這些內(nèi)核運(yùn)行為 Prodigy(VLIW 架構(gòu)有望大放異彩)以及 x86、Arm 和 RISC-V 二進(jìn)制文件編寫并明確優(yōu)化的本機(jī)代碼,使用軟件仿真并且不會(huì)降低性能。從歷史上看,所有讓 VLIW 處理器執(zhí)行 x86 代碼的嘗試都失敗了(例如,Transmeta 的 Crusoe、Intel 的 Itanium),主要是因?yàn)樘囟ǖ?CPU 架構(gòu)和仿真效率低下。Tachyum 負(fù)責(zé)人承認(rèn),Qemu 二進(jìn)制翻譯將性能降低了 30% 到 40%(沒有透露任何基準(zhǔn)),但希望現(xiàn)實(shí)世界的性能仍然足夠高以具有競(jìng)爭(zhēng)力。同時(shí),一些程序已經(jīng)原生支持。

“我們?cè)С?GCC 和 Linux,而且 FreeBSD 現(xiàn)在也可以在 Prodigy 上運(yùn)行,”Danilak 說?!癆pache、MongoDB 或 Python 已經(jīng)原生運(yùn)行,Pytorch 和 Tensorflow 框架也可用?!?/p>

Tachyum 強(qiáng)調(diào),Prodigy 不是加速器,而是真正的 CPU,將與 AMD、Intel 和其他公司競(jìng)爭(zhēng)。為確保該處理器能夠在通用和 AI 工作負(fù)載中提供具有競(jìng)爭(zhēng)力的性能,該公司自 2018 年首次推出以來對(duì)其設(shè)計(jì)實(shí)施進(jìn)行了大量更改。

“我們是 CPU 替代品,而不是 AI 加速器公司,我們的目標(biāo)是云 / 超大規(guī)模和電信公司,”Danilak 說?!半S著時(shí)間的推移,我們計(jì)劃贏得一些超級(jí)計(jì)算機(jī)客戶,因此我們將向量 / MAC 單元的寬度從 512 位增加到 1024 位(這也為人工智能的 4096 位矩陣運(yùn)算帶來了必要的數(shù)據(jù)路徑)?!?/p>

事實(shí)上,Tachyum 的 Prodigy 承諾的特別優(yōu)勢(shì)是它能夠執(zhí)行不同類型的代碼。假設(shè)它可以在執(zhí)行通用工作負(fù)載(即時(shí) ces),它可能會(huì)為亞馬遜 AWS、微軟 Azure 等提供一些額外的靈活性,因?yàn)槿绻枰脑?,它們將能夠?yàn)?AI、HPC 和通用實(shí)例使用相同的機(jī)器。當(dāng)然,它需要來自不同方的一些實(shí)際軟件工作,這可能會(huì)奏效,至少在理論上可以。

應(yīng)該指出的是,Tachyum 仍然沒有任何 Prodigy 芯片。因此,所有的性能預(yù)測(cè)都是模擬的產(chǎn)物,而公司現(xiàn)在唯一擁有的是其處理器的 FPGA 原型。

與此同時(shí),Tachyum 公司最近開始接受 Tachyum 的 Prodigy 評(píng)估平臺(tái)的預(yù)訂,該平臺(tái)將使用一些 Prodigy 芯片??蛻舯仨氃?2022 年 7 月 31 日之前下訂單,實(shí)際硬件交付時(shí)間約為“收到訂單后的六到九個(gè)月”。

如果一切按計(jì)劃進(jìn)行,Tachyum 預(yù)計(jì)將在 8 月中旬流片出第一個(gè) Prodigy 芯片(可能小于 500 mm^2)。在那之后,該公司預(yù)計(jì)將在 12 月左右獲得其芯片的第一批樣品,如果芯片工作正常,該公司計(jì)劃開始提供樣品(即發(fā)送評(píng)估套件)。通常,芯片從晶圓廠返回后大約需要一年時(shí)間。盡管如此,Tachyum 仍希望其首款處理器能夠按計(jì)劃工作,并能夠在 2023 年上半年開始實(shí)際量產(chǎn)。

未來,Danilak 設(shè)想 Prodigy 2 處理器使用臺(tái)積電 N3 節(jié)點(diǎn)之一制造,該處理器將以相同的功率提供兩倍的性能以及 PCIe Gen6 支持。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Tachyum,CPU,芯片

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知