中文字幕另类精品,亚洲欧美一区二区蜜桃,日本在线精品视频免费,孩交精品乱子片免费

<sub id="3hn2b"><ol id="3hn2b"></ol></sub>

<xmp id="3hn2b"></xmp>

"); //-->

博客專欄

EEPW首頁 > 博客 > FuriosaAI推出高能效AI芯片：性能與英偉達(dá)L40S接近，功耗低40%！

FuriosaAI推出高能效AI芯片：性能與英偉達(dá)L40S接近，功耗低40%！

發(fā)布人：芯智訊時間：2024-10-18 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

發(fā)布文章

8月27日消息，在近日召開的Hot Chips 2024大會上，韓國AI芯片初創(chuàng)公司FuriosaAI 推出了一款面向高性能大型語言模型和多模態(tài)模型推理的高能效數(shù)據(jù)中心AI加速器 RNGD。

需要指出的是，這款芯片并不追求最高的AI性能，對標(biāo)的也不是英偉達(dá)的H100之類的高性能AI芯片，而是一款追求高能效、低功耗AI數(shù)據(jù)中心解決方案，性能與英偉達(dá)L40S接近，功耗還降低了40%。

具體來說，F(xiàn)uriosaAI RNGD基于臺積電5nm工藝制造，其核心的面積為653mm2，晶體管數(shù)量為400億顆，AI計算核心的頻率為1.0GHz，擁有256MB的片上SRAM，外圍還通過CoWoS-S封裝集成了48GB HBM3（2顆12層堆棧的24GB HBM），內(nèi)存帶寬為1.5TB/s。

在性能方面，基于 RNGD芯片的單張卡算力為64TFLOPS（FP8），可以運行Llama 3.1 8B等大語言模型，TDP功耗僅150W，相比之下英偉達(dá)H100 TDP則高達(dá)400W。而基于8張RNGD加速卡的系統(tǒng)，則可提供最高512TFLOPS（FP8）和1024TOPS（INT4）的計算能力。

根據(jù)FuriosaAI介紹，RNGD在運行擁有約100億個參數(shù)的模型時，能夠達(dá)到每秒處理多達(dá)3000個Token的吞吐量。在復(fù)雜的AI算法處理場景中，其能夠有效降低電費和冷卻成本，為數(shù)據(jù)中心提供了一種可持續(xù)的發(fā)展解決方案。與當(dāng)前市場上的主流GPU相比，RNGD芯片能耗大幅降低的同時，計算性能卻未受影響，提升了整體的經(jīng)濟效益。

正如前面所提及的，F(xiàn)uriosaAI并沒有將RNGD的目標(biāo)對準(zhǔn)高性能的英偉達(dá)H100之類的產(chǎn)品，而是瞄準(zhǔn)了英偉達(dá)L40S，目標(biāo)不僅是提供相似的性能，而且是以更低的功耗提供該性能。根據(jù)FuriosaAI提供的數(shù)據(jù)顯示，RNGD在擁有與英偉達(dá)L40S相近的AI性能的情況下，其能耗大約只有L40S的60%（即相當(dāng)于功耗降低了40%），這也反應(yīng)了其出色的能效表現(xiàn)。

FuriosaAI RNGD的高能效主要得益于其獨特的TCP架構(gòu)。FuriosaAI表示，該架構(gòu)在能效、性能和可編程性之間達(dá)成了良好的平衡，能夠高效管理數(shù)據(jù)和內(nèi)存。這使得RNGD在處理例如Llama3這樣的龐大模型時，比傳統(tǒng)GPU方案具備明顯的優(yōu)勢，尤其是在能效比方面。

當(dāng)然，這也得益于FuriosaAI RNGD來自于硬件、軟件和算法方面的聯(lián)合優(yōu)化。

比如，F(xiàn)uriosaAI一直試圖解決在硬件和軟件之間的抽象層上工作的挑戰(zhàn)。

張量收縮是FuriosaAI的主要操作之一。在BERT方面，占據(jù)了FLOPS算力的99%。

通常，我們把矩陣乘法作為基元，而不是張量收縮。

相反，抽象是在張量收縮級別。

FuriosaAI為其原語添加了一個低級einsum。

這里，矩陣A和B相乘產(chǎn)生C。

然后，F(xiàn)uriosaAI利用這一點，在具有內(nèi)存和計算單元的實際架構(gòu)上對其進(jìn)行調(diào)度。

從這里開始，一個完整的張量收縮可以是一個本原。

通過考慮空間和時間編排，他們可以提高效率和利用率。

Furiosa表示，它具有靈活的可重新配置性，這對于在批量變化時保持高性能非常重要。

下面是RNGD實現(xiàn)的情況：

以下是互連網(wǎng)絡(luò)，包括訪問暫存存儲器。

FuriosaAI正在使用PCIe Gen5 xq6進(jìn)行芯片到芯片的通信。它還通過PCIe交換機使用P2P進(jìn)行GPU之間的直接通信。

FuriosaAI支持SR-IOV進(jìn)行虛擬化。

FuriosaAI已經(jīng)為可靠性做了信號和電源完整性方面的工作。

下面是Furiosa LLM如何以流程圖的形式工作：

編譯器編譯映射到多個設(shè)備的每個分區(qū)。

編譯器優(yōu)化了模型的性能增益和能效。

服務(wù)框架做類似連續(xù)批處理的事情來獲得更多的利用率。

FuriosaAI公司有一個基于圖表的自動化工具來幫助量化。Furiosa可以支持許多不同的格式，包括FP8和INT4。

編輯：芯智訊-浪客劍編譯自：servethehome

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權(quán)請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：芯片

相關(guān)推薦

iPad mini突然更新，搭載A17 Pro芯片

iPad A17 芯片 | 2024-10-17

科技記者古爾曼：蘋果并未放棄自有蜂窩調(diào)制解調(diào)器技術(shù) 將花費數(shù)十億美元開發(fā)相關(guān)芯片

EDA/PCB 古爾曼蘋果蜂窩調(diào)制解調(diào)器芯片 SoC | 2024-08-19

英特爾計劃與日本 AIST 合作建立芯片研究中心

EDA/PCB 英特爾 AIST 芯片 EUV | 2024-09-03

先進(jìn)的鋰電池線性充電管理芯片BQ2057充電電路

設(shè)計方案先進(jìn) 鋰電池線性充電管理芯片 BQ2057 電路 | 2009-07-06

s3c4510 芯片手冊

資源下載 s3c4510 芯片手冊 | 2007-02-28

小鵬 MONA M03 首批量產(chǎn)車下線全系標(biāo)配高通 8155 芯片和 16GB 內(nèi)存

汽車電子小鵬 MONA M03 高通 8155 芯片內(nèi)存 | 2024-08-09

可編程快速充電管理芯片MAX712/ MAX713電路

設(shè)計方案可編程快速充電管理芯片 MAX712 MAX713 | 2009-07-06

半導(dǎo)體行業(yè)最高性能！Eliyan 推出芯?；ミB PHY：3nm 工藝、64Gbps / bump

EDA/PCB 芯片芯片設(shè)計工藝 | 2024-10-12

大嘴業(yè)話：臺積電是否就此帶著技術(shù)離開中國?

視頻臺積電，芯片，半導(dǎo)體，技術(shù) | 2023-03-23

大嘴業(yè)話：俄烏戰(zhàn)爭關(guān)“芯”幾何

視頻俄烏戰(zhàn)爭芯片 | 2022-06-21

PC行業(yè)要變天！曝聯(lián)發(fā)科首款A(yù)I PC芯片明年登場：劍指高通英特爾

智能計算 PC 聯(lián)發(fā)科 AI PC 芯片高通英特爾 | 2024-08-13

經(jīng)驗點滴之二：燒寫器PICKIT

jackwang | 2002-06-19

高效、節(jié)能、高集成，新一代電源管理芯片產(chǎn)品的技術(shù)特征

視頻 EEPW 電源芯片 | 2014-06-12

KS8999 以太網(wǎng)絡(luò)交換機芯片

資源下載 KS8999 以太網(wǎng)絡(luò)交換機芯片 | 2007-02-28

保證航天飛機起飛 NASA到處尋找8086芯片

hpnet | 2002-05-17

大嘴業(yè)話：是什么導(dǎo)致芯片漲價和行業(yè)蕭條？

視頻芯片，半導(dǎo)體，行業(yè)蕭條，漲價 | 2023-03-23

基于D類功放專用驅(qū)動芯片驅(qū)動的高保真純正弦波逆變器1

設(shè)計方案基于功放專用驅(qū)動芯片高保真正弦波逆變器 | 2009-07-06

大嘴業(yè)話：2023年第一期大嘴業(yè)話

視頻大嘴業(yè)話，芯片，半導(dǎo)體，技術(shù)，臺積電 | 2023-03-23

[原創(chuàng)]集成光學(xué)/IC模塊 -- 將系統(tǒng)級芯片提高到新水平

Gao | 2002-07-01

DS2413 1-Wire 雙通道尋址開關(guān)

資源下載 Maxim 雙通道尋址開關(guān) DS2413 1-Wire 芯片 | 2007-03-20

一文讀懂｜芯片流片的成本

芯片流片 | 2024-09-24

am29lv160db芯片燒寫/擦除判斷位d7不夠可靠?!

seasoblue | 2002-05-24

基于D類功放專用驅(qū)動芯片驅(qū)動的高保真純正弦波逆變器

設(shè)計方案基于功放專用驅(qū)動芯片高保真正弦波逆變器 | 2009-07-06

英偉達(dá)下一代車載自動駕駛域控芯片在合肥首次成功下線

英偉達(dá) 自動駕駛芯片控制器 | 2024-08-13

用MAX610系列AC／DC芯片構(gòu)成的小功率無變壓器穩(wěn)壓電源

設(shè)計方案 MAX610 系列芯片構(gòu)成功率變壓器穩(wěn)壓電源 | 2009-07-06

中國芯片制造設(shè)備進(jìn)口達(dá)創(chuàng)紀(jì)錄260億美元

芯片半導(dǎo)體 ASML | 2024-09-03

ep7312芯片原理及應(yīng)用

資源下載 Cirrus Logic 公司 ARM 芯片 EP7312 嵌入式內(nèi)存映射 | 2007-02-16

Dallas實時時鐘（RTC)芯片DS1306硬件手冊

資源下載 MAXIM INTEGRATED PRODUCTS Dallas 實時時鐘（RTC)芯片 DS1306 | 2007-02-09

蘋果自研調(diào)制解調(diào)器芯片有望明年亮相最終將改變iPhone外觀和功能

手機與無線通信蘋果調(diào)制解調(diào)器芯片 iPhone | 2024-08-19

預(yù)測：全球通信芯片市場2003年將反彈

hpnet | 2002-05-25

上一篇：IBM推出5.5GHz八核處理器Telum II，還有300TOPS的Spyre AI加速器

焦點

推薦視頻

更多>>

技術(shù)專區(qū)

<ruby id="hz4bw"><ol id="hz4bw"></ol></ruby>

<p id="hz4bw"><kbd id="hz4bw"></kbd></p>

<address id="hz4bw"></address>

<address id="hz4bw"></address><ruby id="hz4bw"><ol id="hz4bw"></ol></ruby>

<p id="hz4bw"><kbd id="hz4bw"></kbd></p>