中文字幕 另类精品,亚洲欧美一区二区蜜桃,日本在线精品视频免费,孩交精品乱子片免费

<sup id="3hn2b"></sup>

    1. <sub id="3hn2b"><ol id="3hn2b"></ol></sub><legend id="3hn2b"></legend>

      1. <xmp id="3hn2b"></xmp>

      2. 新聞中心

        EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 并行AI RISC-V編譯器進(jìn)入Alpha測(cè)試

        并行AI RISC-V編譯器進(jìn)入Alpha測(cè)試

        作者: 時(shí)間:2025-05-15 來源:eenewseu 收藏

        芬蘭的 Flow Computing 已開始對(duì)其并行處理單元 (PPU) AI 模塊的 進(jìn)行 alpha 測(cè)試。

        本文引用地址:http://www.antipu.com.cn/article/202505/470476.htm

        PPU 能夠通過使用使源代碼利用該架構(gòu),將任何 CPU 架構(gòu)增加多達(dá) 100 倍。第一次目標(biāo)編譯表明,通過重新編譯現(xiàn)有代碼,可以顯著減少 CPU 模型中常見的循環(huán),達(dá)到 100 倍的預(yù)期性能。

        相比之下,只需將一些 CPU 內(nèi)核替換為 PPU,即可在不更改源代碼的情況下進(jìn)行 2 倍的改進(jìn),而無需重新編譯。

        識(shí)別現(xiàn)有源代碼中可由 PPU 有效加速的并行元素。分析代碼以確定哪些部分可以通過 PPU 加速得到增強(qiáng),然后編譯器將可并行化功能直接分配給 PPU,繞過 CPU 瓶頸。

        “我們?cè)谠缙陂_發(fā)階段充分證明的是,簡(jiǎn)單的并行工作負(fù)載會(huì)導(dǎo)致 CPU 中出現(xiàn)大量循環(huán),而沒有 PPU 增強(qiáng),而在具有 PPU 的 CPU 中,這些循環(huán)會(huì)顯著減少(如果不是實(shí)際上消除的話),”Flow Computing(芬蘭研究實(shí)驗(yàn)室 VTT 的衍生公司)的首席技術(shù)官、首席架構(gòu)師兼聯(lián)合創(chuàng)始人 Martti Forsell 博士說。

        “對(duì)于我們的工程師來說,在對(duì)集成到 CPU 模型中的 PPU 架構(gòu)的首次測(cè)試中,一個(gè)出乎意料的積極驚喜是,該軟件具有最佳的代碼質(zhì)量。”

        該編譯器允許將高級(jí)程序編譯為擴(kuò)展的 RISC-V 二進(jìn)制文件,并在 Flow 基于 gem5 的模擬器中執(zhí)行。gem5 廣泛應(yīng)用于各種公司,特別是在處理器設(shè)計(jì)、學(xué)術(shù)研究和嵌入式系統(tǒng)領(lǐng)域。gem5 是一個(gè)開源模擬器,支持許多架構(gòu),包括 RISC-V,AMD、ARM、Google、Intel、Qualcomm 和 SiFive 等組織將其用于定制處理器設(shè)計(jì)的研究、開發(fā)和性能分析。

        設(shè)計(jì)中的其他模塊,如矩陣單元、矢量單元、NPU 和 GPU,也全面受益于 PPU 的性能,并從 CPU 獲得重大提升。



        評(píng)論


        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉