中文字幕另类精品,亚洲欧美一区二区蜜桃,日本在线精品视频免费,孩交精品乱子片免费

<sub id="3hn2b"><ol id="3hn2b"></ol></sub>

<xmp id="3hn2b"></xmp>

<bdo id="rxr0d"><th id="rxr0d"><pre id="rxr0d"></pre></th></bdo>

新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

作者：時(shí)間：2023-12-12 來(lái)源：量子位

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

一條神秘磁力鏈接引爆整個(gè) AI 圈，現(xiàn)在，正式測(cè)評(píng)結(jié)果終于來(lái)了：

本文引用地址：http://www.antipu.com.cn/article/202312/453814.htm

首個(gè)開源 MoE 大模型 Mixtral 8x7B，已經(jīng)達(dá)到甚至超越了 Llama 2 70B 和 GPT-3.5 的水平。

（對(duì)，就是傳聞中 GPT-4 的同款方案。）

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

并且由于是稀疏模型，處理每個(gè) token 僅用了 12.9B 參數(shù)就做到了這般成績(jī)，其推理速度和成本也與 12.9B 的密集模型相當(dāng)。

消息一出，再次在社交媒體上掀起討論熱潮。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

OpenAI 創(chuàng)始成員 Andrej Karpathy 第一時(shí)間趕到現(xiàn)場(chǎng)整理起了筆記，還高亮出了重點(diǎn)：這家“歐版 OpenAI”透露出的最強(qiáng)模型，還只是“中杯”。

p.s. Mixtral 8×7B 甚至只是小杯……

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

英偉達(dá) AI 科學(xué)家 Jim Fan 則贊說(shuō)：

每個(gè)月都會(huì)有十幾個(gè)新的模型冒出來(lái)，但真正能經(jīng)得住檢驗(yàn)的卻寥寥無(wú)幾，能引發(fā)大家伙熱烈關(guān)注的就更少了。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

并且這波啊，不僅是模型背后公司 Mistral AI 大受關(guān)注，也帶動(dòng) MoE（Mixture of Experts）再次成為開源 AI 社區(qū)的最火議題。

HuggingFace 官方就趁熱發(fā)布了一篇 MoE 的解析博文，同樣打出了“轉(zhuǎn)發(fā)如潮”的效果。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

值得關(guān)注的是，Mistral AI 的最新估值已經(jīng)沖破 20 億美元，在短短 6 個(gè)月中增長(zhǎng)了 7 倍多……

基本超越 Llama 2 70B

說(shuō)起來(lái)，Mistral AI 這家公司也是不走尋常路。隔壁大廠前腳剛轟轟烈烈搞發(fā)布會(huì)，慢慢悠悠發(fā)模型，他們可倒好，直接來(lái)了個(gè)程序顛倒：

先甩鏈接開放下載，又給 vLLM 項(xiàng)目（一個(gè)大模型推理加速工具）提了 PR，最后才想起來(lái)發(fā)布技術(shù)博客給自家模型整了個(gè)正經(jīng)官宣。

△ 模型一開始是醬嬸發(fā)布的

那么還是先來(lái)看看，官方給出了哪些信息，與這兩天吃瓜群眾自己扒出來(lái)的細(xì)節(jié)有何不同。

首先，官方自信地表示：

Mixtral 8×7B 在大多數(shù)基準(zhǔn)測(cè)試中都優(yōu)于 Llama 2 70B，推理速度快了 6 倍。
它是最強(qiáng)大的、具有寬松許可的開放權(quán)重模型，也是最佳性價(jià)比之選。

具體來(lái)說(shuō)，Mixtral 采用了稀疏混合專家網(wǎng)絡(luò)，是一個(gè) decoder-only 的模型。在其中，前饋塊會(huì)從 8 組不同的參數(shù)組中進(jìn)行選擇 ——

也就是說(shuō)，實(shí)際上，Mixtral 8×7B 并不是 8 個(gè) 7B 參數(shù)模型的集合，僅僅是 Transformer 中的前饋塊有不同的 8 份。

這也就是為什么 Mixtral 的參數(shù)量并不是 56B，而是 46.7B。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

其特點(diǎn)包括以下幾個(gè)方面：

在大多數(shù)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)于 Llama 2 70B，甚至足以擊敗 GPT-3.5
上下文窗口為 32k
可以處理英語(yǔ)、法語(yǔ)、意大利語(yǔ)、德語(yǔ)和西班牙語(yǔ)
在代碼生成方面表現(xiàn)優(yōu)異
遵循 Apache 2.0 許可（免費(fèi)商用）

具體測(cè)試結(jié)果如下：

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

另外，在幻覺(jué)問(wèn)題方面，Mixtral 的表現(xiàn)也由于 Llama 2 70B：

在 TruthfulQA 基準(zhǔn)上的成績(jī)是 73.9% vs 50.2%；在 BBQ 基準(zhǔn)上呈現(xiàn)更少的偏見；在 BOLD 上，Mixtral 顯示出比 Llama 2 更積極的情緒。

此次與 Mixtral 8×7B 基礎(chǔ)版本一起發(fā)布的，還有 Mixtral 8x7B Instruct 版本。后者經(jīng)過(guò) SFT 和 DPO 優(yōu)化，在 MT-Bench 上拿到了 8.3 的分?jǐn)?shù)，跟 GPT-3.5 差不多，優(yōu)于其他開源大模型。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

目前，Mistral 官方已經(jīng)宣布上線 API 服務(wù)，不過(guò)還是邀請(qǐng)制，未受邀用戶需要排隊(duì)等待。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

值得關(guān)注的是，API 分為三個(gè)版本：

小小杯（Mistral-tiny），對(duì)應(yīng)模型是 Mistral 7B Instruct；
小杯（Mistral-small），對(duì)應(yīng)模型是這次發(fā)布的 Mixtral 8×7B；
中杯（Mistral-medium），對(duì)應(yīng)的模型尚未公布，但官方透露其在 MT-Bench 上的得分為 8.6 分。

有網(wǎng)友直接把 GPT-4 拉過(guò)來(lái)對(duì)比了一下?？梢钥吹?，中杯模型在 WinoGrande（常識(shí)推理基準(zhǔn)）上的得分超過(guò)了 GPT-4。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

價(jià)格方面，小小杯到中杯的輸入和輸出價(jià)格分別是每一百萬(wàn) token0.14~2.5 歐元和 0.42~7.5 歐元不等，嵌入模型則是 0.1 歐元每百萬(wàn) token（1 歐元約合 7.7 人民幣）。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

而在線版本，目前還只能到第三方平臺(tái)（Poe、HuggingFace 等）體驗(yàn)。

能看懂中文，但不太愿意說(shuō)

雖然官方通告中并沒(méi)有說(shuō)支持中文，但我們實(shí)測(cè)（HuggingFace Chat 中的在線版，模型為 Instruct 版本）發(fā)現(xiàn)，Mixtral 至少在理解層面上已經(jīng)具備一定中文能力了。

生成層面上，Mixtral 不太傾向于用中文來(lái)回答，但如果指明的話也能得到中文回復(fù)，不過(guò)還是有些中英混雜的情況。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

面對(duì)更多的“弱智吧”問(wèn)題，Mixtral 的回答雖中規(guī)中矩，但看上去至少已經(jīng)理解了字面含義。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

數(shù)學(xué)方面，面對(duì)經(jīng)典的雞兔同籠問(wèn)題，Mixtral 的回答從過(guò)程到結(jié)果都完全正確。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

即使是高等數(shù)學(xué)問(wèn)題，比如復(fù)雜的函數(shù)求導(dǎo)，Mixtral 也能給出正確答案，更難能可貴的是過(guò)程沒(méi)什么問(wèn)題。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

而此次的官方通告中專門強(qiáng)調(diào)了 Mixtral 的代碼能力很強(qiáng)，所以也受到了我們的重點(diǎn)考察。

一道困難難度的 LeetCode 下來(lái)，Mixtral 給出的代碼一次就通過(guò)了測(cè)試。

給你一個(gè)未排序的整數(shù)數(shù)組 nums，請(qǐng)你找出其中沒(méi)有出現(xiàn)的最小的正整數(shù)。
請(qǐng)你實(shí)現(xiàn)時(shí)間復(fù)雜度為 O (n) 并且只使用常數(shù)級(jí)別額外空間的解決方案。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

但隨著我們繼續(xù)提問(wèn)，Mixtral 的回答一不小心暴露了自己可能專門針對(duì) LeetCode 做過(guò)訓(xùn)練，而且還是中文版 LC。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

為了更加真實(shí)地展示 Mixtral 的代碼能力，我們轉(zhuǎn)而讓它編寫實(shí)用程序 —— 用 JS 寫一個(gè) Web 版計(jì)算器。

經(jīng)過(guò)幾輪調(diào)整之后，雖然按鈕的布局有些奇怪，但基本的四則運(yùn)算已經(jīng)可以完成了。

此外我們會(huì)發(fā)現(xiàn)，如果在同一個(gè)對(duì)話窗口中不斷補(bǔ)充新的要求，Mixtral 的表現(xiàn)可能會(huì)有所下降，出現(xiàn)代碼格式混亂等問(wèn)題，開啟新一輪對(duì)話后則會(huì)恢復(fù)正常。

開源大模型超越 GPT-3.5！爆火 MoE 實(shí)測(cè)結(jié)果出爐，網(wǎng)友：OpenAI 越來(lái)越?jīng)]護(hù)城河了

除了 API 和在線版本，Mistral AI 還提供了模型下載服務(wù)，可以用

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： OpenAI ChatGPT AI

評(píng)論

相關(guān)推薦

大嘴業(yè)話-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

蘋果承認(rèn)：AI模型使用谷歌定制芯片訓(xùn)練

智能計(jì)算蘋果 AI 谷歌定制芯片 | 2024-07-30

蘋果表示其AI模型是在谷歌的定制芯片上訓(xùn)練的

智能計(jì)算 AI | 2024-07-30

釋說(shuō)芯語(yǔ)16：硬科技：構(gòu)建企業(yè)未來(lái)之路（附PPT）

jackwang | 2018-10-22

iCAN-4017 AI功能模塊

資源下載周立功單片機(jī) 功能模塊 iCAN-4017 AI | 2007-03-30

如何快速搭建手寫體識(shí)別演示系統(tǒng)

視頻 digikey AI 手寫體識(shí)別 | 2022-07-29

AI驅(qū)動(dòng)的嵌入式聲音和振動(dòng)識(shí)別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

萬(wàn)家樂(lè)JSYZ5-AI燃?xì)鉄崴麟娐穲D

設(shè)計(jì)方案電路圖熱水器 JSYZ5-AI 萬(wàn)家樂(lè) | 2013-01-17

HBM4持續(xù)加速：AI時(shí)代競(jìng)爭(zhēng)新焦點(diǎn)

網(wǎng)絡(luò)與存儲(chǔ) HBM AI 內(nèi)存 | 2024-07-25

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產(chǎn)力

winni945 | 2018-09-12

iPhone 16將不會(huì)預(yù)裝AI功能？計(jì)劃通過(guò)iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

消息稱 OpenAI 公司 2024 年資金缺口達(dá)到 50 億美元

智能計(jì)算 OpenAI ChatGPT AI | 2024-07-25

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

CSR8670CSR8675智能語(yǔ)音Alexa藍(lán)牙方案開發(fā)

資源下載 AI 智能語(yǔ)音 | 2017-12-14

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計(jì)算教育 AI 集成電路 | 2024-07-25

劍指搜索巨頭谷歌！OpenAI推出AI搜索引擎SearchGPT

智能計(jì)算 openAI SearchGPT 谷歌 | 2024-07-26

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機(jī)器人 | 2021-02-26

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

海聯(lián)達(dá)（Aigale）Ai-HD1 無(wú)線全高清套件拆解

zhuwei0710 | 2013-04-28

電子元件培訓(xùn)教材

資源下載 NBA 電子元件識(shí)別電阻識(shí)別電容識(shí)別 AI MI SMT DIP 靜電防護(hù) | 2008-09-20

繼上次海聯(lián)達(dá)Ai-ap100拆機(jī)之電源改造

zhuwei0710 | 2013-04-03

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

為什么OpenAI今年可能會(huì)虧損50億美元？

智能計(jì)算 OpenAI 虧損 ChatGPT | 2024-07-25

WTC-AI太陽(yáng)能熱水器電路圖

設(shè)計(jì)方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

WTC-AI型太陽(yáng)能熱水器電路圖

設(shè)計(jì)方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

國(guó)際奧委會(huì)：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計(jì)算 AI 奧運(yùn)會(huì) 體育 | 2024-07-26

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

<em id="e0jhq"><button id="e0jhq"><video id="e0jhq"></video></button></em>

<thead id="e0jhq"><form id="e0jhq"></form></thead>