中文字幕 另类精品,亚洲欧美一区二区蜜桃,日本在线精品视频免费,孩交精品乱子片免费

<sup id="3hn2b"></sup>

    1. <sub id="3hn2b"><ol id="3hn2b"></ol></sub><legend id="3hn2b"></legend>

      1. <xmp id="3hn2b"></xmp>

      2. 新聞中心

        EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > DeepSeek的一次小更新 堪比發(fā)布新模型

        DeepSeek的一次小更新 堪比發(fā)布新模型

        作者: 時間:2025-03-26 來源:快科技 收藏

        一個好消息,時隔倆月, 終于更新了。

        本文引用地址:http://www.antipu.com.cn/article/202503/468676.htm

        就在昨天晚上, 一聲不吭往 Hugging Face 上扔了個 -V3-0324 模型。

        模型參數(shù) 6850 億,跟上一個版本的 V3 ( 6710 億 )相差不大,采用 MoE 架構(gòu),還支持了更開放的 MIT 開源協(xié)議。

        根據(jù)官方更新的版本說明, DeepSeek -V3-0324 主要是針對推理能力和前端開發(fā)能力進行了加強,寫作風格實現(xiàn)了跟 R1 對齊,另外還有一些其他方面的小優(yōu)化。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        現(xiàn)在打開 DeepSeek 官網(wǎng),把深度思考模式關(guān)掉就能直接用上 V3-0324 。

        不過有一說一,雖然 V3-0324 僅僅只是 V3 的小版本升級,并不是大伙兒期待已久的 V4 或者 R2 ,且官方賬號也沒有發(fā)布任何跟模型有關(guān)的信息。

        但也絲毫不妨礙, V3-0324 一上線,就有人說他的代碼能力,直追克勞德。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        新版本的模型剛一上傳,就登上了 Hugging Face 的趨勢榜單。

        在國外大模型競技場 KCORES 的測評中, V3-0324 的代碼能力得分 328.3 ,超過了普通版的 Claude 3.7 Sonnet 的 322.3 分,接近 Claude 3.7 Sonnet 思維鏈版本的 334.8 分,排名第三。

        圖源 @karminski 牙醫(yī)

        DeepSeek的一次小更新 堪比發(fā)布新模型

        重點是,排名在前面的模型壓根就沒幾個開源免費的, V3-0324 可謂是一枝獨秀。

        所以在 V3-0324 上線不到一天的時間里,就已經(jīng)有很多老哥迫不及待上手測評了一波。

        這么說吧, V3-0324 在這些人手里,已經(jīng)成了拳打 o3-mini ,腳踢 Claude 3.7 Sonnet 的存在。

        經(jīng)典的小球彈跳測試中,這位老哥把 V3-0324 、 o3-mini 和 R1 拉了個橫評。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        o3-mini 剛開始看著還不賴,但估計物理沒學好,外面的六邊形都轉(zhuǎn)到垂直的位置了,球還不知道往下掉。

        R1 的表現(xiàn),也是有些讓人摸不著頭腦。。

        相對來說, V3-0324 生成的結(jié)果是表現(xiàn)最好的,這位老哥絲毫不吝嗇對它的夸獎,說它 “ 表現(xiàn)得像唯一排名第一的非推理模型 ” 。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        讓 V3-0324 生成一個網(wǎng)頁,模型一口氣寫了 800 多行代碼,運行的時候還沒有出錯,這什么實力不用多說了吧。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        在評論區(qū)底下,有人僅僅下達了編寫登錄頁面的簡單指令,并沒有任何其他的附加提示,同樣也生成了一個完整的登錄頁面。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        還說 V3-0324 在編碼上,能跟 Claude 3.7 Sonnet 掰一掰手腕。

        更別提其他的模型,性價比各方面相比下來,現(xiàn)在 Open 的 o1-pro 和 GPT-4.5 ,都已經(jīng)不香了。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        反正看了幾個網(wǎng)友的測試案例之后,世超對 V3-0324 的前端代碼生成能力,已經(jīng)有了初步的判斷。

        但不管咋說,沒親自上過手的東西,咱硬夸也有點心虛。所以這次世超也打算簡單試一試,看看 V3-0324 到底有多能打。

        一上來,世超就讓模型做了一個畫板,提示詞是 “ 幫我用 HTML 代碼構(gòu)建一個畫板,支持鼠標繪制、橡皮擦功能和顏色選擇 ” ,這次出戰(zhàn)的模型是 V3-0324 和普通版 Claude 3.7 Sonnet 。

        只能說,這把 Claude 3.7 Sonnet 贏得很徹底。光是有取色器這一點,就甩了 V3-0324 不知道幾個車尾燈。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        更別提 UI 設計了, V3-0324 做出來的畫板讓世超不是很有創(chuàng)作的欲望。。。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        世超著實是沒想到,這盆涼水來得這么快,都讓我有點懷疑到底是我的提示詞沒寫好,還是模型有問題了。。。

        不過,我后面又繼續(xù)把小球彈跳的提示詞,分別喂給了 DeepSeek-V3-0324 、普通版 Claude 3.7 Sonnet 還有 DeepSeek-V3 。

        這下味兒終于對了。V3-0324 生成的結(jié)果確實牛叉,能很清楚地看到小球在下落觸底的時候,產(chǎn)生了小幅度的彈跳。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        就是吧,老版本的 V3 壓根沒運行起來。。。只能說兩個版本之間的差距高下立判了。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        再來看普通版 Claude 3.7 Sonnet 的結(jié)果,優(yōu)點是底下的轉(zhuǎn)速、重力和摩擦力都是可調(diào)節(jié)的,彈跳看起來也沒什么大問題,但小球有點出畫面了。。。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        最后,世超又分別讓 V3 和 V3-0324 生成一個 Saas 登錄頁面,提示詞就一句話,沒有任何的附加信息。

        可以看到, V3 的頁面倒是做出來了,但沒什么設計可言。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        反觀 V3-0324 ,果然就跟官方的版本更新說明一樣,生成的網(wǎng)頁更美觀了。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        綜合看下來, V3-0324 的代碼能力相比 V3 確實有了比較大的提升,而且在一部分測試案例中,也能夠比肩普通版 Claude 3.7 Sonnet 。

        但如果要說完全超越 Claude 3.7 Sonnet ,那世超覺著暫時還不太行。

        不過大伙兒也別忘了, V3-0324 在開源這個賽道里, V3-0324 已經(jīng)算得上能打的了。

        而且 DeepSeek 的 API 價格業(yè)主打的一個便宜。世超對比了 Claude 3.7 Sonnet 和 V3-0324 的 API 價格, V3-0324 百萬 tokens 輸入的價格是 2 元,百萬 tokens 輸出的價格是 8 元,而同樣的 tokens 數(shù), Claude 3.7 Sonnet 的輸入和輸出價格分別是 36.6 元和 108.9 元,價差最多有 18 倍。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        所以在某種程度上, V3-0324 這個小更新,的確可以跟 Claude 3.7 Sonnet 媲美。

        特別是今天晚上,DeepSeek官方還發(fā)文,正式介紹了這波小更新,在數(shù)學、代碼類的相關(guān)評測上,V3-0324比Open目前最厲害的非推理模型GPT-4.5都要更勝一籌。

        DeepSeek的一次小更新 堪比發(fā)布新模型

        去年 12 月底 V3 上線,緊接著 R1 就在過年的時候上桌吃飯了。如果按照 DeepSeek 之前發(fā)布模型的節(jié)奏,盲猜一波 R2 也快了。

        總之,小版本更新的 V3-0324 就已經(jīng)如此強悍了,就是不知道,在 DeepSeek 猛烈的開源炮彈下, “Open 們 ” 還遭不遭得住了。




        關(guān)鍵詞: 人工智能 AI DeepSeek

        評論


        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉