">

首頁|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|大數(shù)據(jù)|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁 >> 人工智能 >> 正文

“價(jià)格屠夫”DeepSeek上線,新模型成本下降超50%

2025年9月30日 07:14  第一財(cái)經(jīng)  

被稱為“價(jià)格屠夫”的DeepSeek再次揮刀降價(jià)了。

9月29日晚間,DeepSeek宣布正式發(fā)布 DeepSeek-V3.2-Exp模型,性能仍是穩(wěn)步提升,但出乎意料的是,調(diào)用價(jià)格大幅降低,尤其輸出價(jià)格大降75%,業(yè)界人士表示“這很難卷得過”。DeepSeek提到,在新價(jià)格政策下,開發(fā)者調(diào)用DeepSeek API的成本將降低50%以上。

具體來看,輸入價(jià)格上,緩存命中時(shí),DeepSeek-V3.2-Exp從0.5元/百萬tokens降至0.2元/百萬tokens,緩存未命中的價(jià)格則從4元/百萬tokens降為2元/百萬tokens;輸出價(jià)格上,從12元/百萬tokens直接降到了3元/百萬tokens。

降價(jià)原因方面,DeepSeek介紹是得益于新模型服務(wù)成本的大幅降低。V3.2-Exp是一個(gè)實(shí)驗(yàn)性(Experimental)的版本,作為邁向新一代架構(gòu)的中間步驟,在 V3.1-Terminus 的基礎(chǔ)上這一模型引入了 DeepSeek Sparse Attention(一種稀疏注意力機(jī)制),針對(duì)長(zhǎng)文本的訓(xùn)練和推理效率進(jìn)行了探索性的優(yōu)化和驗(yàn)證。

簡(jiǎn)單來說,因?yàn)閷?shí)現(xiàn)了細(xì)粒度稀疏注意力機(jī)制,在幾乎不影響模型輸出效果的前提下,可以實(shí)現(xiàn)長(zhǎng)文本訓(xùn)練和推理效率的大幅提升。

DeepSeek介紹,為了嚴(yán)謹(jǐn)?shù)卦u(píng)估引入稀疏注意力帶來的影響,團(tuán)隊(duì)將 DeepSeek-V3.2-Exp 的訓(xùn)練設(shè)置與 V3.1-Terminus 進(jìn)行了嚴(yán)格的對(duì)齊。在各領(lǐng)域的公開評(píng)測(cè)集上,DeepSeek-V3.2-Exp 的表現(xiàn)與 V3.1-Terminus 基本持平。

目前,DeepSeek-V3.2-Exp 模型已在Huggingface與魔搭開源,官方App、網(wǎng)頁端、小程序均已同步更新為DeepSeek-V3.2-Exp。API 的模型版本已經(jīng)更新為 DeepSeek-V3.2-Exp,訪問方式保持不變。

此外,為支持社區(qū)研究,DeepSeek 還開源了新模型研究中設(shè)計(jì)和實(shí)現(xiàn)的 GPU 算子,包括 TileLang 和 CUDA 兩種版本。團(tuán)隊(duì)建議社區(qū)在進(jìn)行研究性實(shí)驗(yàn)時(shí),優(yōu)先使用基于 TileLang 的版本,以便于調(diào)試和快速迭代。

值得一提的是,就在9月22日,DeepSeek才發(fā)布了DeepSeek-V3.1-Terminus模型,Terminus在拉丁語里是終點(diǎn)、界限的意思,當(dāng)時(shí)業(yè)界猜測(cè)這是否會(huì)是V3系列的終極版本,并期待下一個(gè)發(fā)布的將是大版本更新,目前看起來這個(gè)猜測(cè)并不成立。

在年初海內(nèi)外出圈后,DeepSeek每一次更新都成為業(yè)界矚目的焦點(diǎn),但這幾個(gè)月以來DeepSeek幾次更新都是小版本的迭代,關(guān)于V4和R2的呼聲也越來越多。在DeepSeek這次 X平臺(tái)上的官宣帖子下,就有海外網(wǎng)友詢問“什么時(shí)候可以期待下一個(gè)V4和R2的版本”,很快有網(wǎng)友回復(fù)表示,結(jié)合這次發(fā)布來看近期并不會(huì)看到。

編 輯:高靖宇
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
中國(guó)移動(dòng)黃宇紅:量通智融合創(chuàng)新的探索、實(shí)踐與思考
精彩視頻
亨通光電精彩亮相2025通信展丨浸沒式液冷一體機(jī) 直擊高密度計(jì)算場(chǎng)景痛點(diǎn)
亨通數(shù)科精彩亮相2025通信展丨“工業(yè)互聯(lián)網(wǎng)+AI”智能制造解決方案 賦能行業(yè)數(shù)智化轉(zhuǎn)型
你少做,它多做,在2025驍龍峰會(huì) 中國(guó)站找尋下一場(chǎng)終端變革的神秘元素
中國(guó)信科集團(tuán)精彩亮相2025通信展丨空天地一體,全域智聯(lián)未來
精彩專題
2025中國(guó)國(guó)際信息通信展覽會(huì)
中國(guó)信科精彩亮相2025中國(guó)國(guó)際信息通信展
第26屆中國(guó)國(guó)際光電博覽會(huì)
2025中國(guó)算力大會(huì)
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像