&

2025年02月06日 20:28:18

獨家|李飛飛團(tuán)隊“50美元”復(fù)刻DeepSeek的R1真相：基于阿里云Qwen模型監(jiān)督微調(diào)而成

《科創(chuàng)板日報》6日訊，今日有報道稱李飛飛等斯坦福大學(xué)和華盛頓大學(xué)的研究人員以不到50美元的云計算費(fèi)用，成功訓(xùn)練出了一個名為s1的人工智能推理模型。該模型在數(shù)學(xué)和編碼能力測試中的表現(xiàn)，據(jù)稱與OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。《科創(chuàng)板日報》記者調(diào)查后發(fā)現(xiàn)，s1模型的訓(xùn)練并非從零開始，其基座模型為阿里通義千問（Qwen）模型。s1用50美元訓(xùn)練出新的具有推理能力的模型，實際上只是用從谷歌模型中提煉出來的1000個樣本，然后對千問模型進(jìn)行微調(diào)而成。（記者毛明江黃心怡）

閱64.34W

我要評論

反饋意見