【電報解讀】李飛飛團隊“50美元”復刻DeepSeek,基于阿里云Qwen模型監(jiān)督微調(diào)而成,這家公司與阿里云共建智算云,旗下平臺接入通義千問
電報解讀
2025.02.07 08:22 星期五
//電報內(nèi)容
【獨家|李飛飛團隊“50美元”復刻DeepSeek的R1真相:基于阿里云Qwen模型監(jiān)督微調(diào)而成】《科創(chuàng)板日報》6日訊,今日有報道稱李飛飛等斯坦福大學和華盛頓大學的研究人員以不到50美元的云計算費用,成功訓練出了一個名為s1的人工智能推理模型。該模型在數(shù)學和編碼能力測試中的表現(xiàn),據(jù)稱與OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下?!犊苿?chuàng)板日報》記者調(diào)查后發(fā)現(xiàn),s1模型的訓練并非從零開始,其基座模型為阿里通義千問(Qwen)模型。s1用50美元訓練出新的具有推理能力的模型,實際上只是用從谷歌模型中提煉出來的1000個樣本,然后對千問模型進行微調(diào)而成。(記者毛明江 黃心怡)
//解讀摘要
李飛飛團隊“50美元”復刻DeepSeek,基于阿里云Qwen模型監(jiān)督微調(diào)而成,這家公司與阿里云共建智算云,旗下平臺接入通義千問,另一家首個定制數(shù)據(jù)中心服務于阿里云。
單篇付費¥12可解鎖全文
火線解讀!即時推送重要資訊獨家深度解析
¥898 起
立即購買
展開
最新文章
加載更多
宇瞳光學
發(fā)現(xiàn)至今最高漲幅+44.83%
VIP試讀