中国AI初创公司深度求索(DeepSeek)在短短一个月内发布了两款大模型,分别是DeepSeek-V3和DeepSeek-R1。这两款模型成本低廉,性能却与OpenAI相当,引起了硅谷的震惊,甚至引发了Meta内部的恐慌。工程师们开始连夜尝试复制D ...
DeepSeek给硅谷带来的震撼持续不断。与几个月前《黑神话·悟空》在欧美受到的追捧相比,DeepSeek的出现可谓石破天惊,充满了各种不可能和不合理。它讲述了一个在层层封锁、劲敌环伺背景下铁树生花的故事,让美国精心设置的人工智能技术壁垒面临坍塌的风 ...
现在的AI模型也能“灵光一现”,实现顿悟了?1月20日,中国AI公司深度求索(DeepSeek)发布的DeepSeek-R1模型,凭借其独特的强化学习(RL)训练方法,首次让AI展现出类人的“顿悟时刻”——在解决复杂问题时,模型会突然停下思考,自主修 ...
DeepSeek由一家名叫幻方的量化股票交易公司运营。到2001年,它已将利润投入购买数千枚英伟达芯片,用于训练其早期模型。公司没有回复记者的置评请求,它在中国有一种名声,那就是以高薪和让人们能够探索最感兴趣的研究课题为承诺,吸引了刚从顶尖大学毕业的 ...
《每日经济新闻》报道,Scale AI创始人Alexander Wang在1月24日的采访中表示,DeepSeek在他们的测试里是表现最好的,与美国最好的模型相当。此前,Alexander ...
来源:180k梳理下时间线,1月20日 - DeepSeek - R1 正式发布,对标O1;因为业界一些其他人喊“对标”喊到习惯了,当时很多人还没意识到这次 R1 巨大的范式转移。1月21日 - AI业界已经被 ...
中国初创公司深度求索(DeepSeek)发布廉价大模型,性能可比肩美国OpenAI最新模型,引起国际媒体关注。中国官媒发文,称DeepSeek的成功证明,大模型创新不一定要依赖最先进的硬件,而是可以通过聪明的工程设计和高效的训练方法实现。
从大疆到宇树,再到当红的 ...
CNBC报导,中国一家鲜为人知的AI实验室DeepSeek,在去年底推出的免费开源大型语言模型,儘管制造成本不到600万美元、使用的晶片也就是辉达功能较低的H800晶片,但在多项测试中,其性能已超越美国最好模型,也让美国 ...
综合英国科技周刊《自然》(Nature)和英国科技网站“生命科学”(Live Science)等报道,深度求索(DeepSeek)去年12月发布免费语言大模型DeepSeek ...
世界经济论坛2025年年会开幕当天,中国深度求索公司发布其最新开源模型DeepSeek-R1,这一模型在技术上实现了重要突破——用纯深度学习的方法让AI自发涌现出推理能力。该模型延续了其高性价比的优势。据该公司介绍,DeepSeek-R1在后训练阶段 ...
中国“双子星”打开了OpenAI的黑箱。此前,OpenAI定义了大模型训练的四个阶段:预训练、监督微调、奖励建模、强化学习。现在,这个范式被打破了,Kimi 和DeepSeek都证明了可以跳过和简化某些环节来提升模型的训练效率和性能。