DeepSeek给硅谷带来的震撼持续不断。与几个月前《黑神话·悟空》在欧美受到的追捧相比,DeepSeek的出现可谓石破天惊,充满了各种不可能和不合理。它讲述了一个在层层封锁、劲敌环伺背景下铁树生花的故事,让美国精心设置的人工智能技术壁垒面临坍塌的风 ...
短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型——DeepSeek-V3和DeepSeek-R1。这两款模型成本低廉,性能却与OpenAI相当,让硅谷震惊,甚至引发了Meta内部的恐慌,工程师们开始连夜尝试复制DeepSe ...
现在的AI模型也能“灵光一现”,实现顿悟了?1月20日,中国AI公司深度求索(DeepSeek)发布的DeepSeek-R1模型,凭借其独特的强化学习(RL)训练方法,首次让AI展现出类人的“顿悟时刻”——在解决复杂问题时,模型会突然停下思考,自主修 ...
DeepSeek由一家名叫幻方的量化股票交易公司运营。到2001年,它已将利润投入购买数千枚英伟达芯片,用于训练其早期模型。公司没有回复记者的置评请求,它在中国有一种名声,那就是以高薪和让人们能够探索最感兴趣的研究课题为承诺,吸引了刚从顶尖大学毕业的 ...
“Meta的生成式AI部门正处于恐慌中。这一切始于 Deepseek,它使得 Llama 4 在基准测试中已经落后。雪上加霜的是:那个不知名的中国公司,仅有 550 万美元的训练预算。工程师们正在疯狂地剖析 ...
来源:180k梳理下时间线,1月20日 - DeepSeek - R1 正式发布,对标O1;因为业界一些其他人喊“对标”喊到习惯了,当时很多人还没意识到这次 R1 巨大的范式转移。1月21日 - AI业界已经被 ...
《每日经济新闻》报道,Scale AI创始人Alexander Wang在1月24日的采访中表示,DeepSeek在他们的测试里是表现最好的,与美国最好的模型相当。此前,Alexander ...
从大疆到宇树,再到当红的 ...
CNBC报导,中国一家鲜为人知的AI实验室DeepSeek,在去年底推出的免费开源大型语言模型,儘管制造成本不到600万美元、使用的晶片也就是辉达功能较低的H800晶片,但在多项测试中,其性能已超越美国最好模型,也让美国 ...
【CNMO科技消息】1月26日,CNMO注意到,有外媒发布文章指出,一家名为DeepSeek的中国AI初创企业在硅谷引起轰动,其凭借成本效益高的语言模型DeepSeek-R1,与OpenAI的ChatGPT展开了竞争。DeepSeek推出了两款先进的 ...
DeepSeek近日正式发布并开源了其最新研发的大型语言模型R1,该模型在性能上表现出色,被认为可与OpenAI的o1正式版相媲美。这一举措不仅标志着国产AI技术的又一次重大突破,也为全球AI开发者带来了新的选择。 DeepSeek R1在后训练阶段大规模应用了强化学习技术 ...
随着全球人工智能领域的竞争日益激烈,国产 AI 模型正在迅速崛起。近日,国产 AI “三英”——DeepSeek、Kimi 和 MiniMax 相继发布了新版本,显示出与 OpenAI 的 GPT 系列抗衡的潜力。 1月20日,DeepSeek 正式推出了 DeepSeek-R1,并同步开源了模型权重。DeepSeek-R1在后训练 ...