中国AI大模型DeepSeek的成功出圈引发了行业对“堆算力”“堆投资”逻辑的怀疑。从股价表现来看,多只位于AI算力产业链的公司股价明显下挫。寒武纪作为国内AI算力概念的龙头企业,股价从上一交易日的612.98元/股降至551.68元/股,降幅接近1 ...
中国人工智能实验室DeepSeek能够使用数万个NVIDIA H100 AI GPU进行训练。其开发的AI模型DeepSeek R1被认为是世界上最先进的之一,可以与OpenAI的新o1和Meta的Llama AI模型相媲美。
大陆AI新创企业DeepSeek(深度求索)撼动全球AI产业链,继日本晶片股27日暴跌后,美国科技股盘前也纷纷重挫。AI龙头辉达、台积电ADR盘前股价均狂跌逾9%,而欧洲半导体巨擘ASML早盘更狂泻逾10%。有粉专指出,DeepSe ...
大陆AI新创公司DeepSeek横空出世,近日推出推低成本、高效能AI模型DeepSeek-R1,引起科技界关注,对比科技大厂投入鉅额设备却没有拿出表现更好的模型,导致辉达、台积电ADR重挫。DeepSeek为大陆幻方量化旗下的AI模型 ...
公开资料显示,中国AI初创公司深度求索(DeepSeek)成立于2023年5月,是一家大模型创业公司。仅成立半年后,DeepSeek就推出了免费商用、完全开源的代码大模型DeepSeek Coder。2024年5月,该公司发布开源模型DeepSeek ...
纳斯达克100指数期货下跌4.5%;该指数以科技股为主。 除英伟达外,其他美国芯片股也在盘前下跌,包括博通 ( Broadcom )和美光 (Micron)。 在欧洲,阿斯麦 (ASML)股价下跌。
据美国《华尔街日报》当地时间1月26日报道,DeepSeek-R1的出色表现已经给美国科技行业留下深刻印象,从业者纷纷称赞深度求索的工作取得了重大突破。OpenAI公司前高管扎克·卡斯(Zack Kass)直言, ...
DeepSeek表示,技术服务的稳定性受多重因素影响,可能涉及突发流量、系统升级适配或底层基础设施的临时波动等。我们的团队始终将稳定性作为首要任务,并会在每次事件后彻底分析原因,持续优化系统韧性。
中国AI公司的创造力正技惊四座。最近几天,一家名为深度求索(DeepSeek)的中国公司在欧美AI圈引起了不小的震动,甚至被认为是大模型行业的最大“黑马”。DeepSeek被不少外国人称为“神秘的东方力量”。
这家中国企业,叫幻方量化。他们开发的AI大模型,就是这几天爆火的Deepseek(深度求索)。《黑神话:悟空》背后的那个男人,Yocar冯骥将其称为“国运级别的科技成果”。
根据官方口径,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
R1是中国大语言模型(LLM)崛起的一个缩影。DeepSeek脱胎于一家对冲基金公司,上个月横空出世发布了名为V3的对话机器人——该机器人虽然预算不高,但成功打败了几大主要对手。专家估计,它大概花了600万美元租借训练模型的硬件,而Meta的Llam ...