研究团队首先观察到长推理模型频繁切换思路的现象,并进一步发现这一现象由思考不足导致。为了定量评估思路切换的问题,研究团队引入了一种新颖的思考不足指标,为推理效率低下提供了量化评估框架。同时,研究团队提出了一种缓解思考不足的简单有效方案 —— ...
中美贸易战中的中国企业:通过回流实现脱钩?作者:KA ZENG,马萨诸塞大学阿默斯特分校政治学系教授,研究方向为国贸易政策、全球经济治理的中国角色等;SOO YEON ...
近日有媒体报道称,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。 该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。
【环球时报-环球网报道 记者 郭媛丹】在国产大模型 DeepSeek 成为 AI 领域的焦点之后,一些企业和个人纷纷开始搭建DeepSeek大模型的私有化部署 ...