Schulman 是去年众多从 OpenAI 离职的高层之一,其他知名专家包括首席技术官 Mira Murato、首席科学家 Ilya Sutskever。Jan Leike 是前 OpenAI 超级对齐小组的联合负责人,该小组致力于让其 AI ...
2 天on MSN
IT之家 2 月 5 日消息,在 Anthropic 公司的网站“客户案例”页面上,有大量报道称许多企业正在使用 Anthropic 的大语言模型 Claude,以帮助员工更有效地沟通。然而,在 Anthropic ...
21 小时on MSN
近期,科技界传来一则引人瞩目的消息,前OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在离职后悄然启动了她的创业项目,这一举动引起了业界的广泛关注。
近日,人工智能行业的又一重要人事变动引发业内广泛关注。约翰·舒尔曼(John ...
14 小时
商业新知 on MSNAnthropic有望获超额认购,估值或将超600亿美元2月7日,知情人士称,AI创企Anthropic有望获超额认购,实际融资规模高于此前媒体报道的20亿美元,公司估值则会超过600亿美元。 据悉,Menlo Ventures、Bessemer Venture Partners、阿联酋AI投资公司MGX和General ...
在Anthropic近期发布的学术论文中,安全保障研究团队详细阐述了这一安全措施。据测试显示,实施宪法分类器后,Claude模型的越狱成功率显著降低了81.6%。同时,该系统对模型性能的影响较小,生产流量拒绝率仅绝对增加了0.38%,推理开销增加了2 ...
人工智能公司 Anthropic 近日宣布开发了一种名为“体质分类器”的新安全方法,旨在保护语言模型免受恶意操纵。该技术专门针对“通用越狱”——一种试图系统性绕过所有安全措施的输入方式,以防止 AI 模型生成有害内容。
另外,据Schulman透露,OpenAI将人类反馈强化学习(RLHF)引入ChatGPT的想法可以追溯到2017年,当时Jan Leike和Dario Amodei等人发表的一篇论文提到了这个方法。
智东西2月6日消息,今日,美国AI创企Anthropic的CEO Dario Amodei“”受邀做客美国知名中国研究播客“中国说(ChinaTalk)”,对其前不久发表的关于DeepSeek的万字檄文做出了更详细的解释和回应。
作者们发现,在实施宪法分类器后, 针对 Claude 模型的成功越狱情况减少了 81.6%,同时该系统对性能的影响极小 ,“生产流量拒绝率仅绝对增加 0.38%,推理开销增加 23.7%”。 虽然大型语言模型能生成大量各种各样的有害内容,但 ...
它是一种模型压缩技术,通过将一个复杂的、计算开销大的大模型(称为教师模型)的知识“蒸馏”到一个更小、更高效的模型(称为学生模型)。 这个过程的核心目标是让学生模型在轻量化的同时,尽量保留教师模型的性能。
Investing.com -- 网约车公司Lyft与AI公司Anthropic宣布建立合作伙伴关系,共同开发新产品以提升数百万用户的出行体验。此次合作将专注于开发以客户为中心的AI产品和功能,服务于Lyft超过4000万年度乘客和100多万名司机。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果