分流器模型 - 搜索 News

DeepSeek新模型“火”到海外，Meta首席AI科学家称“开源在超越闭源了”

DeepSeek上周发布开源的DeepSeek-R1，并称该模型性能对标OpenAI o1正式版之后，海外AI业界对该模型的讨论还在持续。热议的焦点在于，当开源模型能力 ...

【环球时报记者刘扬环球时报特约记者任重】近日，一个名为DeepSeek（深度求索）的中国AI初创公司成为国内外人工智能（AI）大模型领域热议话题。在不到30天的时间里，DeepSeek先后发布了DeepSeek-V3和DeepSeek-R1两款大模型，其成本与动辄数亿甚至上百亿美元的 ...

GitHub14 天

Lordog/dive-into-llms

《动手学大模型》系列编程实践教程，由上海交通大学2024年春季《人工智能安全技术》课程（NIS3353）讲义拓展而来（教师：张倬胜），旨在提供大模型相关的入门编程参考。通过简单实践，帮助同学快速入门大模型，更好地开展课程设计或学术研究。微调与 ...

虎嗅网25 天

成本仅国外三十分之一，中国大模型已经追上美国了？

本文来自微信公众号：知识分子，作者：张天祁、李珊珊，原文标题：《来自中国的大模型成最大黑马，成本仅国外三十分之一，硅谷恐慌》，头图来自：视觉中国 “Meta的生成式AI部门正处于恐慌中。这一切始于 Deepseek，它使得 Llama 4 在基准测试中已经落后。

华尔街日报中文版24 天

中国公司DeepSeek的AI模型何以让硅谷惊叹不已

美国总统特朗普(Donald Trump)表示，中国公司DeepSeek的低成本AI模型横空出世，应为美国科技行业敲响警钟。他说，美国公司必须专注于赢得美中科技竞争的目标。此外，特朗普还宣布了将针对海外制造的半导体等产品征收关税的计划。封面图片来源：elizabeth frantz ...

腾讯网24 天

中国新AI大模型为何火爆全网？人工智能领域专家解读

【环球时报记者刘扬环球时报特约记者任重】近日，一个名为DeepSeek（深度求索）的中国AI初创公司成为国内外人工智能（AI）大模型领域热议话题 ...

IT之家24 天

DeepSeek 深夜再放大招：7B 参数人人可用的视觉多模态模型 Janus-Pro-7B 开源

IT之家1 月 28 日消息，就在北京时间今日凌晨，DeepSeek 宣布开源全新的视觉多模态模型 Janus-Pro-7B，其在 GenEval 和 DPG-Bench 基准测试中击败了 Stable Diffusion 和 OpenAI 的 DALL-E 3。 Janus-Pro 是一种创新的自回归框架，实现多模态信息的统一理解与生成。与以往的方法不同 ...

新浪网6 天

DeepSeek等大模型私有化服务器部署快速上升，网络安全公司：近九成 ...

【环球时报-环球网报道记者郭媛丹】在国产大模型 DeepSeek 成为 AI 领域的焦点之后，一些企业和个人纷纷开始搭建DeepSeek大模型的私有化部署 ...

中国网25 天

英国《金融时报》：中国AI模型震惊硅谷

英国《金融时报》1月25日文章，原题：中国小型人工智能初创公司深度求索如何震惊硅谷本周，中国一家人工智能（AI）实验室发布尖端模型的 ...

36氪28 天

一文读懂：DeepSeek新模型大揭秘，为何它能震动全球AI圈

这一研究可能会对模型推理训练后续的范式产生深刻影响。时隔不到一个月，DeepSeek又一次震动全球AI圈。去年 12 月，DeepSeek推出的DeepSeek-V3在全球AI ...

新浪网24 天

DeepSeek深夜发布多模态大模型图像性能跑分力压OpenAI竞品

就在华尔街周一紧张评估“DeepSeek风暴”之际，这家中国公司再度甩出新品：在图像生成基准测试中超越OpenAI“文生图”模型DALL-E 3的多模态大模型 ...

腾讯网25 天

中国大模型“搅动”硅谷，巨头恐慌，大佬发声：中国AI已追上美国

短短一个月内，中国AI初创公司深度求索（DeepSeek）先后发布了DeepSeek-V3和DeepSeek-R1两款大模型，成本价格低廉，性能与OpenAI相当，让硅谷震惊 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果