DeepSeek大模型的出色表现引发美国AI行业上下震动,不仅性能与OpenAI O1旗鼓相当,更关键的是训练成本低得多,也引发了美国政府的猜疑和调查,新加坡都被牵扯进来。
该团队拿到了一片看起来全新的 RTX 4090 TUF 显卡,上面还贴有保护膜,不过拆解后发现 GPU 芯片并非“AD102”,而是 GeForce RTX 3080 Ti 中的“GA102”。
“Llama 3 405B 使用了3080万GPU小时,而DeepSeek-V3 看起来是一个更强大的模型,仅使用了280万GPU 小时(计算量约为十分之一)。”前Open AI 联合创始人 ...