Flood - 搜索 News

1 天

2 月 18 日上午消息，月之暗面研究员 Flood Sung 近日分享了 k1.5 模型背后的完整思考过程，并透露称， 2024 年 9 月 12 号 OpenAI o1 发布带来的震撼效果，令自己陷入了 Long-CoT 的有效性反思中。因为 ...

中关村在线1 天

抽象游戏哪些好玩人气高的抽象游戏排行榜前十

以上是关于最受欢迎抽象游戏排行榜前十名的详细阐述，每一款作品都蕴含独特的吸引力和操作方式。我们深信，您定能在其中觅得钟爱的一款。如若对某游戏有更深入的兴趣或寻求额外资讯，只需点击即可下载亲身体验。

1 天

The benefits of pocket parks 袖珍公园为城市带来的好处

Time off from digital devices. Find out how a school in England challenges students to stay away from their gadgets ...

星島網1 天

又中又英｜Flooding the zone

这就导致人们难以反对那些他们不喜欢的政治决定。制造过多的新闻给传媒和人们去消化，叫做 flooding the zone。史提芬‧班农，就是唐纳德‧特朗普第一任期当总统时的首席策略长，于2018年发明了这个词语。他说特朗普身为共和党人，需要「讯息淹没战术」（flood the ...

1 天

月之暗面研究员：未能更早将“长思维链”作为高优选项

据月之暗面官方介绍，新推出的k1.5多模态思考模型实现了SOTA（state-of-the-art，指最佳技术或最高水平模型）级别的多模态推理和通用推理能力。在长思维链模式下，kimi K1.5的数学、代码、多模态推理能力，也达到长思考SOTA模型OpenAI o1正式版水平。

2 天

月之暗面研究员透露：为了省钱，未能更早将“长思维链”作为高 ...

2 天

月之暗面分析员分享k1.5 模型背后的完整思考过程：一年前就验证过 ...

2月17日上午，月之暗面研究员Flood Sung分享了k1.5模型背后的思考过程，并表示2024年OpenAI o1发布的效果让他思考了Long-CoT的有效性。月之暗面Kimi联合创始人Tim周昕宇在一年多前验证过，通过训练小模型做运算并合成长的CoT数据，可以获得良好效果。公司意识到Long Context的重要性，开始考虑将Context搞长。尽管Long-CoT成本较高且速度慢，但Flo ...

太平洋电脑网2 天

月之暗面：一年前验证过长思维链因成本高先搞了长文本

因为 Long-CoT 的有效性，在一年多前就被验证过。使用很小的模型训练模型做几十位的加减乘除运算，并将细粒度的运算合成为非常长的 CoT 数据进行 SFT 处理时可以获得非常好的效果。

2 天

月之暗面揭秘：长思维链成本高昂，为性能突破终下决心

月之暗面的研究员Flood Sung回顾了k1.5模型的研发历程，特别提到了去年9月12日OpenAI发布的o1模型对其产生的深远影响。o1模型中的长思维链技术，让Flood Sung深感震撼，因为这项技术早在一年多前，就被月之暗面的联合创始人Tim周昕宇所验证。当时，他们通过小型模型训练，实现了数十位的加减乘除运算，将精细的运算步骤串联成长长的思维链数据，进行监督微调，取得了显著成效。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果