摘要:: 中国 AI 团队发布的 DeepSeek-V3.2 系列模型,通过精炼注意力(DSA)和高比例后训练技术,在推理性能上逼近全球顶级闭源模型。这证明了算法创新在 Scaling Law 之外仍有巨大提升空间,受到国际开发者广泛关注。
来源:: 华尔街见闻 / 科技研报
国产开源模型 DeepSeek-V3.2 在推理性能上实现重大突破
摘要:: 中国 AI 团队发布的 DeepSeek-V3.2 系列模型,通过精炼注意力(DSA)和高比例后训练技术,在推理性能上逼近全球顶级闭源模型。这证明了算法创新在 Scaling Law 之外仍有巨大提升空间,受到国际开发者广泛关注。
来源:: 华尔街见闻 / 科技研报
来源:: 华尔街见闻 / 科技研报
