欢迎光临,我们是一家专注中小型企业营销推广服务的公司!

咨询热线:400 9868 577
淮南兰乔电子商务有限公司
新闻中心News
淮南兰乔电子商务有限公司

DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价

作者:花韻仙語 | 点击: | 来源:花韻仙語
2909
2025
深度求索正式推出DeepSeek-V3.2-Exp模型,该版本为实验性(Experimental)更新。作为通向新一代架构的过渡性尝试,V3.2-Exp在V3.1-Terminus的基础上集成了DeepSeekSparseAttention(DSA),引入了一种创新的稀疏注意力机制,重点针对长文本场景下的训练与推理效率进行了探索性优化与验证。目前,官方App、网页端及小程序均已全面升级至DeepSeek-V3.2-Exp版本,同时API费用大幅下调,诚邀广大用户试用体验,并积极反...

深度求索正式推出 deepseek-v3.2-exp 模型,该版本为实验性(experimental)更新。

作为通向新一代架构的过渡性尝试,V3.2-Exp 在 V3.1-Terminus 的基础上集成了 DeepSeek Sparse Attention(DSA),引入了一种创新的稀疏注意力机制,重点针对长文本场景下的训练与推理效率进行了探索性优化与验证。

目前,官方 App、网页端及小程序均已全面升级至 DeepSeek-V3.2-Exp 版本,同时 API 费用大幅下调,诚邀广大用户试用体验,并积极反馈使用建议。

DeepSeek **Sparse Attention**(DSA)

稀疏注意力机制

DeepSeek Sparse Attention**DSA**)首次实现了高细粒度的稀疏注意力结构,在几乎不牺牲模型输出质量的前提下,显著提升了长序列处理的训练和推理效率。

为准确评估稀疏注意力机制的影响,我们在训练配置上严格对齐了 V3.1-Terminus 的各项参数。测试结果显示,DeepSeek-V3.2-Exp 在多个公开基准评测中表现与前代模型基本一致,保持了高度稳定的性能水平。

论文链接 & 模型开源

DeepSeek-V3.2-Exp 模型现已在 Huggingface 与魔搭平台开放下载:

  • HuggingFace

https://www./link/75b47bff314c1c00c07819e881cbef37

  • ModelScope

https://www./link/ed3e924fec44a4b9b04294ef31cdf73b

相关技术论文也已发布:

https://www./link/3af3ccd7551b9679edb2ae60d326cb01

Tile

Lang & CUDA 算子开源

在研发过程中,团队设计并实现了一系列新型 GPU 算子。我们采用高级语言 TileLang 进行快速原型开发,以支持灵活的研究探索。最终版本则以 TileLang 实现为精度参考,逐步迁移至底层 CUDA 语言以提升运行效率。本次开源内容包含主要算子的 TileLang 与 CUDA 双版本。研究者可优先使用 TileLang 版本进行调试与迭代,便于开展后续创新工作。

API 支持

受益于新模型带来的服务成本显著下降,官方同步调整 API 定价策略,最新价格即日起生效。

根据新规,开发者调用 DeepSeek API 的整体成本将降低超过 50%。

当前 API 默认调用模型为 DeepSeek-V3.2-Exp,接入方式维持不变。欢迎广大开发者继续使用 DeepSeek 提供的高效 API 服务。

源码地址:点击下载

相关推荐
我要咨询做网站
成功案例
建站流程
  • 网站需
    求分析
  • 网站策
    划方案
  • 页面风
    格设计
  • 程序设
    计研发
  • 资料录
    入优化
  • 确认交
    付使用
  • 后续跟
    踪服务
  • 400 9868 577
    info#ilanqiao.cn
Hi,Are you ready?
准备好开始了吗?
那就与我们取得联系吧

咨询送礼现在提交,将获得兰乔电子商务策划专家免费为您制作
价值5880元《全网营销方案+优化视频教程》一份!
下单送礼感恩七周年,新老用户下单即送创业型空间+域名等大礼
24小时免费咨询热线400 9868 577
合作意向表
您需要的服务
您最关注的地方
预算

直接咨询