欢迎光临,我们是一家专注中小型企业营销推广服务的公司!

咨询热线:400 9868 577
淮南兰乔电子商务有限公司
新闻中心News
淮南兰乔电子商务有限公司

NVIDIA CUDA Tile IR 开源

作者:霞舞 | 点击: | 来源:霞舞
2612
2025
本月初,NVIDIA在推出CUDA13.1的同时正式发布了CUDATile编程模型,并将其称为“自CUDA平台问世二十年以来最宏大、最系统的一次升级”。目前,CUDATile的中间表示(IntermediateRepresentation,IR)已在Apache2.0开源协议下全面开放。CUDATileIR构建于LLVM项目中的MLIR(Multi-LevelIntermediateRepresentation)基础之上。这一设计选择意义深远,不仅强化了其与现...

本月初,nvidia 在推出 cuda 13.1 的同时正式发布了 cuda tile 编程模型,并将其称为“自 cuda 平台问世二十年以来最宏大、最系统的一次升级”。目前,cuda tile 的中间表示(intermediate representation,ir)已在 apache 2.0 开源协议下全面开放。

CUDA Tile IR 构建于 LLVM 项目

中的 MLIR(Multi-Level Intermediate Representation)基础之上。这一设计选择意义深远,不仅强化了其与现有编译器生态的兼容性,也为在非 NVIDIA 硬件平台上支持 CUDA Tile IR 奠定了技术基础。

事实上,MLIR 已被多家厂商广泛采用:AMD 在其 AI 与高性能计算栈中不同程度集成了 MLIR;谷歌主导的 IREE 项目正依托 MLIR 实现跨厂商硬件的高效部署;英特尔亦为其 GPU 和 AI 加速器定制开发了专属 MLIR 方言;此外,ONNX-MLIR、MLIR-AIE、Torch-MLIR 等多样化 IR 框架也持续拓展着 MLIR 的应用边界。CUDA Tile IR 原生基于 MLIR,天然具备良好的可移植性与可扩展性,有望显著降低跨平台适配门槛,加速其向其他 GPU 或异构加速器生态的延伸。至少从开源角度看,这一举措将有力支撑 ZLUDA 等开源 CUDA 兼容层项目的演进与完善。

CUDA Tile 的完整实现包含 Tile MLIR 方言定义、Python API 接口绑定、字节码序列化格式以及配套的一致性验证测试套件。

CUDA Tile IR 是一个以 MLIR 为底层架构的 CUDA 内核优化中间表示及配套编译器基础设施,核心聚焦于分块(tiling)计算范式,并深度适配 NVIDIA 张量核心(Tensor Cores)的硬件特性。该项目构建了一套完整的工具链与抽象体系,用于建模、表达和优化面向 NVIDIA GPU 的分块计算任务,通过封装典型分块模式、内存层级调度策略及 GPU 特定优化机制,大幅简化高性能 CUDA 内核的开发流程与调优复杂度。

源码地址:点击下载

相关推荐
我要咨询做网站
成功案例
建站流程
  • 网站需
    求分析
  • 网站策
    划方案
  • 页面风
    格设计
  • 程序设
    计研发
  • 资料录
    入优化
  • 确认交
    付使用
  • 后续跟
    踪服务
  • 400 9868 577
    info#ilanqiao.cn
Hi,Are you ready?
准备好开始了吗?
那就与我们取得联系吧

咨询送礼现在提交,将获得兰乔电子商务策划专家免费为您制作
价值5880元《全网营销方案+优化视频教程》一份!
下单送礼感恩七周年,新老用户下单即送创业型空间+域名等大礼
24小时免费咨询热线400 9868 577
合作意向表
您需要的服务
您最关注的地方
预算

直接咨询