CUDA 11.7最新特性
周三,与R515 NVIDIA Linux驱动测试版和NVIDIA GPU内核驱动开源版一起发布的是CUDA 11.7。
NVIDIA CUDA 11.7 Toolkit现在可以作为NVIDIA专有计算栈的最新功能更新。CUDA 11.7带来了对新的NVIDIA Open GPU内核模块的兼容性支持,另外一个重要的亮点是延迟加载支持。
CUDA 11.7最新的主要更新如下:
- 支持使用CUDA 11.7和R515 beta驱动的NVIDIA Open GPU内核模块。
- 延迟加载:延迟内核从主机加载到GPU,直到内核被调用。这也只加载已使用的内核,这可能会显著节省设备端内存。这也将加载延迟从应用程序的开始推迟到第一次调用内核的时候——总的二进制加载延迟通常会显著减少,但也会转移到应用程序的后期。
- 要启用这个特性,在启动进程之前设置环境变量CUDA_MODULE_LOADING=LAZY。
注意,这个特性只兼容CUDA版本>= 11.7编译的库。
- NVCC主机编译器支持Clang 13。
- Nsight Compute、CUPTI、NVPROF / Visual Profiler和其他CUDA开发工具的各种新特性。
- 所有颜色格式现在支持Vulkan-CUDA互操作支持Android和Tegra的L4T。
- 弃用NVCC对所有gpu进行32位编译。
- CentOS Linux 8也已经从CUDA工具包中移除,取而代之的是Rocky Linux 8支持。
关于CUDA 11.7的更多细节可以通过发布说明和CUDA 11.7 Windows/Linux下载 developer.nvidia.com.。