【CUDA编程】CUDA 环境变量说明

7. 预加载依赖库相关CUDA_FORCE_PRELOAD_LIBRARIES:控制驱动程序在初始化期间是否预加载NVVM和PTX即时编译的依赖库。8. CUDA图相关CUDA_GRAPHS_USE_NODE_PRIORITY:覆盖CUDA图实例化时的优先级标志,用于调整图实例化行为。这些环境变量在CUDA编程中扮演着重要角色,帮助开发者高效管理和优化CUDA应用程序,提...
【CUDA编程】CUDA 环境变量说明
CUDA环境变量说明如下:
1. 设备枚举与属性CUDA_VISIBLE_DEVICES:用于指定CUDA应用程序将在哪些GPU设备上运行。值以英文逗号分隔,表示设备索引;亦支持UUID字符串,通过nvidiasmi L获取。用于限制应用程序访问的GPU设备,避免资源冲突。2. 编译相关CUDA_CACHE_DISABLE:控制即时编译缓存的启用与禁用。设置为1禁用缓存,设置为0启用缓存。CUDA_CACHE_PATH:指定即时编译器缓存二进制代码的目录。CUDA_CACHE_MAXSIZE:设置缓存大小,超过限制时,较旧的二进制代码将被清除。CUDA_FORCE_PTX_JIT 与 CUDA_DISABLE_PTX_JIT:分别控制是否强制或禁用嵌入PTX代码的即时编译,用于验证代码兼容性。CUDA_FORCE_JIT 与 CUDA_DISABLE_JIT:用于控制设备驱动程序对嵌入二进制代码的处理方式,确保应用程序与未来体系结构的兼容性。3. 执行相关CUDA_LAUNCH_BLOCKING:控制程序运行时是否禁用异步启动模式。设置为1禁用异步模式,等待Kernel执行完毕再继续。CUDA_DEVICE_MAX_CONNECTIONS:限制主机并行连接设备的数量,避免多流任务资源竞争。默认值为8。CUDA_AUTO_BOOST:启用GPU自动增强模式,根据功率、热量和利用率情况提高性能。4. 调试相关CUDA_DEVICE_WAITS_ON_EXCEPTION:在Linux系统上设置调试行为。当设备端代码运行错误时,CUDA应用程序停止,允许附加调试器进行进一步调试。5. MPS服务相关CUDA_DEVICE_DEFAULT_PERSISTING_L2_CACHE_PERCENTAGE_LIMIT:用于指定具有计算能力8.x的设备在使用多进程服务时L2高速缓存的预留大小。6. 模块加载相关CUDA_MODULE_LOADING 与 CUDA_MODULE_DATA_LOADING:分别控制应用程序的模块加载模式,影响Kernel和数据的加载方式。7. 预加载依赖库相关CUDA_FORCE_PRELOAD_LIBRARIES:控制驱动程序在初始化期间是否预加载NVVM和PTX即时编译的依赖库。8. CUDA图相关CUDA_GRAPHS_USE_NODE_PRIORITY:覆盖CUDA图实例化时的优先级标志,用于调整图实例化行为。这些环境变量在CUDA编程中扮演着重要角色,帮助开发者高效管理和优化CUDA应用程序,提升性能与资源利用效率。
2025-03-07
mengvlog 阅读 9 次 更新于 2025-06-20 01:06:27 我来答关注问题0
檬味博客在线解答立即免费咨询

编程相关话题

Copyright © 2023 WWW.MENGVLOG.COM - 檬味博客
返回顶部