0

0

c# 如何在C#中利用GPU进行并行计算 Cuda.NET

煙雲

煙雲

发布时间:2026-01-13 11:37:02

|

257人浏览过

|

来源于php中文网

原创

Cuda.NET 在 .NET 6+ 上失败,因其依赖已移除组件、内存模型不兼容、调用过时 CUDA runtime 且缺乏 SafeHandle 和现代内存接口支持;应改用 ManagedCUDA。

c# 如何在c#中利用gpu进行并行计算 cuda.net

为什么直接用 Cuda.NET 在 .NET 6+ 上会失败

Cuda.NET 是一个封装 NVIDIA CUDA C API 的旧版 .NET 库,最后更新停留在 .NET Framework 4.x 时代。它依赖 System.DrawingMicrosoft.VisualC 等已移除或变更的组件,在 .NET 5/6/7/8 中编译会报 TypeLoadExceptionDllNotFoundException;即使强行加载,运行时大概率触发 AccessViolationException —— 因为它的内存管理模型与现代 .NET 的 GC 和内存模型不兼容。

  • 它调用的是 CUDA 9.0–10.2 时代的 cudart64_XX.dll,新版驱动(如 R535+)默认不附带这些旧版 runtime
  • 所有 CudaContextCudaDeviceVariable 类型内部使用非安全指针 + 手动 Marshal.AllocHGlobal,没有 SafeHandle 包装,GC 回收后易悬垂
  • 不支持 SpanMemoryGraphicsBuffer 等现代数据传递方式

替代方案:用 ManagedCUDA 替代 Cuda.NET

ManagedCUDA 是目前最活跃、兼容性最好的 CUDA .NET 封装库,支持 .NET Standard 2.0+,已适配 CUDA 11.x / 12.x,并提供 CUdeviceptr 安全包装、同步/异步 kernel 启动、PinnedHostMemory 管理等功能。

  • 安装:dotnet add package ManagedCuda(主包),若需 NPP/curand 支持再加 ManagedCuda.NPP
  • 必须确保本地安装对应版本的 CUDA Toolkit(如用 ManagedCuda 12.2.0,则需 CUDA 12.2 运行时或完整 toolkit)
  • 初始化前检查设备:
    var ctx = new CudaContext(0); // 0 是 device ID,可用 CudaContext.GetDeviceCount() 查
  • GPU 内存分配必须显式释放:ctx.LoadKernel("mykernel.ptx", "add"); 后记得 ctx.UnloadKernel()devicePtr.Dispose()

最简可行示例:向量加法(C# + PTX)

不要试图在 C# 里写 .cu 文件再 nvcc 编译——太重。推荐用预编译 PTX(CUDA 6.5+ 支持 forward compatibility),或用 NVRTC 在运行时编译(ManagedCuda 已封装 CudaNVRTC)。

  • 写一个最小 PTX(保存为 add.ptx):
    .version 7.8
    .target sm_50
    .address_size 64
    

    .visible .entry add( .param .u64 a, .param .u64 b, .param .u64 c, .param .u32 n ) { .reg .u32 %r<10>; .reg .u64 %rd<10>;

    ld.param.u64 %rd1, [a];
    ld.param.u64 %rd2, [b];
    ld.param.u64 %rd3, [c];
    ld.param.u32 %r1, [n];
    
    mov.u32 %r2, %tid.x;
    setp.lt.u32 %p1, %r2, %r1;
    @%p1 bra L1;
    exit;

    L1: mul.wide.u32 %rd4, %r2, 4; add.u64 %rd5, %rd1, %rd4; add.u64 %rd6, %rd2, %rd4; add.u64 %rd7, %rd3, %rd4;

    ld.global.s32 %r3, [%rd5];
    ld.global.s32 %r4, [%rd6];
    add.s32 %r5, %r3, %r4;
    st.global.s32 [%rd7], %r5;
    
    exit;

    }

    绘蛙-多图成片
    绘蛙-多图成片

    绘蛙新推出的AI图生视频工具

    下载
  • C# 调用:
    using (var ctx = new CudaContext(0))
    {
        var a = ctx.LoadModulePTX(File.ReadAllBytes("add.ptx"));
        var kernel = ctx.LoadKernel(a, "add");
    
    int n = 1024;
    var h_a = Enumerable.Range(0, n).Select(i => i).ToArray();
    var h_b = Enumerable.Range(0, n).Select(i => i * 2).ToArray();
    var h_c = new int[n];
    
    var d_a = ctx.LoadDeviceArray(h_a);
    var d_b = ctx.LoadDeviceArray(h_b);
    var d_c = ctx.Allocate(n);
    
    kernel.Launch(n, 1, 1, 0, 0, new object[] { d_a.DevicePointer, d_b.DevicePointer, d_c.DevicePointer, n });
    
    ctx.CopyDeviceObjectToArray(d_c, h_c);
    // h_c 现在是逐元素相加结果

    }

真正要注意的三个硬限制

不是语法问题,而是硬件和驱动层的刚性约束,容易调试半天才发现是这个原因:

  • cudaMalloc 分配上限受 GPU 显存剩余量实时限制,ctx.Allocate(N) 失败时不会抛 OutOfMemoryException,而是返回 CUresult.CUDA_ERROR_MEMORY_ERROR —— 必须检查 ctx.LastError
  • Kernel 参数总大小不能超过 4KB(CUDA 12.2),且所有参数必须是值类型或固定布局([StructLayout(LayoutKind.Sequential)]),引用类型(如 stringobject)传进去必崩
  • Windows 上 WDDM 模式(默认)对单次 kernel 运行有 2 秒超时保护(TCC 模式无此限制),长耗时计算必须拆成小 batch,或在 Tesla/Quadro 卡上启用 TCC:nvidia-smi -dm 1

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

315

2023.08.02

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1015

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

62

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

381

2025.12.29

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

575

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1093

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

789

2023.08.01

windows查看端口被占用的情况
windows查看端口被占用的情况

windows查看端口被占用的情况的方法:1、使用Windows自带的资源监视器;2、使用命令提示符查看端口信息;3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容,供大家免费下载体验。

451

2023.08.02

PHP 表单处理与文件上传安全实战
PHP 表单处理与文件上传安全实战

本专题聚焦 PHP 在表单处理与文件上传场景中的实战与安全问题,系统讲解表单数据获取与校验、XSS 与 CSRF 防护、文件类型与大小限制、上传目录安全配置、恶意文件识别以及常见安全漏洞的防范策略。通过贴近真实业务的案例,帮助学习者掌握 安全、规范地处理用户输入与文件上传的完整开发流程。

5

2026.01.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7万人学习

Excel 教程
Excel 教程

共162课时 | 11.6万人学习

PHP基础入门课程
PHP基础入门课程

共33课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号