cuda compile
nvcc compile
https://blog.csdn.net/weixin_36670529/article/details/105910109
- -arch=compute_80, 虚拟GPU架构编译成ptx
- -code=sm_80, 真实GPU架构编译成cubin
nvcc xxx.cu -arch=compute_60 -code=sm_60
即达成上图效果。对应真实架构sm_60的二进制的指令被嵌入到最用的可执行程序或者库文件,由于没有嵌入ptx,无法进行即时编译运行在sm > 60 GPU 上。