IT博客汇
首页
精华
技术
设计
资讯
扯淡
权利声明
登录
注册
CUDA template kernel 与其他编译器合作编译
bendanban
发表于
2016-12-11 20:58:28
love
0
简介在优化Kernel的时候,希望某些变量是常量,例如循环的次数相关的变量。如果次数限制是常量的话,编译器就可以将循环展开。展开的循环,会省掉一些判断,从而节省一些计算时间。C++的模版中可以使用常量。但是我又不想所有的源代码都由nvcc来编译(其实C++的代码还是调用的host compiler),故此,我写这篇博客来提供一种方法。