假设有一个从核函数func,主核程序中一般通过extern SLAVE_FUN(func)();引用该函数,然后通过athread_spawn(func, 0);调用该函数
现在的问题是,如果改用满核组快速工作模式的函数athread_spawn64(func, 0);调用该函数时,编译就会报错,说func函数没有被定义
请问这种情况如何解决?
T
Tashkent 发布的帖子
-
关于athread满核组快速工作模式编译报错问题
-
RE: 从核能否以共享内存的方式对主存执行操作
@桑薇 在从核中引用主存变量比在主核中引用主存变量的延迟更高,所以如果要处理大量数据的话肯定不适用。
也就是说,神威的从核一般是以分布式内存(LDM)的方式实现并行吗?不能像GPU那样一个线程块里面所有线程都以共享内存的方式实现并行吗?
上面的问题如果不用共享内存方式解决的话,用什么方式比较好? -
从核能否以共享内存的方式对主存执行操作
athread的原理是把数据从主存放到局存,因为从核在局存中处理数据比在主存中快。
但是,如果数据分块块比较大,从核LDM放不下;或者从核中传输的数据分块大但是计算少。在这些情况下,如果从核能直接访问主存地址,以共享内存方式直接在主存中进行计算,这样会方便许多。
神威平台是否支持从核以共享内存方式使用主存?从核能否直接访问主存的地址(我知道主核能直接访问从核的LDM地址)?如果不能以共享内存方式实现的话,上述问题该如何解决? -
关于__thread_local的使用
请问,在从核程序中,是不是用__thread_local定义的变量都是放在从核的局存中的,没有用__thread_local定义的变量都是放在主存中(包括func函数里面的i j)?
func函数里面的i,j有必要用__thread_local定义吗?