关于使用服务器加速线程库的问题请教
-
在使用加速线程库进行并行计算时,为什么使用32个从核进行计算的时间却比使用64个从核所需时间更短?在同样的情况下,为什么不是使用核心数目越多越快?核心多了计算时间反而变得更长,谢谢答疑。
-
可能是带宽饱和了,或者你有没有找到的GLD和GST,你目前的加速比怎么样?如果比较低可能是后者,比较高可能是前者。
-
此回复已被删除!
-
@swmore
确实有好多地方使用了gld/gst,由于从核的高速缓存64K基本上被我以DMA方式读的数据占满了,所以其他数据不得不使用gld/gst,请问这种情况该如何解决呢?感觉只能改动程序主体来减少gld/gst了...