在代码中测试发现,有时候拍数多反而耗时小,耗时多而拍数却少很多。这个求解答
Z
zhouyu 发布的帖子
-
如何使用申威众核处理器性能工具接口,
最近在弄这个,在看官方的文档,有几个疑问,求大佬解答。
一个是需不需要添加编译选项 -Wl,--wrap=main,以及--wrap后面跟着的是函数名还是其他?
我写--wrap=main 给我报错,写了--wrap=all_reduce好像没问题,但不知道这是啥意思 -
RE: 请问dma行模式,如何使用,测试了半天,发现还是有问题
@段晓辉 将地址自动对齐之后,起码不报错了,感谢,这个问题纠结了好久 。有个疑问,就是行模式中可以多个行一起使用行模式嘛。
我使用行集合模式的时候,len指的是一行读取的数据量吧。貌似行集合模式,我没有检查数组地址是否对齐,反正没报错。 -
请问dma行模式,如何使用,测试了半天,发现还是有问题
所以行模式,到底是什么意思。
贴图,这是自己写的dma的宏
这是使用宏来实现dma行模式,
然后就给我报错了,
求大佬,指点,行模式到底该如何书写,以及,行模式到底啥意思,是只能对一行进行操作嘛