Navigation

    • Register
    • Login
    • Search
    • Categories
    • Recent
    • Tags
    • Popular
    • Groups
    • Search
    • 官网
    1. Home
    2. Categories
    3. 申威芯片版块
    4. 技术交流区
    Log in to post

    技术交流区

    • 自己写的一个半自动神威26010的性能采样和调试工具库
      • swmore  

      3
      1
      Votes
      3
      Posts
      2313
      Views

      @xiaoq 我在改一个新的版本,要结合性能计数器,外加用python做后处理和可视化。 以及,从核有没有优雅的办法wrap函数? 另外我想定制一版编译器对dma进行插桩。
    • S

      请问DMA模式中RANK_MODE行集合模式是什么呢?
      • Sam  

      2
      0
      Votes
      2
      Posts
      1436
      Views

      大概应该是athread_get(RANK_MODE, src, dst, len, &reply, mask, stride, bsize) 比如athread_get(RANK_MODE, src, dst, 1024, &reply, 0xff, 0, 32)应该是: len=1024, mask=0xff, bsize=32 可以获取1024B数据,其中从核0获得0-32B, 256-288B, 512-544B, 768-800B, 从核1获得32-63B, 288-320B, 544-576B, 800-832B, 以此类推。 例子: #ifdef MPE #include <athread.h> #include <stdio.h> extern SLAVE_FUN(rank_mode)(double *); int main(){ double data[128]; int i; for (i = 0; i < 128; i ++){ data[i] = i; } athread_init(); athread_spawn(rank_mode, data); athread_join(); athread_halt(); } #endif #ifdef CPE #include <slave.h> void rank_mode(double *data){ if (_ROW > 0) return; double d_local[16]; volatile int reply; athread_syn(ROW_SCOPE, 0xff); if (_COL == 0){ reply = 0; athread_get(RANK_MODE, data, d_local, 1024, &reply, 0xff, 0, 32); while (reply != 1); } athread_syn(ROW_SCOPE, 0xff); int i; for (i = 0; i < 8; i ++){ athread_syn(ROW_SCOPE, 0xff); if (_COL == i){ printf("%d:", _COL); int j; for (j = 0; j < 16; j ++){ printf("%f ", d_local[j]); } puts(""); } } } #endif
    • L

      使用 swgdb 远程调试国产平台单节点主核程序的脚本
      • lusong  

      1
      0
      Votes
      1
      Posts
      1145
      Views

      No one has replied

    • S

      请问dma_barrier如何使用呢?
      • Sam  

      9
      -1
      Votes
      9
      Posts
      3356
      Views

      S

      @夜深忽梦少年事 您提到的问题,我在测试的时候也发现了,现在明白原因了,太谢谢啦~
    • Z

      请问dma行模式,如何使用,测试了半天,发现还是有问题
      • zhouyu  

      9
      0
      Votes
      9
      Posts
      2483
      Views

      Z

      @段晓辉 非常感谢,这个我们之后再试试
    • W

      求助,terminated by sig 4
      • wakawaka  

      6
      0
      Votes
      6
      Posts
      2570
      Views

      @wakawaka sig4是Illegal Instruction...有没有用函数指针的情况? 感觉这个好像目前只好插打印调试了...程序长吗?
    • Z

      如何使用申威众核处理器性能工具接口,
      • zhouyu  

      5
      0
      Votes
      5
      Posts
      1649
      Views

      是替换函数 之后你调用main实际会调用__wrap_main, 调用all_reduce会调用__wrap_all_reduce
    • 关于全片共享非master模式,有几个问题请教一下
      • Arrow  

      5
      0
      Votes
      5
      Posts
      1341
      Views

      @arrow 没有试过跑两个mpi
    • 老

      SW上请问有支持Fortran 2003的编译器吗?
      • 老泽征尔  

      6
      0
      Votes
      6
      Posts
      1792
      Views

      L

      好的,谢谢段老师~
    • M

      请问如何在C++的代码中链接xMath库?
      • mz  

      4
      0
      Votes
      4
      Posts
      1544
      Views

      凑合着用mpiCC, sw5CC有问题...
    • 1
    • 2
    • 3
    • 4
    • 1 / 4