24842:GRPAES执行出现athread_join不了
25088:GRPAES执行出现 athread_join不了
popo
@popo
popo 发布的帖子
-
RE: 关于结构体的从核传输
结构体传入从核的步骤:
1.通过extern STRUCTTYPE *pstype 或者 函数参数void slave_fun(STRUCTTYPE *pstype)两种方式将结构体的地址传入从核。
2.根据结构体地址,由athread_get将主存里的pstype的数据传输到从核的ldm里。 -
2018年国产CPU并行应用挑战赛初赛赛题
赛题简介:
SWLBM是一套基于格子玻尔兹曼方法(Lattice Boltzmann Method)计算流体求解程序。格子玻尔兹曼方法是一种以速度分布函数为基本求解变量的介观数值模拟方法,通过碰撞迁移步骤来模拟流体演化过程。
赛题详细描述:
注意:
1. 赛题中的网格规模(1000*500*500),算例不可改。
2. 程序的参数不可以修改,不可以修改Argument.h文件。
3. Parallel.c的SetMPI函数不可以修改。
4. 赛题的总时间为函数TIME_ST()至TIME_ED()之间的时间,即计时区的时间,计时区:MAIN CALCULATION SECTION,不可以修改或变相修改非计时区的代码,不可将优化的代码移到非计时区。
5. 精度要求:单精度的绝对误差不大于1e-6
6. 通过cpcrun脚本将优化程序的运行时间提交到英雄榜,其作业运行的节点数不超过4个(节点数<=4)评分规则:
SWLBM的总分为70分。所有参赛队伍将围绕给定的SWLBM程序进行性能优化。主办方将提供一个算例来测试参赛队伍对程序的优化效果,目标是取得最高的并行程序性能。
计分规则:总分数P的计算公式P=70*(log(1+Tmin)/(log(1+T))
Tmin所有参赛队最小的运行时间,T表示当前参赛队的运行时间
SWLBM代码:
cpc2018初赛赛题最终版本请以cpc官方微信初赛赛题通知及cpc组委会初赛赛题通知邮件为准
------------------------------------本比赛最终解释权归cpc组委会所有--------------------------------------
-
RE: 向量化计算出现的异常问题
1.不能单靠您现在测试就怀疑是simd_store的问题,建议分析一下程序,设计更多测试来确定具体的原因,注意测试的时候要保证测试环境是一致的,比如提交任务的节点。
2.如果怀疑double类型的simd_store实现不好,可以改写成嵌汇编:
#define my_simdstore(va,addr) asm volatile("vldd %0,0(%1)" : “=r”(va) : "r"(addr))
试试。