@Sam 自己做地址对齐,自己给指针附一个16字节对齐的地址
P
popo 发布的帖子
-
RE: collide函数的循环中一个奇怪的错误
@Tashkent 您好,测试过了,确实是单双精度混合计算程序,为我之前的不严谨抱歉。但这并不影响向量化,且向量化后的函数精度与主核相比是能保持在比赛给出的精度范围之内。
-
RE: collide函数的循环中一个奇怪的错误
@xiao灰灰 额,我也是陈述一个事实,有问题讨论很正常。如果真的觉得程序有bug,小例子+实验数据,我们会去check我们的程序的。有的人把问题放上来,没示例没数据,贴上一个不明所以的图,所以问题的诊断肯定不准确。当然为了隐私,也可以在bbs上私聊。
-
RE: collide函数的循环中一个奇怪的错误
@xiao灰灰 说实话我真的不知道1.0f,编译器会给翻译成什么(ps:真的想测试,在外面定义个float型变量float one=1.0;)。此外,1.0 在寄存器里的形式是0x3ff0 0000 0000 0000 (单双精度是一致)(这个事实你可以好好查查文档)。所以我就搞不懂了为什么你们说把1.0的精度改一下,就发生精度大逆天的事。建议你可以把相应的函数翻译成汇编看看,看看1.0f翻译是否有问题。
-
RE: collide函数的循环中一个奇怪的错误
@Tashkent 首先collide函数的向量化我是做过的,与主核的精度误差是可以达到要求的,此外,1.5*value 这个我真的不知道有什么误差。如果你真的有疑问,上实验上数据。