用中文流畅的说明这段话,“Our first method reduces the NTT execution time from N/2 log2 N/2 + 2N to N/2 log2 N/2 compared with the na

动态 未结 0 65
小小草
小小草 LV1 2023年9月23日 23:40 发表
我们的第一种方法相对于朴素实现,将NTT执行时间从N/2 log2 N/2 + 2N减少到了N/2 log2 N/2。在我们的第二种方法中,我们利用Kyber方案中NTT定义的特点,对奇数和偶数系数进行两个独立的NTT计算。因此,我们使用两个蝴蝶核心并行计算NTT,将执行时间缩短到了N/2 log2 N/4。在这种方法中,内存的每个地址存储两个连续的系数,即si,2 j和si,2 j+1。然后,将内存的两个地址馈送到两个蝴蝶核心中,其中包含四个系数,即来自地址j的si,2 j和si,2 j+1,以及来自内存地址k的si,2k和si,2k+1。因此,si,2 j和si,2k用于第一个蝴蝶核心,而si,2 j+1和si,2k+1则由第二个核心独立处理。与前一种方法类似,结果应以相同的方式存储在第二个RAM中。虽然这种方法由于资源加倍而无法提高效率,但它可以加速计算以针对高性能架构。
收藏(0)  分享
相关标签: 智能问答
问题没解决?让AI助手帮你作答 AI助手
0个回复
  • 消灭零回复