在arm CPU上,使用arm Neon操作,可以提高内存拷贝速度。
首先包含 Neon的头文件arm_neon.h。
#include <arm_neon.h>
再使用Neon操作。
p_u8x16_buffer = (volatile uint8x16_t* )p_u8_buffer;
for( i=0; i<i_data_num; i++ )
{
vst1q_u8( (uint8_t *) &p_u8x16_buffer[i], vrst16);
}