完整版教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547
第22章 DSP矩阵运算-放缩,乘法和转置矩阵
本期教程主要讲解矩阵运算中的放缩,乘法和转置。
22.1 初学者重要提示
22.2 DSP基础运算指令
22.3 矩阵放缩(MatScale)
22.4 矩阵乘法(MatMult)
22.5 转置矩阵(MatTrans)
22.6 实验例程说明(MDK)
22.7 实验例程说明(IAR)
22.8 总结
22.1 初学者重要提示
- ARM提供的DSP库逆矩阵求法有局限性,通过Matlab验证是可以求逆矩阵的,而DSP库却不能正确求解。
- 注意定点数的矩阵乘法运算中溢出问题。
22.2 DSP基础运算指令
本章用到的DSP指令在前面章节都已经讲解过。
22.3 矩阵放缩(MatScale)
以3*3矩阵为例,矩阵放缩的实现公式如下:
22.3.1 函数arm_mat_scale_f32
函数原型:
arm_status arm_mat_scale_f32(
const arm_matrix_instance_f32 * pSrc,
float32_t scale,
arm_matrix_instance_f32 * pDst)
函数描述:
这个函数用于浮点格式的矩阵数据的放缩。
函数参数:
- 第1个参数是源矩阵地址。
- 第2个参数是放缩系数。
- 第3个参数是放缩后的目的数据地址。
- 返回值,ARM_MATH_SIZE_MISMATCH表示源矩阵和目标矩阵行列不一致,ARM_MATH_SUCCESS表示成功。
注意事项:
矩阵在数组中的存储是从左到右,再从上到下。
22.3.2 函数arm_mat_scale_q31
函数原型:
arm_status arm_mat_scale_q31(
const arm_matrix_instance_q31 * pSrc,
q31_t scaleFract,
int32_t shift,
arm_matrix_instance_q31 * pDst)
函数描述:
这个函数用于定点Q31格式的矩阵数据的放缩。
函数参数:
- 第1个参数是源矩阵地址。
- 第2个参数是放缩系数。
- 第3个参数是移位的bit数。
- 第4个参数是放缩后的目的数据地址。
- 返回值,ARM_MATH_SIZE_MISMATCH表示源矩阵和目标矩阵行列不一致,ARM_MATH_SUCCESS表示成功。
注意事项:
- 两个1.31格式的数据相乘产生2.62格式的数据,最终结果要做偏移和饱和运算产生1.31格式数。
- 定点数的最终放缩比例计算是:scale = scaleFract * 2^shift。
- 矩阵在数组中的存储是从左到右,再从上到下。
22.3.3 函数arm_mat_scale_q15
函数原型:
arm_status arm_mat_scale_q15(
const arm_matrix_instance_q15 * pSrc,
q15_t scaleFract,
int32_t shift,
arm_matrix_instance_q15 * pDst)
函数描述:
这个函数用于定点Q15格式的矩阵数据的放缩。
函数参数:
- 第1个参数是源矩阵地址。
- 第2个参数是放缩系数。
- 第3个参数是移位的bit数。
- 第4个参数是放缩后的目的数据地址。
- 返回值,ARM_MATH_SIZE_MISMATCH表示源矩阵和目标矩阵行列不一致,ARM_MATH_SUCCESS表示成功。
注意事项:
- 两个1.15格式的数据相乘产生2.30格式的数据,最终结果要做偏移和饱和运算产生1.15格式数据。
- 定点数的最终放缩比例计算是:scale = scaleFract * 2^shift。
- 矩阵在数组中的存储是从左到右,再从上到下。
22.3.4 使用举例(含matlab实现)
程序设计:
/* ********************************************************************************************************* * 函 数 名: DSP_MatScale * 功能说明: 矩阵放缩 * 形 参: 无 * 返 回 值: 无 ********************************************************************************************************* */ static void DSP_MatScale(void) { uint8_t i; /****浮点数数组******************************************************************/ float32_t pDataA[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f}; float32_t scale = 1.1f; float32_t pDataDst[9]; arm_matrix_instance_f32 pSrcA; //3行3列数据 arm_matrix_instance_f32 pDst; /****定点数Q31数组******************************************************************/ q31_t pDataA1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5}; q31_t scaleFract = 10; int32_t shift = 0; q31_t pDataDst1[9]; arm_matrix_instance_q31 pSrcA1; //3行3列数据 arm_matrix_instance_q31 pDst1; /****定点数Q15数组******************************************************************/ q15_t pDataA2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5}; q15_t scaleFract1 = 10; int32_t shift1 = 0; q15_t pDataDst2[9]; arm_matrix_instance_q15 pSrcA2; //3行3列数据 arm_matrix_instance_q15 pDst2; /****浮点数***********************************************************************/ pSrcA.numCols = 3; pSrcA.numRows = 3; pSrcA.pData = pDataA; pDst.numCols = 3; pDst.numRows = 3; pDst.pData = pDataDst; printf("****浮点数****************************************** "); arm_mat_scale_f32(&pSrcA, scale, &pDst); for(i = 0; i < 9; i++) { printf("pDataDst[%d] = %f ", i, pDataDst[i]); } /****定点数Q31***********************************************************************/ pSrcA1.numCols = 3; pSrcA1.numRows = 3; pSrcA1.pData = pDataA1; pDst1.numCols = 3; pDst1.numRows = 3; pDst1.pData = pDataDst1; printf("****定点数Q31****************************************** "); arm_mat_scale_q31(&pSrcA1, scaleFract, shift, &pDst1); for(i = 0; i < 9; i++) { printf("pDataDst1[%d] = %d ", i, pDataDst1[i]); } /****定点数Q15***********************************************************************/ pSrcA2.numCols = 3; pSrcA2.numRows = 3; pSrcA2.pData = pDataA2; pDst2.numCols = 3; pDst2.numRows = 3; pDst2.pData = pDataDst2; printf("****定点数Q15****************************************** "); arm_mat_scale_q15(&pSrcA2, scaleFract1, shift1, &pDst2); for(i = 0; i < 9; i++) { printf("pDataDst2[%d] = %d ", i, pDataDst2[i]); } }
实验现象(按下K1按键后串口打印):
下面通过matlab来实现矩阵的放缩:
22.4 矩阵乘法(MatMult)
以3*3矩阵为例,矩阵乘法的实现公式如下:
22.4.1 函数arm_mat_mult_f32
函数原型:
arm_status arm_mat_mult_f32(
const arm_matrix_instance_f32 * pSrcA,
const arm_matrix_instance_f32 * pSrcB,
arm_matrix_instance_f32 * pDst)
函数描述:
这个函数用于浮点数的矩阵乘法。
函数参数:
- 第1个参数是矩阵A的源地址。
- 第2个参数是矩阵B的源地址。
- 第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
- 返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。
注意事项:
- 两个矩阵M x N和N x P相乘的结果是M x P(必须保证一个矩形的列数等于另一个矩阵的行数)。
- 矩阵在数组中的存储是从左到右,再从上到下。
22.4.2 函数arm_mat_mult_q31
函数原型:
arm_status arm_mat_mult_q31(
const arm_matrix_instance_q31 * pSrcA,
const arm_matrix_instance_q31 * pSrcB,
arm_matrix_instance_q31 * pDst)
函数描述:
这个函数用于定点数Q31的矩阵乘法。
函数参数:
- 第1个参数是矩阵A的源地址。
- 第2个参数是矩阵B的源地址。
- 第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
- 返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。
注意事项:
- 两个1.31格式的数据相乘产生2.62格式的数据,函数的内部使用了64位的累加器,最终结果要做偏移和饱和运算产生1.31格式数据。
- 两个矩阵M x N和N x P相乘的结果是M x P.(必须保证一个矩形的列数等于另一个矩阵的行数)。
- 矩阵在数组中的存储是从左到右,再从上到下。
22.4.3 函数arm_mat_mult_q15
函数原型:
arm_status arm_mat_mult_q15(
const arm_matrix_instance_q15 * pSrcA,
const arm_matrix_instance_q15 * pSrcB,
arm_matrix_instance_q15 * pDst,
q15_t * pState)
函数描述:
这个函数用于定点数Q15的矩阵乘法。
函数参数:
- 第1个参数是矩阵A的源地址。
- 第2个参数是矩阵B的源地址。
- 第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
- 第4个参数用于存储内部计算结果。
- 返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。
注意事项:
- 两个1.15格式数据相乘是2.30格式,函数的内部使用了64位的累加器,34.30格式,最终结果将低15位截取掉并做饱和处理为1.15格式。
- 两个矩阵M x N和N x P相乘的结果是M x P.(必须保证一个矩形的列数等于另一个矩阵的行数)。
- 矩阵在数组中的存储是从左到右,再从上到下。
22.4.4 函数arm_mat_mult_fast_q31
函数原型:
arm_status arm_mat_mult_fast_q31(
const arm_matrix_instance_q31 * pSrcA,
const arm_matrix_instance_q31 * pSrcB,
arm_matrix_instance_q31 * pDst)
函数描述:
这个函数用于定点数Q31的矩阵乘法。
函数参数:
- 第1个参数是矩阵A的源地址。
- 第2个参数是矩阵B的源地址。
- 第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
- 返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。
注意事项:
- 两个1.31格式的数据相乘产生2.62格式的数据,函数的内部使用了64位的累加器,最终结果要做偏移和饱和运算产生1.31格式数据。
- 两个矩阵M x N和N x P相乘的结果是M x P.(必须保证一个矩形的列数等于另一个矩阵的行数)。
- 矩阵在数组中的存储是从左到右,再从上到下。
- 函数arm_mat_mult_fast_q31是arm_mat_mult_q31的快速算法。
22.4.5 函数arm_mat_mult_fast_q15
函数原型:
arm_status arm_mat_mult_q15(
const arm_matrix_instance_q15 * pSrcA,
const arm_matrix_instance_q15 * pSrcB,
arm_matrix_instance_q15 * pDst,
q15_t * pState)
函数描述:
这个函数用于定点数Q15的矩阵乘法。
函数参数:
- 第1个参数是矩阵A的源地址。
- 第2个参数是矩阵B的源地址。
- 第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
- 第4个参数用于存储内部计算结果。
- 返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。
注意事项:
- 两个1.15格式数据相乘是2.30格式,函数的内部使用了64位的累加器,34.30格式,最终结果将低15位截取掉并做饱和处理为1.15格式。
- 两个矩阵M x N和N x P相乘的结果是M x P.(必须保证一个矩形的列数等于另一个矩阵的行数)。
- 矩阵在数组中的存储是从左到右,再从上到下。
22.4.6 使用举例(含matlab实现)
程序设计:
/* ********************************************************************************************************* * 函 数 名: DSP_MatMult * 功能说明: 矩阵乘法 * 形 参: 无 * 返 回 值: 无 ********************************************************************************************************* */ static void DSP_MatMult(void) { uint8_t i; /****浮点数数组******************************************************************/ float32_t pDataA[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f}; float32_t pDataB[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f}; float32_t pDataDst[9]; arm_matrix_instance_f32 pSrcA; //3行3列数据 arm_matrix_instance_f32 pSrcB; //3行3列数据 arm_matrix_instance_f32 pDst; /****定点数Q31数组******************************************************************/ q31_t pDataA1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5}; q31_t pDataB1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5}; q31_t pDataDst1[9]; arm_matrix_instance_q31 pSrcA1; //3行3列数据 arm_matrix_instance_q31 pSrcB1; //3行3列数据 arm_matrix_instance_q31 pDst1; /****定点数Q15数组******************************************************************/ q15_t pDataA2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5}; q15_t pDataB2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5}; q15_t pDataDst2[9]; arm_matrix_instance_q15 pSrcA2; //3行3列数据 arm_matrix_instance_q15 pSrcB2; //3行3列数据 arm_matrix_instance_q15 pDst2; q15_t pState[9]; /****浮点数***********************************************************************/ pSrcA.numCols = 3; pSrcA.numRows = 3; pSrcA.pData = pDataA; pSrcB.numCols = 3; pSrcB.numRows = 3; pSrcB.pData = pDataB; pDst.numCols = 3; pDst.numRows = 3; pDst.pData = pDataDst; printf("****浮点数****************************************** "); arm_mat_mult_f32(&pSrcA, &pSrcB, &pDst); for(i = 0; i < 9; i++) { printf("pDataDst[%d] = %f ", i, pDataDst[i]); } /****定点数Q31***********************************************************************/ pSrcA1.numCols = 3; pSrcA1.numRows = 3; pSrcA1.pData = pDataA1; pSrcB1.numCols = 3; pSrcB1.numRows = 3; pSrcB1.pData = pDataB1; pDst1.numCols = 3; pDst1.numRows = 3; pDst1.pData = pDataDst1; printf("****定点数Q31****************************************** "); arm_mat_mult_q31(&pSrcA1, &pSrcB1, &pDst1); arm_mat_mult_fast_q31(&pSrcA1, &pSrcB1, &pDst1); for(i = 0; i < 9; i++) { printf("pDataDst1[%d] = %d ", i, pDataDst1[i]); } /****定点数Q15***********************************************************************/ pSrcA2.numCols = 3; pSrcA2.numRows = 3; pSrcA2.pData = pDataA2; pSrcB2.numCols = 3; pSrcB2.numRows = 3; pSrcB2.pData = pDataB2; pDst2.numCols = 3; pDst2.numRows = 3; pDst2.pData = pDataDst2; printf("****定点数Q15****************************************** "); arm_mat_mult_q15(&pSrcA2, &pSrcB2, &pDst2, pState); arm_mat_mult_fast_q15(&pSrcA2, &pSrcB2, &pDst2, pState); for(i = 0; i < 9; i++) { printf("pDataDst2[%d] = %d ", i, pDataDst2[i]); } }
实验现象(按下K2按键后串口打印):
下面通过matlab来实现矩阵的放缩:
22.5 转置矩阵 MatTrans
以3*3矩阵为例,转置矩阵的实现公式如下:
22.5.1 函数arm_mat_trans_f32
函数原型:
arm_status arm_mat_trans_f32(
const arm_matrix_instance_f32 * pSrc,
arm_matrix_instance_f32 * pDst)
函数描述:
这个函数用于浮点数的转置矩阵求解。
函数参数:
- 第1个参数是矩阵源地址。
- 第2个参数是转置后的矩阵地址。
- 返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。
注意事项:
- 矩阵M x N转置后是N x M。也就是说pSrc源地址存储的矩阵是M x N格式的话,那么pDst地址必须是N x M格式。
22.5.2 函数arm_mat_trans_q31
函数原型:
arm_status arm_mat_trans_q31(
const arm_matrix_instance_q31 * pSrc,
arm_matrix_instance_q31 * pDst)
函数描述:
这个函数用于定点数Q31的转置矩阵求解。
函数参数:
- 第1个参数是矩阵源地址。
- 第2个参数是转置后的矩阵地址。
- 返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。
注意事项:
矩阵M x N转置后是N x M。也就是说pSrc源地址存储的矩阵是M x N格式的话,那么pDst地址必须是N x M格式。
22.5.3 函数arm_mat_trans_q15
函数原型:
arm_status arm_mat_trans_q15(
const arm_matrix_instance_q15 * pSrc,
arm_matrix_instance_q15 * pDst)
函数描述:
这个函数用于定点数Q15的转置矩阵求解。
函数参数:
- 第1个参数是矩阵源地址。
- 第2个参数是转置后的矩阵地址。
- 返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。
注意事项:
矩阵M x N转置后是N x M。也就是说pSrc源地址存储的矩阵是M x N格式的话,那么pDst地址必须是N x M格式。
22.5.4 使用举例(含matlab实现)
程序设计:
/* ********************************************************************************************************* * 函 数 名: DSP_MatScale * 功能说明: 矩阵放缩 * 形 参: 无 * 返 回 值: 无 ********************************************************************************************************* */ static void DSP_MatScale(void) { uint8_t i; /****浮点数数组******************************************************************/ float32_t pDataA[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f}; float32_t scale = 1.1f; float32_t pDataDst[9]; arm_matrix_instance_f32 pSrcA; //3行3列数据 arm_matrix_instance_f32 pDst; /****定点数Q31数组******************************************************************/ q31_t pDataA1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5}; q31_t scaleFract = 10; int32_t shift = 0; q31_t pDataDst1[9]; arm_matrix_instance_q31 pSrcA1; //3行3列数据 arm_matrix_instance_q31 pDst1; /****定点数Q15数组******************************************************************/ q15_t pDataA2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5}; q15_t scaleFract1 = 10; int32_t shift1 = 0; q15_t pDataDst2[9]; arm_matrix_instance_q15 pSrcA2; //3行3列数据 arm_matrix_instance_q15 pDst2; /****浮点数***********************************************************************/ pSrcA.numCols = 3; pSrcA.numRows = 3; pSrcA.pData = pDataA; pDst.numCols = 3; pDst.numRows = 3; pDst.pData = pDataDst; printf("****浮点数****************************************** "); arm_mat_scale_f32(&pSrcA, scale, &pDst); for(i = 0; i < 9; i++) { printf("pDataDst[%d] = %f ", i, pDataDst[i]); } /****定点数Q31***********************************************************************/ pSrcA1.numCols = 3; pSrcA1.numRows = 3; pSrcA1.pData = pDataA1; pDst1.numCols = 3; pDst1.numRows = 3; pDst1.pData = pDataDst1; printf("****定点数Q31****************************************** "); arm_mat_scale_q31(&pSrcA1, scaleFract, shift, &pDst1); for(i = 0; i < 9; i++) { printf("pDataDst1[%d] = %d ", i, pDataDst1[i]); } /****定点数Q15***********************************************************************/ pSrcA2.numCols = 3; pSrcA2.numRows = 3; pSrcA2.pData = pDataA2; pDst2.numCols = 3; pDst2.numRows = 3; pDst2.pData = pDataDst2; printf("****定点数Q15****************************************** "); arm_mat_scale_q15(&pSrcA2, scaleFract1, shift1, &pDst2); for(i = 0; i < 9; i++) { printf("pDataDst2[%d] = %d ", i, pDataDst2[i]); } } /* ********************************************************************************************************* * 函 数 名: DSP_MatTrans * 功能说明: 矩阵数据初始化 * 形 参: 无 * 返 回 值: 无 ********************************************************************************************************* */ static void DSP_MatTrans(void) { uint8_t i; /****浮点数数组******************************************************************/ float32_t pDataA[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f}; float32_t pDataDst[9]; arm_matrix_instance_f32 pSrcA; //3行3列数据 arm_matrix_instance_f32 pDst; /****定点数Q31数组******************************************************************/ q31_t pDataA1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5}; q31_t pDataDst1[9]; arm_matrix_instance_q31 pSrcA1; //3行3列数据 arm_matrix_instance_q31 pDst1; /****定点数Q15数组******************************************************************/ q15_t pDataA2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5}; q15_t pDataDst2[9]; arm_matrix_instance_q15 pSrcA2; //3行3列数据 arm_matrix_instance_q15 pDst2; /****浮点数***********************************************************************/ pSrcA.numCols = 3; pSrcA.numRows = 3; pSrcA.pData = pDataA; pDst.numCols = 3; pDst.numRows = 3; pDst.pData = pDataDst; printf("****浮点数****************************************** "); arm_mat_trans_f32(&pSrcA, &pDst); for(i = 0; i < 9; i++) { printf("pDataDst[%d] = %f ", i, pDataDst[i]); } /****定点数Q31***********************************************************************/ pSrcA1.numCols = 3; pSrcA1.numRows = 3; pSrcA1.pData = pDataA1; pDst1.numCols = 3; pDst1.numRows = 3; pDst1.pData = pDataDst1; printf("****定点数Q31****************************************** "); arm_mat_trans_q31(&pSrcA1, &pDst1); for(i = 0; i < 9; i++) { printf("pDataDst1[%d] = %d ", i, pDataDst1[i]); } /****定点数Q15***********************************************************************/ pSrcA2.numCols = 3; pSrcA2.numRows = 3; pSrcA2.pData = pDataA2; pDst2.numCols = 3; pDst2.numRows = 3; pDst2.pData = pDataDst2; printf("****定点数Q15****************************************** "); arm_mat_trans_q15(&pSrcA2, &pDst2); for(i = 0; i < 9; i++) { printf("pDataDst2[%d] = %d ", i, pDataDst2[i]); } }
实验现象(按下K3按键后串口打印):
下面通过matlab来实现矩阵的放缩:
22.6 实验例程说明(MDK)
配套例子:
V7-217_DSP矩阵运算(放缩,乘法和转置)
实验目的:
- 学习DSP复数运算(放缩,乘法和转置)
实验内容:
- 启动一个自动重装软件定时器,每100ms翻转一次LED2。
- 按下按键K1,串口打函数DSP_MatScale的输出数据。
- 按下按键K2,串口打函数DSP_MatMult的输出数据。
- 按下按键K3,串口打函数DSP_MatTrans的输出数据。
使用AC6注意事项
特别注意附件章节C的问题
上电后串口打印的信息:
波特率 115200,数据位 8,奇偶校验位无,停止位 1。
详见本章的3.4 ,4.6和5.4小节。
程序设计:
系统栈大小分配:
RAM空间用的DTCM:
硬件外设初始化
硬件外设的初始化是在 bsp.c 文件实现:
/* ********************************************************************************************************* * 函 数 名: bsp_Init * 功能说明: 初始化所有的硬件设备。该函数配置CPU寄存器和外设的寄存器并初始化一些全局变量。只需要调用一次 * 形 参:无 * 返 回 值: 无 ********************************************************************************************************* */ void bsp_Init(void) { /* 配置MPU */ MPU_Config(); /* 使能L1 Cache */ CPU_CACHE_Enable(); /* STM32H7xx HAL 库初始化,此时系统用的还是H7自带的64MHz,HSI时钟: - 调用函数HAL_InitTick,初始化滴答时钟中断1ms。 - 设置NVIV优先级分组为4。 */ HAL_Init(); /* 配置系统时钟到400MHz - 切换使用HSE。 - 此函数会更新全局变量SystemCoreClock,并重新配置HAL_InitTick。 */ SystemClock_Config(); /* Event Recorder: - 可用于代码执行时间测量,MDK5.25及其以上版本才支持,IAR不支持。 - 默认不开启,如果要使能此选项,务必看V7开发板用户手册第8章 */ #if Enable_EventRecorder == 1 /* 初始化EventRecorder并开启 */ EventRecorderInitialize(EventRecordAll, 1U); EventRecorderStart(); #endif bsp_InitKey(); /* 按键初始化,要放在滴答定时器之前,因为按钮检测是通过滴答定时器扫描 */ bsp_InitTimer(); /* 初始化滴答定时器 */ bsp_InitUart(); /* 初始化串口 */ bsp_InitExtIO(); /* 初始化FMC总线74HC574扩展IO. 必须在 bsp_InitLed()前执行 */ bsp_InitLed(); /* 初始化LED */ }
MPU配置和Cache配置:
数据Cache和指令Cache都开启。配置了AXI SRAM区(本例子未用到AXI SRAM),FMC的扩展IO区。
/* ********************************************************************************************************* * 函 数 名: MPU_Config * 功能说明: 配置MPU * 形 参: 无 * 返 回 值: 无 ********************************************************************************************************* */ static void MPU_Config( void ) { MPU_Region_InitTypeDef MPU_InitStruct; /* 禁止 MPU */ HAL_MPU_Disable(); /* 配置AXI SRAM的MPU属性为Write back, Read allocate,Write allocate */ MPU_InitStruct.Enable = MPU_REGION_ENABLE; MPU_InitStruct.BaseAddress = 0x24000000; MPU_InitStruct.Size = MPU_REGION_SIZE_512KB; MPU_InitStruct.AccessPermission = MPU_REGION_FULL_ACCESS; MPU_InitStruct.IsBufferable = MPU_ACCESS_BUFFERABLE; MPU_InitStruct.IsCacheable = MPU_ACCESS_CACHEABLE; MPU_InitStruct.IsShareable = MPU_ACCESS_NOT_SHAREABLE; MPU_InitStruct.Number = MPU_REGION_NUMBER0; MPU_InitStruct.TypeExtField = MPU_TEX_LEVEL1; MPU_InitStruct.SubRegionDisable = 0x00; MPU_InitStruct.DisableExec = MPU_INSTRUCTION_ACCESS_ENABLE; HAL_MPU_ConfigRegion(&MPU_InitStruct); /* 配置FMC扩展IO的MPU属性为Device或者Strongly Ordered */ MPU_InitStruct.Enable = MPU_REGION_ENABLE; MPU_InitStruct.BaseAddress = 0x60000000; MPU_InitStruct.Size = ARM_MPU_REGION_SIZE_64KB; MPU_InitStruct.AccessPermission = MPU_REGION_FULL_ACCESS; MPU_InitStruct.IsBufferable = MPU_ACCESS_BUFFERABLE; MPU_InitStruct.IsCacheable = MPU_ACCESS_NOT_CACHEABLE; MPU_InitStruct.IsShareable = MPU_ACCESS_NOT_SHAREABLE; MPU_InitStruct.Number = MPU_REGION_NUMBER1; MPU_InitStruct.TypeExtField = MPU_TEX_LEVEL0; MPU_InitStruct.SubRegionDisable = 0x00; MPU_InitStruct.DisableExec = MPU_INSTRUCTION_ACCESS_ENABLE; HAL_MPU_ConfigRegion(&MPU_InitStruct); /*使能 MPU */ HAL_MPU_Enable(MPU_PRIVILEGED_DEFAULT); } /* ********************************************************************************************************* * 函 数 名: CPU_CACHE_Enable * 功能说明: 使能L1 Cache * 形 参: 无 * 返 回 值: 无 ********************************************************************************************************* */ static void CPU_CACHE_Enable(void) { /* 使能 I-Cache */ SCB_EnableICache(); /* 使能 D-Cache */ SCB_EnableDCache(); }
主功能:
主程序实现如下操作:
- 启动一个自动重装软件定时器,每100ms翻转一次LED2。
- 按下按键K1,串口打函数DSP_MatScale的输出数据。
- 按下按键K2,串口打函数DSP_MatMult的输出数据。
- 按下按键K3,串口打函数DSP_MatTrans的输出数据。
/* ********************************************************************************************************* * 函 数 名: main * 功能说明: c程序入口 * 形 参: 无 * 返 回 值: 错误代码(无需处理) ********************************************************************************************************* */ int main(void) { uint8_t ucKeyCode; /* 按键代码 */ bsp_Init(); /* 硬件初始化 */ PrintfLogo(); /* 打印例程信息到串口1 */ PrintfHelp(); /* 打印操作提示信息 */ bsp_StartAutoTimer(0, 100); /* 启动1个100ms的自动重装的定时器 */ /* 进入主程序循环体 */ while (1) { bsp_Idle(); /* 这个函数在bsp.c文件。用户可以修改这个函数实现CPU休眠和喂狗 */ /* 判断定时器超时时间 */ if (bsp_CheckTimer(0)) { /* 每隔100ms 进来一次 */ bsp_LedToggle(2); } ucKeyCode = bsp_GetKey(); /* 读取键值, 无键按下时返回 KEY_NONE = 0 */ if (ucKeyCode != KEY_NONE) { switch (ucKeyCode) { case KEY_DOWN_K1: /* 按下按键K1,串口打函数DSP_MatScale的输出数据 */ DSP_MatScale(); break; case KEY_DOWN_K2: /* 按下按键K2,串口打函数DSP_MatMult的输出数据 */ DSP_MatMult(); break; case KEY_DOWN_K3: /* 按下按键K3,串口打函数DSP_MatTrans的输出数据 */ DSP_MatTrans(); break; default: /* 其他的键值不处理 */ break; } } } }
22.7 实验例程说明(IAR)
配套例子:
V7-217_DSP矩阵运算(放缩,乘法和转置)
实验目的:
- 学习DSP复数运算(放缩,乘法和转置)
实验内容:
- 启动一个自动重装软件定时器,每100ms翻转一次LED2。
- 按下按键K1,串口打函数DSP_MatScale的输出数据。
- 按下按键K2,串口打函数DSP_MatMult的输出数据。
- 按下按键K3,串口打函数DSP_MatTrans的输出数据。
上电后串口打印的信息:
波特率 115200,数据位 8,奇偶校验位无,停止位 1。
详见本章的3.4 ,4.6和5.4小节。
程序设计:
系统栈大小分配:
RAM空间用的DTCM:
硬件外设初始化
硬件外设的初始化是在 bsp.c 文件实现:
/* ********************************************************************************************************* * 函 数 名: bsp_Init * 功能说明: 初始化所有的硬件设备。该函数配置CPU寄存器和外设的寄存器并初始化一些全局变量。只需要调用一次 * 形 参:无 * 返 回 值: 无 ********************************************************************************************************* */ void bsp_Init(void) { /* 配置MPU */ MPU_Config(); /* 使能L1 Cache */ CPU_CACHE_Enable(); /* STM32H7xx HAL 库初始化,此时系统用的还是H7自带的64MHz,HSI时钟: - 调用函数HAL_InitTick,初始化滴答时钟中断1ms。 - 设置NVIV优先级分组为4。 */ HAL_Init(); /* 配置系统时钟到400MHz - 切换使用HSE。 - 此函数会更新全局变量SystemCoreClock,并重新配置HAL_InitTick。 */ SystemClock_Config(); /* Event Recorder: - 可用于代码执行时间测量,MDK5.25及其以上版本才支持,IAR不支持。 - 默认不开启,如果要使能此选项,务必看V7开发板用户手册第8章 */ #if Enable_EventRecorder == 1 /* 初始化EventRecorder并开启 */ EventRecorderInitialize(EventRecordAll, 1U); EventRecorderStart(); #endif bsp_InitKey(); /* 按键初始化,要放在滴答定时器之前,因为按钮检测是通过滴答定时器扫描 */ bsp_InitTimer(); /* 初始化滴答定时器 */ bsp_InitUart(); /* 初始化串口 */ bsp_InitExtIO(); /* 初始化FMC总线74HC574扩展IO. 必须在 bsp_InitLed()前执行 */ bsp_InitLed(); /* 初始化LED */ }
MPU配置和Cache配置:
数据Cache和指令Cache都开启。配置了AXI SRAM区(本例子未用到AXI SRAM),FMC的扩展IO区。
/* ********************************************************************************************************* * 函 数 名: MPU_Config * 功能说明: 配置MPU * 形 参: 无 * 返 回 值: 无 ********************************************************************************************************* */ static void MPU_Config( void ) { MPU_Region_InitTypeDef MPU_InitStruct; /* 禁止 MPU */ HAL_MPU_Disable(); /* 配置AXI SRAM的MPU属性为Write back, Read allocate,Write allocate */ MPU_InitStruct.Enable = MPU_REGION_ENABLE; MPU_InitStruct.BaseAddress = 0x24000000; MPU_InitStruct.Size = MPU_REGION_SIZE_512KB; MPU_InitStruct.AccessPermission = MPU_REGION_FULL_ACCESS; MPU_InitStruct.IsBufferable = MPU_ACCESS_BUFFERABLE; MPU_InitStruct.IsCacheable = MPU_ACCESS_CACHEABLE; MPU_InitStruct.IsShareable = MPU_ACCESS_NOT_SHAREABLE; MPU_InitStruct.Number = MPU_REGION_NUMBER0; MPU_InitStruct.TypeExtField = MPU_TEX_LEVEL1; MPU_InitStruct.SubRegionDisable = 0x00; MPU_InitStruct.DisableExec = MPU_INSTRUCTION_ACCESS_ENABLE; HAL_MPU_ConfigRegion(&MPU_InitStruct); /* 配置FMC扩展IO的MPU属性为Device或者Strongly Ordered */ MPU_InitStruct.Enable = MPU_REGION_ENABLE; MPU_InitStruct.BaseAddress = 0x60000000; MPU_InitStruct.Size = ARM_MPU_REGION_SIZE_64KB; MPU_InitStruct.AccessPermission = MPU_REGION_FULL_ACCESS; MPU_InitStruct.IsBufferable = MPU_ACCESS_BUFFERABLE; MPU_InitStruct.IsCacheable = MPU_ACCESS_NOT_CACHEABLE; MPU_InitStruct.IsShareable = MPU_ACCESS_NOT_SHAREABLE; MPU_InitStruct.Number = MPU_REGION_NUMBER1; MPU_InitStruct.TypeExtField = MPU_TEX_LEVEL0; MPU_InitStruct.SubRegionDisable = 0x00; MPU_InitStruct.DisableExec = MPU_INSTRUCTION_ACCESS_ENABLE; HAL_MPU_ConfigRegion(&MPU_InitStruct); /*使能 MPU */ HAL_MPU_Enable(MPU_PRIVILEGED_DEFAULT); } /* ********************************************************************************************************* * 函 数 名: CPU_CACHE_Enable * 功能说明: 使能L1 Cache * 形 参: 无 * 返 回 值: 无 ********************************************************************************************************* */ static void CPU_CACHE_Enable(void) { /* 使能 I-Cache */ SCB_EnableICache(); /* 使能 D-Cache */ SCB_EnableDCache(); }
主功能:
主程序实现如下操作:
- 启动一个自动重装软件定时器,每100ms翻转一次LED2。
- 按下按键K1,串口打函数DSP_MatScale的输出数据。
- 按下按键K2,串口打函数DSP_MatMult的输出数据。
- 按下按键K3,串口打函数DSP_MatTrans的输出数据。
/* ********************************************************************************************************* * 函 数 名: main * 功能说明: c程序入口 * 形 参: 无 * 返 回 值: 错误代码(无需处理) ********************************************************************************************************* */ int main(void) { uint8_t ucKeyCode; /* 按键代码 */ bsp_Init(); /* 硬件初始化 */ PrintfLogo(); /* 打印例程信息到串口1 */ PrintfHelp(); /* 打印操作提示信息 */ bsp_StartAutoTimer(0, 100); /* 启动1个100ms的自动重装的定时器 */ /* 进入主程序循环体 */ while (1) { bsp_Idle(); /* 这个函数在bsp.c文件。用户可以修改这个函数实现CPU休眠和喂狗 */ /* 判断定时器超时时间 */ if (bsp_CheckTimer(0)) { /* 每隔100ms 进来一次 */ bsp_LedToggle(2); } ucKeyCode = bsp_GetKey(); /* 读取键值, 无键按下时返回 KEY_NONE = 0 */ if (ucKeyCode != KEY_NONE) { switch (ucKeyCode) { case KEY_DOWN_K1: /* 按下按键K1,串口打函数DSP_MatScale的输出数据 */ DSP_MatScale(); break; case KEY_DOWN_K2: /* 按下按键K2,串口打函数DSP_MatMult的输出数据 */ DSP_MatMult(); break; case KEY_DOWN_K3: /* 按下按键K3,串口打函数DSP_MatTrans的输出数据 */ DSP_MatTrans(); break; default: /* 其他的键值不处理 */ break; } } } }
22.8 总结
本期教程就跟大家讲这么多,有兴趣的可以深入研究下算法的具体实现。