• FPGA进阶:手撸神经网络


    进过了之前的基础学习,想必大家应该对verilog有了个比较清晰的认识

    那么接下来,我们就来撸个神经网络吧!


    首先来介绍一下该神经网络的规格:

    使用IEEE标准的32位浮点数运算

    网络大小为3*3*3

    激活函数使用relu

    神经网络为固定结构

    使用组合电路,这意味着只要输入一个数据就能瞬间出来结果

    所有的电路模块均为组合逻辑


    使用到的基本资源:

    浮点运算器,浮点乘法器,浮点加法器,激活函数运算器

    特别注意:所有的数据类型均为单精度浮点数


    首先是激活函数运算模块

    module Act_Func(
    	input[31:0] Xi,
    	output[31:0] Yo
    );
    
    assign Yo = Xi[31] ? 32'd0 : Xi;
    
    endmodule
    

    浮点运算单元:

    浮点运算单元比较复杂,这里不贴代码,

    FPU_ADD(a,b,y);
    FPU_MUL(a,b,y);
    

    人工神经元模块:

    
    module Neural(
    	input[3*32-1:0] Xi,
    	input[3*32-1:0] Ws,//权重
    	input[31:0]  B,//偏执
    	output[31:0] Yo
    );
    
    wire[31:0] o[2:0];
    
    FPU_MUL f1(Xi[0*32+32-1:0*32],Ws[0*32+32-1:0*32],o[0]);
    FPU_MUL f2(Xi[1*32+32-1:1*32],Ws[1*32+32-1:1*32],o[1]);
    FPU_MUL f3(Xi[2*32+32-1:2*32],Ws[2*32+32-1:2*32],o[2]);
    
    
    wire[31:0] t[1:0],f;
    FPU_ADD f4(o[0],o[1],t[0]);
    FPU_ADD f5(o[2],t[0],t[1]);
    FPU_ADD f6(B,t[1],f);
    Act_Func act(f,Yo);
    endmodule
    
    

    神经网络层:

    module Layer(
    	input[3*32-1:0] Xi,
    	input[3*3*32-1:0] Ws,	
    	input[3*32-1:0] Bs,
    	output[3*32-1:0] Yo
    );	
    
    Neural n1(Xi,Ws[0*3*32+3*32-1:0*3*32],Bs[0*32+32-1:0*32],Yo[0*32+32-1:0*32]);
    Neural n2(Xi,Ws[1*3*32+3*32-1:1*3*32],Bs[1*32+32-1:1*32],Yo[1*32+32-1:1*32]);
    Neural n3(Xi,Ws[2*3*32+3*32-1:2*3*32],Bs[2*32+32-1:2*32],Yo[2*32+32-1:2*32]);
    
    endmodule
    
    

    神经网络:

    //3*3*3的神经网络
    module NetWork(
    	input[3*32-1:0] Xi,
    	output[3*32-1:0] Yo 
    );
    
    
    reg[3*3*3*32-1:0] ws = 
    {
    32'h3DCCCCCC,32'h3DCCCCCC,32'h3DCCCCCC,
    32'h3DCCCCCC,32'h3DCCCCCC,32'h3DCCCCCC,
    32'h3DCCCCCC,32'h3DCCCCCC,32'h3DCCCCCC,
    32'h3DCCCCCC,32'h3DCCCCCC,32'h3DCCCCCC,
    32'h3DCCCCCC,32'h3DCCCCCC,32'h3DCCCCCC,
    32'h3DCCCCCC,32'h3DCCCCCC,32'h3DCCCCCC,
    32'h3DCCCCCC,32'h3DCCCCCC,32'h3DCCCCCC,
    32'h3DCCCCCC,32'h3DCCCCCC,32'h3DCCCCCC,
    32'h3DCCCCCC,32'h3DCCCCCC,32'h3DCCCCCC
    };
    
    reg[3*3*32-1:0] bs =
    {
    32'h3DCCCCCC,32'h3DCCCCCC,32'h3DCCCCCC,
    32'h3DCCCCCC,32'h3DCCCCCC,32'h3DCCCCCC,
    32'h3DCCCCCC,32'h3DCCCCCC,32'h3DCCCCCC
    };
    
    
    wire[3*32-1:0] cen[1:0];
    Layer l1(Xi,ws[0*3*3*32+3*3*32-1:0*3*3*32],bs[0*3*32+3*32-1:0*3*32],cen[0]);
    Layer l2(cen[0],ws[1*3*3*32+3*3*32-1:1*3*3*32],bs[1*3*32+3*32-1:1*3*32],cen[1]);
    Layer l3(cen[1],ws[2*3*3*32+3*3*32-1:2*3*3*32],bs[2*3*32+3*32-1:2*3*32],Yo);
    
    endmodule
    
    

    下面是仿真结果和电脑运行结果:
    1.png
    2.png

    嗯,输出结果完全一样

    嗯,看着是不是非常nb呢,由于使用了组合电路

    因此这个模块只要输入数据就能瞬间输出数据

    但由于是固定的,写死了的神经网络,所以它的搭建十分麻烦

    完整代码click me

  • 相关阅读:
    Qt Q3DScatter中元素的移动和旋转
    Qt QtDataVisualization Q3DScatter绘制散点图
    Qt qwtplot3d根据时间采集多条曲线
    Qt QWT3D 之 三维动态曲线的实现
    Qt 数据可视化之3D图形
    Vagrant在虚拟机Centos7上安装Docker
    VirtualBox+Vagrant环境搭建
    VMware安装Centos7超详细过程(图文)
    上传excel表格批量导入数据到数据库
    IP协议包头分析
  • 原文地址:https://www.cnblogs.com/prprpr/p/14878163.html
Copyright © 2020-2023  润新知