• Caffe--solver.prototxt配置文件 参数设置及含义


    ####参数设置###################

    1. ####训练样本###

    总共:121368个
    batch_szie:256
    将所有样本处理完一次(称为一代,即epoch)需要:121368/256=475 次迭代才能完成
    所以这里将test_interval设置为475,即处理完一次所有的训练数据后,才去进行测试。所以这个数要大于等于475.
    如果想训练100代,则最大迭代次数为47500;


    2. ####测试样本###
    同理,如果有1000个测试样本,batch_size为25,那么需要40次才能完整的测试一次。 所以test_iter为40;这个数要大于等于40.

    3. ####学习率###
    学习率变化规律我们设置为随着迭代次数的增加,慢慢变低。总共迭代47500次,我们将变化5次,所以stepsize设置为47500/5=9500,即每迭代9500次,我们就降低一次学习率。


    ####参数含义#############

    net: "examples/AAA/train_val.prototxt"   #训练或者测试配置文件
    test_iter: 40   #完成一次测试需要的迭代次数
    test_interval: 475  #测试间隔
    base_lr: 0.01  #基础学习率
    lr_policy: "step"  #学习率变化规律
    gamma: 0.1  #学习率变化指数
    stepsize: 9500  #学习率变化频率
    display: 20  #屏幕显示间隔
    max_iter: 47500 #最大迭代次数
    momentum: 0.9 #动量
    weight_decay: 0.0005 #权重衰减
    snapshot: 5000 #保存模型间隔
    snapshot_prefix: "models/A1/caffenet_train" #保存模型的前缀
    solver_mode: GPU #是否使用GPU

    stepsize不能太小,如果太小会导致学习率再后来越来越小,达不到充分收敛的效果。

  • 相关阅读:
    202103226-1 编程作业
    阅读任务
    1 20210309-1 准备工作
    20210405-1 案例分析作业
    第一周作业
    20210309-2 阅读任务
    20210309-1 准备工作
    编程作业
    阅读任务
    准备工作
  • 原文地址:https://www.cnblogs.com/Allen-rg/p/5795867.html
Copyright © 2020-2023  润新知