• [论文笔记] Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment


    Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment

    简介

    本文提出了一种网络结构,不是利用分类和回归loss加权求和,提出对数据集进行裁剪来提高准确率的方法,在很多数据集上取得了SOTA。

    网络结构

    从图可以看出,使用的是resnet50作为backbone,然后接6个全连接,fc1就是回归,fc181就是看成分类问题,-90到90共181个值作为分类来看。然后梯度回传的时候分配一个权重,原文代码里回归的权重是0.1,而分类的权重是2000,所以这个还是希望分类的loss来导向回归,因为最终我们要用的还是回归,而不是直接用分类的结果作为输出结果的。因为角度分布还是连续的而不是离散的。我们将其看成离散问题是因为我们采集的时候是离散采集的,而输出必须是连续的,这样才符合实际。

    crop数据集

    对数据集进行crop也是本文的一大贡献,文章探索了不同crop比例下对结果的影响,具体的影响可以看下图。

    为什么要裁剪呢?因为背景对结果的影响很大,同样一张图片换用不同的背景,预测的结果是不一样的,为了解决这个问题,就需要找到一个最合适的裁剪比例,所以就引出了这个方法,通过测试不同的裁剪比例,找到一个合适的K,在测试集上的准确率最高。所以本文的工作其实也是很有启发的,就是通过改变裁剪的比例来增强数据集。我认为在这个启发下其实还可以通过更换背景来扩充数据集,所以我们最近在做的工作就是与这个相关的。

    实验和结论

    这张图表明在BIWI数据集下本文的方法SOTA了,但是对比的方法其实还是很少的,这是2019年5月的文章,理应多比较一些方法,所以其实说服力欠缺。

    这个就是作者做了很多组K的实验确定的结果,结论就是0.5就是最好的K值。

  • 相关阅读:
    用工具爬虎牙星秀VS用代码
    mysql简单的操作
    MySQL5.1的安装过程
    MySQL的安装
    SQL server 2008 的安装
    数据库基础知识
    HTTP协议
    TCP协议
    web系统基础
    软件测试缺陷的定义、产生原因、缺陷报告格式、缺陷报告
  • 原文地址:https://www.cnblogs.com/aoru45/p/11186641.html
Copyright © 2020-2023  润新知