3D Hand Shape and Pose from Images in the Wild

3D Hand Shape and Pose from Images in the Wild
目录
- 3D Hand Shape and Pose from Images in the Wild
  一. 论文简介
  二. 模块详解
  2.1 Encoder and Regression
  2.2 Projection and Mask
  2.3 Dataset
  三. 缺点
3D Hand Shape and Pose from Images in the Wild

一. 论文简介
从单张图像中恢复 2D keypoints + 3D keypoints + mesh + instrinsic(图像坐标系到像素坐标系) + mask，在数据量不充足的情况下进行弱监督。

主要做的贡献如下（可能之前有人已提出）：
1. Encoder and Regression
2. Projection and Mask
3. Dataset
二. 模块详解

2.1 Encoder and Regression
- 这部分都是通用的，2018年左右的论文用的很多，阉割版的End to end recovery of human shape and pose
- 千万注意的一点是s是缩放参数，R旋转参数，t是平移参数。弱相机模型：不使用小孔成像，直接使用正向投影。
- 弱相机模型：
- - 优点-可以直接从相机坐标系（root-relate）直接转化到图像坐标系进行监督。
- - 缺点：不知道focal length的情况下，直接强行拟合正向投影存在误差（无法避免，由于存在一个尺度）。
```
def forward(self, x):
       
        if (self.input_option):       
            x = self.conv11(x)
        else:
            x = self.conv1(x[:,0:3])
        x = self.bn1(x)
        x = self.relu(x)
        x = self.maxpool(x) 

        x = self.layer1(x)
        x = self.layer2(x)
        x = self.layer3(x)
        x = self.layer4(x)            

        x = self.avgpool(x)
        x = x.view(x.size(0), -1) 

        xs = self.fc(x)
        xs = xs + self.mean  

        scale = xs[:,0] # image space to pixel space
        trans = xs[:,1:3] 
        rot = xs[:,3:6] # 全局旋转（mano的旋视角）
        theta = xs[:,6:12] # 
        beta = xs[:,12:] 

        x3d = rot_pose_beta_to_mesh(rot,theta,beta)
        
        x = trans.unsqueeze(1) + scale.unsqueeze(1).unsqueeze(2) * x3d[:,:,:2] 
        x = x.view(x.size(0),-1)      
              
        #x3d = scale.unsqueeze(1).unsqueeze(2) * x3d
        #x3d[:,:,:2]  = trans.unsqueeze(1) + x3d[:,:,:2] 
        
        return x, x3d
```
2.2 Projection and Mask
- 针对数据没有mesh的情况（有mesh直接使用3D数据即可，比mask更准）进行的弱监督
- 没有具体看GrabCut后端，原理就是投影点距离mask的区域，在mask内部为1，外部为0（或者越近越大，越远到0）
2.3 Dataset
- 文中的pretrained来自于自己构建的数据集，颜色参数来自Meshlab，mesh模型来自MANO，渲染来自Opendr。
- 注意的还是2.1节提到的，建立的是图像坐标系mesh，而不是相机坐标系
pytorch代码

三. 缺点
- 实际中mask无法准确获取，关键点到mask在边缘不准确。
- 直接学习内参有点困难，之前的论文都是iteration，这里没有使用。
相关阅读:
win下的PG12安装plpython3u
IDEA中的代码块批量修改
 Python的32和64位共存在win
数据库表转化为model
国标查询
 C#DataGridview 绑定与数据转化
 fastadmin 点击checkbox 或反选checkbox 统计某个字段的值
 [Mysql] 两段提交
 Windows docker环境安装
 vue2使用echarts内置地图实现点击事件
原文地址：https://www.cnblogs.com/wjy-lulu/p/13186619.html

3D Hand Shape and Pose from Images in the Wild

3D Hand Shape and Pose from Images in the Wild

一. 论文简介

二. 模块详解

2.1 Encoder and Regression

2.2 Projection and Mask

2.3 Dataset

三. 缺点