单调神经网络《 Monotonic Networks》及代码实现

单调神经网络《 Monotonic Networks》及代码实现
在金融风控领域当中，模型可解释性相当重要。我对nips的论文《Monotonic Networks》当中的单调神经网络进行了复现，在权重为正的情况下，我们就称该神经网络为单调神经网络，因为不管如何进行输入，我们输出都会呈现出单调性，也就是输入越大，输出越大。或者输入越大，输出越小。传统的单调神经网络设计十分简单，而最简单的则是仅有一层全连接神经网络，且神经元的权重全部为正/负，这样就能够保证神经网络的单调性。同时，在论文《 Monotonic Networks》当中，提出了一种更为创新的办法，在神经网络能够保证所有的权重为正/负的情况下，同时能够实现模型更高的准确性。我们来看看他是怎么实现的。

1.论文概述

在这里展示了这样一个模型，我们将其称为单调网络。单调网络通过对超平面组进行最大和最小操作来实现分段线性曲面。通过约束超平面权重的符号来强制执行单调性约束。可以使用通常与其他模型（例如前馈神经网络）一起使用的基于梯度的优化方法来训练单调网络。 Armstrong (Armstrong et. al. 1996) 开发了一种称为自适应逻辑网络的模型，它能够强制执行单调性，并且似乎与这里介绍的方法有一些相似之处。然而，自适应逻辑网络只能通过商业软件包获得。训练算法是专有的，尚未在学术期刊上完全披露。因此，单调网络代表（据我们所知）在学术环境中呈现的第一个模型，该模型具有强制单调性的能力。

我们来看看这个神经网络的架构如何：

该单调网络具有前馈、三层（两个隐藏层）架构。第一层单元计算输入向量的不同线性组合。如果特定输入需要增加单调性，则连接到该输入的所有权重都被约束为正。类似地，连接到需要降低单调性的输入的权重被限制为负数。第一层单元被分成若干组（每组的单元数量不一定相同）。对应于每个组的是第二层单元，它计算组内所有第一层单元的最大值。最终输出单元计算所有组的最小值。该神经网络的设计图如下：

单调神经网络设计图

该神经网络第一层是我们的输入，第二层将我们输入放到一个全连接层当中，同时，分为3组（我们可以分为k组，看k的取值，怎样达到最好的模型识别准确率，你也可以尝试4，5，6......）。在这三组当中，我们分别找到每一组当中神经元输出最大的神经元，再将这些输出最大的3个神经元进行比较，将这3个神经元当中输出值最小的神经元作为我们的输出，最后通过sigmoid function，得到我们模型最好的输出。下面是该神经网络的数学表达式：

神经网络的第一层

在以上公式当中， $g_k(x)$ 表示第k组神经元的输出。如果我们分为了3组神经元，则k=3.

其中 $w^{(k,j)}$ 表示第k组神经元当中第j个神经元的权重大小。

而后面的 $t$ 则代表了偏执项。

假设我们令 $y$ 为模型最后的输出，则有公式：

如果我们面对的是一个分类问题，则可以将最后的输入放进sigmoid function，公式如下：

以上就是这个神经网络的整体实现。

2.代码实现

代码实现这一块我使用了pytorch来做的实现，神经网络架构可以编写如下：
```
import torch 
from torch import nn
class MNET(nn.Module):
    def __init__(self):
        super().__init__()
        self.layer_one = nn.Linear(32, 64) #将64个神经元，分为4组,每一组有16个神经元
        self.sigmoid = nn.Sigmoid()

    #forward这里就是神经网络的输入了
    def forward(self, input_x):
        length=len(input_x)
        input_x = self.layer_one(input_x)
    
        group_one=input_x[:,:,:16] #shape:[10,1,16],一共有16组神经元
        group_two=input_x[:,:,:32]
        group_three=input_x[:,:,:48]
        group_four=input_x[:,:,:64]
        
        #然后取每一个group当中，输出值最大的神经元

        max_one=self.find_max(group_one)
        max_two=self.find_max(group_two)
        max_three=self.find_max(group_three)
        max_four=self.find_max(group_four)
        
        #然后找到这4组数据的最小值.每一个数据，只选取4个数据当中的一个
        max_group=torch.cat((max_one,max_two),dim=1)#横着拼
        max_group=torch.cat((max_group,max_three),dim=1)
        max_group=torch.cat((max_group,max_four),dim=1)
        
        return self.find_mini(max_group)
        
        
    def find_max(self,group):
        #这个找最大，的确应该在每一个数据当中找最大，如果每次在喂进的所有数据当中找最大，还是不靠谱的
        max_ret=torch.max(group,dim=2)
        return max_ret.values
    
    def find_mini(self,group):
        mini_ret=torch.min(group,dim=1)
        return mini_ret.values.unsqueeze(-1)
```
由于在训练的过程当中，需要将所有的权重调整为正，因此需要如下代码调整权重的大小：
```
loss = criterion(out, var_y)
optimizer.zero_grad()
loss.backward()
optimizer.step()

for p in net.parameters():
    p.data.clamp_(0, 99)
```
好啦，今天的分享就到这里啦！如果有收获的话，不要忘了点赞和收藏呀！
相关阅读:
低代码能做什么？这家服务商用钉钉宜搭打造了智慧医院管理应用
 【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美
 如何做规划？分享2种思维和4个方法
 配置审计（Config）配合开启OSS防盗链功能
 被解救的代码
 物联网海量时序数据存储有哪些挑战？
Serverless：这真的是未来吗？（一）
数据库学习之MySQL进阶
 网页三剑客之CSS
网页三剑客之HTML
原文地址：https://www.cnblogs.com/geeksongs/p/15884172.html

单调神经网络《 Monotonic Networks》及代码实现

1.论文概述

2.代码实现