银行数据仓库体系实践（19）--数据应用之AI

银行数据仓库体系实践（19）--数据应用之AI

AI应用

    人工智能（Artificial Intelligence）是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。随着计算机性能以及深度神经网络技术的发展，大数据概念的普及，AI成了最近几年投资界和互联网的风口，ALPHAGO战胜了柯洁更是AI发展的一个里程碑，标志着在棋类运动中AI已经超越了人类。那AI技术在银行中有哪些应用呢？

（1）感知层

       在感知方面，AI技术已经比较成熟，接近甚至超越了人类的平均水平。在各行各业已经广泛运用。图像OCR技术成熟较早，在银行业务中已经很早运用、在银行柜面运营检查中，会通过图像识别技术将凭证的金额和客户签名进行识别，与凭证的业务流水进行自动核对。在线开银行二类户时，也会通过上传身份证照片以及银行卡来自动识别身份证号码和银行卡号。验证客户签名以及公司公章也是采用图像识别技术。

        语音识别几年前也已经成熟，目前各种方言都也能自动识别。出国直接用手机翻译软件就可以实时翻译。那在银行业务中，通过语音技术会监督电销人员进行电话销售时是否违规承诺收益，是否态度较差。另外一些机构也记录了客户的声纹，后续客户登录只需说话就自动识别到客户。

        人脸识别是近几年兴起的应用，目前火车站、机场都使用了人脸识别技术来自动识别乘客，减少了工作人员，在银行业务中，二类户远程开户、线上贷款等都会用到人脸识别进行客户身份认证。通过人脸识别和公安的身份证图片进行比对，超过一定阈值就会识别为是同一个人。同时为了防止欺诈，还会通过眨眼、转头、语音报数等进行活体检测。人脸识别技术的出现大大加速了线上业务的发展，后续技术完备成熟后，监管部门认可放开后，以后只需手机就能办理所有银行业务了。

（2）理解层

        在理解层面，主要通过自然语言技术来理解文字的含义，通过知识图谱来理解人、事、物之间的关系。这些技术近些年也有长足的进步，但还不尽完善。目前主要应用在不需要那么精确的场景中，如客服、智能音箱、客户引导等。

        那在银行中机器人客服在许多银行的官网和APP中也已经应用，主要用来回答用户提出的问题，同时也会根据关键字列出相关问题，如果客户不满意则会再引导到人工客服。从应用的情况来看，对于标准化且规则简单的银行产品基本能达到90%的客户服务率，只有10%的客户需要再引导到人工，大大减少了人工客服的工作量，但是对于复杂的业务以及综合的问题，则客户服务率就下降很多。但随着语料、问题的积累，以及技术的发展，后续机器人客服应该是逐步会取代人工客服。

        许多银行的网点中，会有一个移动的机器人进行业务的引导，并且陪客户聊天，介绍业务。体现了银行的高科技性，后续慢慢也会成为网点标配，减少了大堂经理的工作量。另外在有些银行的热线电话也已经取消了语音菜单引导，只需要说出想做的事就自动导航到了对应的语音服务中，提高了客户服务效率。

（3）决策层

        在决策层，人工智能技术应用也很广泛，比如在策略型游戏、量化投资、风险决策等方面已有广泛应用，但效果各有不同。

        2016年招行推出了“摩羯智投”引领了智能投顾，后续工行、江苏银行等都持续跟进，通过宏观市场、股票市场、基金等分析，根据客户的风险等级进行投资组合推荐，客户可以一键购买或换仓。但是国际风云变幻、金融市场瞬息万变，我国每年投资收益前10名的基金都不相同，智能投顾产品也并没有跑赢指数或者有明显高于平均的收益。正所谓“一顿操作猛如虎，不如推特看川普（Trump）”。因此对于不确定性的金融投资市场，智能投顾还有许多路要走。

        那在风险欺诈、信用模型评分方面，随着客户行为数据以及关联系统越来越多的被数字化以及互联网化。用户量上亿、模型变量从几十个已经变为上万个，因此有了机器学习以及AI技术的用武之地。特别在反欺诈方面，深度神经网络、XGBoost、GBDT等算法应用也越来越多，提高了欺诈识别率。

        那为什么在风险欺诈模型中比较有效，在智能投顾中效果不明显呢，我觉得可能有一个原因是智能投顾中变量有效性及权重的时效太短，每天国际时政、金融市场的消息太多，微观上还有许多未被披露的事项，比如内幕交易等，那对于变量的选定非常困难，即使历史数据拟合的很好，但是新的因素出现，以往的变量就不再有效了。在风险识别中变量的有效性较长，新的欺诈事件出来后也能迅速找到相关的变量，并增加到模型中，通过持续监控和不断的优化模型还是能保持较好的效果。随着AI的学习能力以及数据积累和新的算法出现，未来的AI能给我们带来更大的惊喜，也许那时市场上都是机器人来帮助客户进行投资和决策。

AI平台

       AI目前也是每个银行的重点应用方向之一，技术的突破会带来整个行业的格局变化，4G时代手机银行APP已经逐步取代网银和柜面，5G时代可能某个渠道就会取代手机。因此在AI技术方面除了关注技术发展，也需要探索通过AI技术应用到银行业务流程、分析决策过程中。因此搭建或引入AI平台是基础之一。那目前国内许多AI公司都在做AI平台，包括阿里、华为和腾讯云也都提供AI的云平台和SAAS服务。那AI平台主要功能有：

        （1）数据层：即需要对接数据仓库，将数据获取到AI平台进行分析和建模，AI平台目前大部分支持基于HADOOP进行机器学习和建模，且分析时会耗费较多机器资源，因此需要和数据仓库的生产批处理分开，将数据从数据仓库加载到AI平台上。

        （2）算法层：主要是支持主流的机器学习算法，包括深度神经网络、SVM等，也可以增加自我研发的新算法。那AI平台上的算法和一般和PYTHON、R的算法效果一样，但实现不同，因为AI平台需要支持分布式的HADOOP平台，支持超大数据量的计算和线性扩展。因此在算法的实现上更加复杂，对性能要求更高。

        同时在建模过程中，最大一部分精力在于数据的预处理，如缺失值处理、特征的筛选等。也需要提供常见的数据属性分析和预处理的处理方法，提高建模自动化程度。

        （3）感知、理解应用：即针对图像识别、语音识别、人脸识别、自然语言处理等感知和语言理解内置高效算法，通过数据训练可以达到较精准识别的效果。以便银行内部使用用来进行自有客户数据的识别。如发现本行凭证的OCR识别率下降，可以用最新的图像数据进行训练获得最新的模型参数，更新OCR识别算法。

        （4）模型管理和探索：这部分主要是建模方面的支持，主要有以下几点：

         1）模型的分类存储和管理，如按营销、风险等标签或分类进行存储，支持权限管理，同时也需要将测试数据集也进行存储，以便后续重新建模或进行优化；

         2）建模可视化，即通过拖拽的方式进行建模流程的作业调度和配置，并在执行时能显示各步骤的执行情况和输入输出。提高建模效率。

         3）AUTOML：自动建模，目前也是业界探索比较多的一个方面，即通过输入模型训练集和测试集，自动进行算法选择并对各算法结果进行测试集验证，选择训练集拟合较好且测试集表现良好的模型。

        4）内置成熟业务模型：如果有成熟的业务模型如风险欺诈、信用评分卡等，也可内置在AI平台中，银行人员可以基于内置行业模型进行优化，基于成熟方案提高建模速度和效果。

        （5）模型生产应用：指模型建立后的应用和监控，主要有：

        1）一键部署：通过定义输入和输出，需要能生成调用程序并自动部署到生产环境，提供模型服务。部署的环境及服务器可以进行指定。

         2）支持模型热部署：由于许多模型在使用时需要7*24小时，因此需要支持模型变更部署时不间断服务。

         3）模型效果监控，可以针对模型输出和预测的最终结果进行比对，进行模型有效率的统计，监控效果，同时也可以用最新的数据及结果每天进行模型参数调优，并自动热部署到生产环境。随着数据积累越多，则效果也会越来越好。

        AI平台和自助数据分析平台建议分开不同HADOOP集群。AI运算特别是GPU的运算资源消耗较大，因此需要避免竞争资源导致业务分析和AI性能不足。第一章节提到的数据湖中的非结构数据可以通过AI平台进行分析处理。

        AI是目前数据分析发展的重要方向，也是数据仓库数据价值挖掘的一个重要途径。随着分布式计算的发展，计算能力的增加以及5G时代的到来，AI的发展也将会出现百花齐放的格局，更多的AI应用也将丰富我们的生活。
相关阅读:
Mybatis-Plus select不列出全部字段
 git合并之 merge和rebase
git
springboot缓存开发
 关于Maven打包
 邮件发送模型及其Python应用实例
 Python 日志模块的定制
 python 解析 XML文件
 有限状态机FSM详解及其实现
 动态规划
原文地址：https://www.cnblogs.com/xiaojianblogs/p/13846537.html