我的工程实践选题为《印章检测》,印章检测有多种方法,根据待检测的密章对象的不同特点,本项目的解决思路大体有4类:
1)利用模式识别的思想。可以利用opencv库来编码实现。这类思路可以检测出有明显边界的这类印章,
2)可以转化为基于深度学习目标检测的问题,此时目标就是待检测的密章。这类思路对非手写体的密章类,应该都有效。与第一种思路相比,检测范围更广,但是它依赖于大的训练数据集,所以训练数据集的生成式这类思路中非常重要的一个环节。
3)利用脱机的手写汉字识别的技术。这类思路针对 手写体的密章类有效
4)利用印刷体的OCR识别技术,这类思路针对 印刷体的印章有效,
手写汉字识别可广泛应用于拍照文档、支票、表单表格、证件、邮政信封、票据、手稿文书等光学字符识别(OCR)图像识别系统以及手写文字输入设备中。自从上个世纪80年代以来,手写汉字识别一直是模式识别的一个重要研究领域,得到了学术界的广泛研究和关注。由于要使用深度学习与神经网络来进行识别,用到的软件有anaconda3,tensorflow和keras等等。
1.这些软件的开发者是怎么说服你(陌⽣⼈)成为他们的⽤户的?他们的⽬标都是盈利么?他们的⽬标都是赚取⽤户的现⾦么?还是别的?
答:目前比较好的神经网络框架是tensorflow,由于其开源,因此得到了一大批用户;
这些软件开发者的目标可能是有盈利的成分在里面,但更多是供大家科研与学习,目前这些软件都是可以免费下载安装的,tensorflow与keras也都是开源的。
2.这些软件是如何到你⼿⾥的(邮购,下载,互相拷⻉、在线使用……)
网上自己搜索,资源在中国有镜像文件,清华大学开源软件镜像站,可以自行下载
3.这些软件有Bug 么?⼜是如何更新新版本的?
答:目前还没有发现Bug,可以通过anaconda下载最新版本
4.此类软件是什么时候开始出现的,同⼀类型的软件之间是如何竞争的? 发展趋势如何?
2015年11月,在DistBelief的基础上,谷歌大脑完成了对“第二代机器学习系统”TensorFlow的开发并对代码开源。TensorFlow在2017年2月15号发布了其1.0版本
DeepLearning4J
DeepLearning4J(DL4J)是基于Apache 2.0协议的分布式开源神经网络类库,它由Java和Scala实现。DL4J是SkyMind的Adam Gibson开发的,它是唯一的商品级深度学习网络,可以和Hadoop、Spark结合构建多用户多线程服务。DL4J是唯一使用Map-Reduce训练网络而使用其他类库进行大规模矩阵操作的框架。
5.列举你在使⽤上述软件时观察到的“特殊”现象,它们和硬件有什么不同?这些能说明软件的某些本质特性么?
tensorflow把python语言的优点体现的淋漓尽致,在tensorfllow中,你会觉得一切编程变得简单。
没有三维卷积,因此无法做视频识别;
6.你个⼈第⼀次⽤此类软件是什么时候,你当时是⼏年级,班主任叫什么?在哪⾥,什么状态,当时的软件是如何得到的(买的正版,盗版,下载?)
第一次用编程软件是在大1的程序设计,用的VC6 班主任是陈超亚,在合肥工业大学的教室里,老师发到群里的压缩包
7.你是如何精通这类软件的?它给你什么好处,坏处?
暂时没有精通,好处是可以让我效率更高,坏处 对眼睛不好
8.你现在还⽤它么,或者是同类软件的不同品牌,为何?
用,要完成工程实践才行。
9.这种软件再过10年,20年还会存在么,为什么?
我认为还会存在,第一背后有强大的团队--谷歌,第二他是目前最好用的框架之一,许多产品都是基于这个框架做的,已经形成了产业链。第三 他是与时俱进的,不断更新的。第四,他是开源的,开源是可以让他如此流行的一个重大原因。