一、灵感来源
非常感谢这位楼主,在对于防疫课堂观后感的需求之下,做出了防疫大课堂观后感生成器 。对于被学校强迫几乎天天写这种观后感的我们可谓是救命稻草,点击链接立马随机为你生成了一份观后感,长度均为3段,每段字数从短到长50到500不等。如下图所示,是随机生成的878字观后感,后面还配上了大课堂的一张截图。
看起来不错吧,这些没有营养,没有价值的话为什么就这么好用呢?能骗过学校和老师的要求,为我们节省大量时间。
然而仔细看看,所有生成的观后感都是三段,而且任意两段之间没有任何联系,前一段说预防病毒的方式,后一段就跑到某个英雄人物上,基本上关联度很低,而且多生成几次后发现有些段落是一模一样的。由此可以推断出,观后感背后的整合方式不过是在巨大的语料库中随机选取三段并进行随机组合(可能排除掉了部分读不通的组合)。如果有严格的查重审查器,当然是骗不过它的。
但是,如果观后感不是以一段为单位,而是以一句为单位呢?如果生成的结果并不是语料库的随机组合,而是神经网络模型通过巨大语料库训练并生成的句段呢?句与句间会不会出现更强的逻辑关系,会不会写下这一个自动生成器后就一劳永逸了呢?
在此基础上,如果随机生成时按主题进行的,最典型的是运动会的加油稿,再比如说是入党申请书,以及党校教育要求的感想、重大集会上领导催眠式的讲话、感动中国十大人物的感想……我们发现这种自动生成器在各种场合下都能有所作用。
除此之外,我们去年项目通过RNN自动生成音乐是不是跟这个很相关呢?不仅生成语句,还能随机生成音乐,甚至是随机组合元素生成图片!
虽然随机生成出来的结果基本上是肯定不能和人本身创作出来的文字、音乐、摄影相媲美,但是往往我们需要的不是最精美的东西,我们需要的是逃避,在“写感想”上节省一些时间以更好地投入其他工作至上。并且同时,我们也会在随机生成的产物上得到灵感,用以创作。
正如Less is More
,Copy to Create
正是我想说的,而且本来在大多数情况下,创造本身就来源于复制,复制他人创造的元素,复制生活中随处可见的元素。并且进行元素上的改造、随机组合,最后生成的属于自己的独特产物。
二、模块
1. 语料生成器
需求:
- 大致的构想是按主题分类。包含一些常用的主题:观后感、加油稿、申请书、情书、作文等,在大分类下还有具体的小分类,表示具体场景。
- 用户点击具体分类之后可以指定需要生成段落的字数,从100到1000不等,默认500字。
- 在生成文字的旁边,可以同时附上与主题相关的图片。
实现方法:
- 原始方法:在网络上收集大量语料库,并进行标签分类,用户选择某个主题后,进行预料的随机选取和整合,可以以段为单位。
- 神经网络:通过RNN训练出一个自动生成模型。能生成不重复地,而有一定语义上逻辑关联的句段。参考唯美句子生成器。
- 附加图片:事先可以准备好大量按主题分类的图片。
2. 音乐生成器
需求:
- 用户可以点击一种音乐分类:宁静的、细腻的、欢快的、深沉的、朴素的、华丽的;抑或是按照风格进行分类:巴洛克的、古典的、浪漫的、印象的、流行的、摇滚的等等。
- 用户可以指定音乐生成的长度,从10s到60s不等,默认30s
实现方法:
- 基本上按照吴恩达老师深度学习课程的小项目来就行,网上有详细的描述:使用LSTM神经网络进行音乐合成
- 但是需要注意的是,我们选择不同的主题的音乐对模型进行训练,可以从情感上分类,也可以从风格上、情景上把音乐分为几类分别对模型进行训练。
3. 图像生成器
需求:
- 用户可以从元素集合中选择一系列不互斥的元素(比如:猫+草地+午后),最后生成一张图片,包含所有选中的元素,元素之间的组合方式也需要考虑如何最美观。
- 支持小分类,比如猫有黑猫、白猫、花斑猫等。
- 生成的元素在图像中最好支持平移、缩放、旋转、拉伸操作,保证实时可交互性。
实现方法:
- 原始方法:在网络上寻找大量素材,进行标签分类,用户选择某个主题后,进行素材的随机组合,与语料生成器类似。
- 神经网络:史上最强GAN图像生成器,具有更强的随机性。单一元素都采用GAN生成的方式,保证任意两张图不会出现一模一样的元素。
三、扩展
以下扩展部分属于扩展部分,未来可能实现。
1. 自动爬虫
如果不仅支持随机生成,更可以在网络上不停下载新鲜材料更新数据库就更好了。每天网络上都会传入大量数据,如果有一种自行爬取网页,并且对元素进行分类的自动化程序在后台运作,就可以保证网站持续不断的新鲜性和维护性。
2. 轻量化
当然网页本身是不分平台的,在手机端、电脑端,任何一个操作系统下都能稳定登陆。这也正是理想情况了,即所有用户只需要点击一个链接,就立马进入了一个网页,不需要多大开销。此软件的目的正是希望用户在任意场合下都能使用。
3. 知识图谱
像百度的搜索一样,输入关键词,点击搜索就立马弹出相应的网页、图片。随机生成器中可以根据用户的需要提供输入搜索框,自动生成需要的对象。而不是固定几个选项。
4. 功能集成
对于音乐的扒谱功能和图像的抠图功能可以集成如随机生成器其中,让用户上传的元素作为生成的材料。