1.
在相当一段时间内,对很多学科有了渐渐的不满
比如自然语言处理,所谓的处理在一些环节上有着天然的瓶颈,语料库规模的增长并不一定能带来相应级别的质量提升
这些事实引导着我觉得:这活不是这么干的
比如解一个一元二次方程,大多数的题目用整数代入就能得到解,于是我们沿此思路展开:研究用哪些数代入的成功率更高,对曾经遇到的题建索引,研究根据参数优化代入范围,根据上次代入结果优化下次代入范围……
这些研究都会有成果,解题的成功率和效率都会有可以量化的提高。但问题是,这样做真的靠谱么
更严肃的问题是,即使这样不靠谱,都已经搞了这么多年了,积累了大量的学术成果和专家的供应链,这个庞杂的体系,该如何去撼动
对简单的偏好驱使着我去思考一种“大一统”的解决方案,借助程序自身的演化,达到足够解决问题的程度
不过这种儿童式的思考显然产出不多,概括起来仅有一个最基本的想法:按会达到最佳结果的方式行动
具体就涉及到:需要能够列出目前的选择,能够预测每种选择的结果,能够评价各种不同结果的好坏,逻辑能够自发进化
我有些意识到,预测、评价、进化将是问题的核心,但我束手无策,没有进一步展开和深入的能力
2.
周末在书店看到《人工智能的未来》,通读之后,醍醐灌顶
虽然其中部分观点我也曾想过,不过并没有这么深入,更不能辅之以生物学的知识和学术界的成果
大体上,书中的观点包括:
图灵实验误导了AI的研究方向,使大家专注于行为而不是理解;大脑不同区域的工作原理一致;各种感官没有本质的不同,都是以数据流的方式向神经元提供数据;神经元完全基于模式工作,根据输入匹配熟悉的模式,从而进行预测,当与预测不一致时通知上级神经元,达到“感觉到了xxx”的效果;神经元通过反馈修正自己的行为,这就是所谓的记忆,而最上级的神经元就是海马体,负责短期记忆
不得不说,这些内容给了我无可描述的启发,尤其是预测的本质就是进行模式匹配一点,使我有跨越性的进展。庆幸自己不是在几年之后才看到这本书
3.
虽然带着敬仰,但我不觉得这个框架已经完备。这只是一个“理解”的原型,而一个能够达到我们需要的“理解”机制还需要更多的东西。因为我们想要的系统并不只是能运转起来,还要能达到与人相提并论的功能
在很久之前,我曾经以为技术的方方面面应该都有着类似的摩尔定律,技术指标会随时间无止境地提升,比如显示设备的大小、精细程度、UI的酷炫程度。而在一年前与同事讨论时,才发现这种观点的问题:对于日常应用而言,当技术能够满足需求时,就不会有太多进一步提升的动力,当技术指标超出了人的感知能力时,继续提升完全没有意义。就比如24位色已经超出人能够感知的范围,所以再过10年,也不会升级为48位色。同样的例子包括:60Hz刷新率、Retina屏幕、100ms响应时间
与此相对的,是人能够忍受的下限,不过这方面貌似研究不多,典型的例子是网页打开速度的下限是8~12s。所有的评价指标,都是以人的标准定的
那么,与一个“智能”的机器,以自然的方式交互,人能忍受的下限是什么呢?
不管是什么,这个机器已经需要能够理解人创造出来的各种概念,按人的方式理解
这不仅意味着味觉、重力感应等输入是必须的,还意味着需要有对情绪、生理等概念的支持
4.
情绪等概念需要存在还有着另外的理由
对于每种选择,最会有最终的结果作为反馈,依此调整以后的行为模式
所以怎样算合适、怎样算不合适,需要有持续的目标做支撑
马斯洛的需求层次理论对人类的目标描述得很清晰
对于机器而言,也需要有类似的目标作为判断标准,不过目前供参考的,貌似仅有科幻界的机器人三大定律,离实际使用有些远,照搬马斯洛也不是很贴切。现实中,大部分行为的动因来自古脑,对于机器,也许这部分也同样是固化的
在这种机制成型的过程中,值得研究的领域很多,希望在其中能够不只是看客