这次的读书笔记是关于《数学之美》,之前的软件需求分析还是不怎么能看的下去,还是数学之美更有意思一点。
数学之美这本书,由于我才读到第三章,还没有完全的理解其中的意思,其中包含着一些数学上的公式也不是特别能够理解,不过我想作者想要表达的应该是一种思想而不仅仅是具体的操作。
第一章,是关于数字和文字的。无论是数字还是文字,其实都是一种对信息的编码方式。这篇作者只是作为一个引子,真正的目的其实是在最后一段中——语言学的研究方式到底应该是什么?有两种方向,一种是语言,也就是从实际上的语料出发,从现实中的句子出发,从而探寻到语言的统计规律,得出现在对语言的处理办法。另一种是始终从规则出发,也就是语法出发,从而达到对信息进行统计的目的。事实证明,前者完胜,尤其是在如今数据量超级巨大的情况下。
在读书的时候,还是感触良多。书中提到贾里尼克的出发点是:“一个句子是否合理,就看它的可能性大小如何”。之后举了个例子,这里简化以下。例子如下:
原意:我吃东西了
原意偏差:我东西吃了
完全偏差:了东吃我西
也就是统计三个语句在所有的情况下出现的频率,从而得出正常情况下原意的意思。但是这里我其实还有个问题,就是如何区分语义的问题。可能观念不是一下就能转变过来,因为在上面的例子中,其实是可以看出,前两个的意思是不同的,而且在某种语境下是都可以成立的。因此这还涉及到那个问题,如何对语境进行区分呢?也就是说,人们可以将语音识别,人工智能这方面做的非常出色,但是总归达不到100%。是因为会有这个类似于这种语境的问题吗?
搞不懂,还是继续看后面的文章吧,说不定会有什么收获。