• 6.1语句与公式-超级语言


    6数学与计算

    6.1语句与公式

    我们再来看数学化的领域语言。数学化领域语言的早期范本是牛顿的《自然哲学的数学原理》。在这本书里,牛顿大量使用了文字的叙述,定律往往是先给出命题语句的表述,在证明与求解时才回到数学,然而正如书名所示,本书实质是用数学描述经典物理学的规律,为此牛顿还发明了称为“流数术”的微积分。牛顿在本书的“原序”开始处写到:

    “古人在自然研究方面,把力学看得很重要,近人则抛弃了物性形式与潜在属性的理论以后,已开始将自然现象归宿到数学定理上。所以本书内,于物理学的范围中尽量将数学演出,看来是有意义的事”。

    牛顿把其理论组成了公理化的系统,书的前二章分别是“定义”与“公理或运动定律”。在“定义”这一章节他给出了所用概念的定义,它们是:质量、惯性、力、向心力等,另外附注里牛顿提到了时间与空间的定义,他认为这应该是人们熟知而可缺省的。在第二章节“公理或运动定律”里牛顿给出了他的三大运动定律,以今天的标准通常会加上万有引力定定律。

    简单对照基于文字的公理化系统,数学化的领域语言就是用a、b……x、y、+、-、等字母或抽象的运算符号替代了文本词汇,命题则由数学方程、函数、公式替代,然后是通过公式间的数学转换计算展开它的系统。

    在对数学化领域语言进一步探讨前,我们先论述一种符号应用的朴素理解。举例来说,当所表述的内容为复杂事件时,如果我们从事件A中识别出了N个组成部分,那么我们会用N个组成部分对应的语言符号来组合我们的表述,如果我们从事件B中识别出了M个组成部分,那么我们会应用M个组成部分对应的语言符号来组合我们的表述,这个我们可称为同现原理。同现原理在内容与表现形式间建立了一种映射,为理解提供了基础,如果你在对事件A的描述中只出现了(N-1)或(N-3)个组成部分的语言符号,绝对地说描述是不准确不完整的。这里的A与B可以理解为现实的事件,也可以理解为抽象的事件。

    设想M=N-1,且M个组成部分也是事件A中出现的组成部分,事件A与事件B的不同只是A在特定次序的某一位置上多出了一个组成部分,这时我们可以以二种方式组合事件A与B的描述,第一种方式是事件A与B表述中除了事件A的符号串在特定位置插入多出组成部分对应的语言单位外,其它的部分都是相同的,即去除这个多出的语言单位,二者完全相同。第二种方式事件A与B语言单位组合是不同于第一种组合的任意一种组合。显然我们要区别出事件A与事件B只相差一个对象,前一种描述可以带来更好的理解。当被表述事件间相近、相似、相反、部分相同部分不同等等时,可以合理地要求相同的事件有相同的表述,相似的事件有相似的整体表述,部分相同部分不同的事件,它们的表述也是对应着有部分符号相同,部分符号不同,我们可称这为同构原理。同构的原理在实现内容与描述形式点对点映射的基础上,还实现了一种结构上映射,用语言学家的用语来说就是:语言的表述具有像拟性。这就如一张地图形成与其所代表的区域的映射一样,做到了这一点,我们更容易从语言符号中理解出事物的原貌。你还可以设想事件A与B的组成部分都是同样的,只是其中的结构或某种次序不同,此时A与B用同样的语言单位来描述,同时这些语言单位在A与B表述中的排列方式或其它特征不同,正好对应了A与B事件结构或内部次序上的差异。

    地图与对应城市间的映射是种静态的映射,语言符号作为表述工具,面对的困难还在于:被描写的内容是变化的。事件A持续变化,出现连续的状态A1、A2、A3、A4、A5……,语言符号可以怎样去对应?其它情形如:事件A与事件C相互作用合成更大的事件;事件A的发展又引发事件D……,问题归纳来说就是:当被表述内容发展变化时,语言符号表述要保持与被表述事件的同构映射,语言符号必须能与内容协变,或者其它方式实现同样的效果。

    上述同现、同构、协变的说法只是个比喻,认识论上是不成立的。比如:正是因为我们已有事件组成成分与组成结构对应的语言单位与表述方式,我们才能这样识别事件;任何事件的表述不可能绝对完整,只有在简化的情况下,表述才能成为可能;涉及了结构与变化,就得先设定空间与时间的概念等等。这并不损坏比喻的价值。自然语言是否一定程度实现了这里的要求吗?或者说以不同方式达到了类似的效果?古往今来,有哲人说在语言里看到了世界的秩序,有的说语言逻辑地描写了事件,这些说法可能都过于乐观。

    较新的语言学理论中,有观点认为言语表达都是遵循“构式”进行的,构式是我们在言语中可识别出的结构体。持此观点的人还认为,下至词素,上至语篇,言语都是基于构式运行,在中间语句这一层次,构式相当于传统上所说的句型。构式语法理论强调一个结构体不仅仅是个形式,而是一个形式、语义、语用的结合。构式进一步分解为实体构式与图式构式,不可分解的结构体称为实体构式,如复合词、固定的短语;图式构式可理解为组合方式固定,组合成份可选的结构,如词组、语句所用的结构。一个结构体的表达,其意义来源于二个方面,一是各组成成份的语义,二是复合结构带来的语法语义。语法语义可以是标明时间、语态等,这种语义在如汉语这样的孤立语系中,也可以由特定的词汇来承担。语法语义还有一种语义加法的作用,它预设了一种整体的情景,将复合体中各个成份的语义融合成新的整体语义,这种新的整体语义不同于每一组成部分的语义。构式的理论成立,自然语言的计算机处理看似就容易得多。一门自然语言具体所用到构式是什么样:分多少层次,多少类型,构式的数量是什么数量级,基础的构式是哪些?目前这还缺乏总结,只能笼统地理解为:构式就是传统语法理论里讲述到的结构,加上习惯性的用法,并结合语义、语用扩展出的一些结构。

    在符号概念性应用的范围内,可以再缩小下讨论的内容。在这个方向语句的这一层次所应用的主要是陈述句,其它类型的语句如果用到也只是一种辅助的作用。一般的观点,英文里的陈述句用到了五种句型:

    主语+系动词+表语语句

    主语+谓语语句

    主语+谓语+宾语语句

    主语+谓语+间接宾语+直接宾语语句

    主语+谓语+宾语+宾语补足语语句。

    陈述句在逻辑里称为命题,按目前谓词逻辑理论,命题可归为更有限的形式:P(x)、或P(x、y),引入量词后,命题的形式会稍复杂些,如:∃ x:P(x)。

    自然语言的游戏,——包括了概念性的应用,是建立在三个基础上:

    一是内涵式的词汇。我们构造一个词汇,相对任意地赋予其所指。可以是“宇宙”这样包罗一切的,可以是“无”这样所指不存在的;可以是具体的一个专名,如“多莉”(第一头转基因羊),也可以是抽象的,如“美”、“正义”;可以相对单纯的一种属性的命名,如“红色”、“男”、“女”,也可以是综合性的对象命名,如“国家”、“领导”等;事物的间作用与关系、事物运动的过程我们也可命名词汇来表达,如“发育”、“碰撞”、“吸引”。自然语言里的词汇可能都没有一个固定语义边界,而是不断的延伸变化,不同的人产生不同的联想,关联着各自的经验。同一形式结构的二个表述里,只要有一个语言单位的语义上是有区别,意义上它们就是二个不同的表述。

    二是有限结构的应用。丰富无限的世界、迥然不同的事物、星球的运转、生物的生生不息、工厂里的律动、心理的喜怒哀乐、大到宇宙星空、小至一个尘埃,所有这些内容,自然语言里都是以有限的结构式来形成表达的。

    自然语言里的每一个语种,其中的构式是在其历史过程中塑造出的。那些基础的构式,如各语种中普遍存在的主谓句型与主谓宾句型,源于人类的日常生活情景,最初对人类的日常活动的描述,我们将其中的形式固化泛化,应用于其它性质不同的事件的描述。虽然这会残留着拟人化的影子,但人类心智容易明白里面的游戏规则,而不会产生理解困惑。

    三是构式组合的递归应用。这个不再重复。

    自然语言是用同样一些结构、不同的词汇、反复的组合来表述万千的内容。语言概念性应用中所需结构非常简单、有限,说明自然语言所具有的结构只是种表述结构,这种表述结构与被表征世界可能具有的结构、关系、变化没有什么关系。自然语言的表述依靠的是词汇对被表述内容形成多向度点对点的映射,像拟性应用只是技巧性层面的事情,而非语言的固有特性,协变则谈不上,实际内容上的任何变动,自然语言只是叠加一些语句来说明。同样地描述自然语言结构组合复合的语法规则,只是种表述规则,与被表述内容本身具有的规律没有什么关系。表述结构与规则的用途是创造线性空间上不同类型词汇有规则的语序差异,说语言结构预置了一种整体的情景,只是这种差异的约定性,其背后除去习惯性的心理外,没有更多的理据。从另一方面来说,自然语言这里表现出的特性,是其自由性的体现,这是自然语言作为最后的交流平台所需要的。

    数学应用于现实世界时,最终是通过计数与测量与领域内容关联起来。数学上的量会绑定现实中可计量的一类对象、或对象的一种属性、或其它可识别的某一要素或次序。量可绑定的实在,除了可计量外,并无其它限制。计数与测量是一种可操作的程序,对不同类型不同环境中量的计量需要发展出不同的计量技术,除了测量实施的的直接间接性差异外,原理都是相同的。应用上计量的主要问题是测量精度问题,计数除外,测量能得到的是某个精度下的值,而不会是绝对精确的值,在既定量度下不可测量的无理数,实用角度也是精度要求与确定逼近计算方法的问题。在量子世界的测不准,是从传统物理学角度来说,量子的测量与描述目前最好的方式是应用概率这种类型的量,当然物理学上这是有争论的。

    自然语言命名的概念多是关于质的,数学是关于量的。质与量并不是一种的对立,有质的地方,就有可感知的广延,广延指同一性质的感知在程度或顺序上的不同,感知可以是直接的,也可以是通过仪器间接得到的,应用中一个量就是标识一个或多个向度上的广延:长度、面积、角度、比例、速度、向量、频率等等。常识上我们知道速度这种量,把速度的变化识别为另一个量——加速度,就不是显而易见的事。量是普遍存在的,只是它可能被纷乱的现象掩盖,把客观对象、客观对象的某一属性、客观对象间的某种关系、或某种要素……识别为一种量,很多时候是科学的艺术。自然语言里的词汇,目前也在尝试描述为向量,以期让计算机可以处理。

    一块木块与一块钢板,其长都是2米,宽都是1.5米,高度上木块0.5米,钢板是1米,那它们的面积都是3平方米,体积分别是1.5立方米,3立方米。我们上面的讨论是没有说到木块与钢板的差异:木块与钢板是二种材质:木块没钢那么坚硬,容易变形的,可以燃烧的;钢板是坚硬,不会燃烧的。讨论木块与钢板的长、宽、高、面积、体积不用涉及质上的差异,由数量关系我们进入的是形式的世界。

    在“媒介系统的语言——语言媒介的选用”一节里我们说到:“这个结论反证地来说更有意义,如果我们能找到一种普适的关系关联符号的能指与其所指,我们将创造一种超级的语言”,数学正是这种超级语言。数学的应用于实际领域时,所有数或量符号的能指与所指,由且仅由计量一类方式关联起来,计量的方式可遵循统一的标准,这样不同的广延的量具有同样的质素,成为可以互通的存在,就如不同商品以货币计量后变得可交换一样,当然这个比喻背后的逻辑是倒过来的。

    (作者(LQS)注:连续地阅读会发现,系列的文章不是对各个问题的解释,而是新的理解视角)

  • 相关阅读:
    泛型的内部原理:类型擦除以及类型擦除带来的问题
    内部类访问局部变量的时候,为什么变量必须加上final修饰
    Web 测试经验总结
    故障测试
    智能硬件产品的测试经验总结
    web端测试和移动端测试的区别小记
    MVC模式介绍
    重定向与转发
    MySQL权限管理分配
    pt-heartbeat工具监控MySQL复制延迟
  • 原文地址:https://www.cnblogs.com/CHARACTER2/p/13048312.html
Copyright © 2020-2023  润新知