我理解的高等代数——1从方格纸到线性空间
前几天,看到了b站上这个视频,他使用可视化,直观的角度来帮助我们对线性代数建立了更加直觉的感知。我在观看视频的时候,突然发现有一些想法是我之前学习的时候的想法。但是在学习的时候并没有记录下来笔记,有些遗憾。
大家知道,对于课程,刚开始学习去理解的角度和学完课程之后理解的角度是不一样的,学生的角度和老师的角度也是不一样的。所以,为什么这就是为什么很多博客从小白角度出发更能够得到大多数人的认同和感触。因为大家遇到了同样的困惑和问题。小白的角度不一样对,但是更符合同为小白的人的处境。
我尝试从学完线性代数的新小白来重新理解线代。希望能够梳理一下,也希望能够给大家一个角度。抛砖引玉,给大家带来一些思考。
视频中说理解线性代数可以有数学,物理,计算机三个角度。我的物理很一般,就是高中物理的水平,所以我也就从生活中的概念,数学和计算机的角度来进行阐述。
从空间说起
我觉得线性代数最核心的观念是空间的观念。
其实空间,我们生活中已经很熟悉了。我们就生活在三维空间之中,一张纸就是一个二维的平面,我们也可以叫做二维空间。我们在二维空间中还可以建立坐标系,给出某一点的坐标。这是我们小学就学过的知识,我们也一直在用。
画在方格上的空间
但,等等,我们能不能对已经司空见惯的空间提出一些问题呢?我始终相信,提出一个问题远远比解决一个问题更重要,答案就在问题之中。
首先我们不妨以我们熟悉的二维空间为例。
来看看我们已经学过小学的知识
从小学说起
人教社小学数学一年级下册《位置》
教学目标:认识上、下、前、后、左、右六个方位,并能用这六个方位确定位置,描述简单的位置关系
人教社小学数学三年级下册《位置与方向》
认识了东、南、西、北和东南、西南、东北、西北八个方向,并能用这些词语描述物体的方向
人教社小学数学五年级 《位置》
用数对表示具体情境中物体的位置 ;在方格纸上用数对确定物体的位置 。
人教社小学数学六年级上册 《位置与方向(二)》
根据方向和距离两个条件确定物体的位置,并描述简单的路线图
我们小学五年级就学过在方格纸上用数对能够确定物体的位置;在高中物理中,我们知道矢量也可以用数对来表示,并可以在二维平面中画出来。
但是有一个问题,不知道大家发现没有?那就是我们的空间是在方格纸上的。或者说我们的二维空间就是方格子的。
大家或许会说,这能有什么问题?但是大家在看世界地图的时候有没有发现,世界地图的样子并完全不是方格子的?这是为什么呢?这个问题我不解释,只是想要启发一下大家,很多司空见惯的事情背后也存在很多问题。
坐标系的确立
好吧,让我们继续这个问题,首先我们已经观察到并习惯于划在方格子上的空间。那我们就现在这种情形下,来展开讨论。
在数学中,我们总可以通过建立坐标系来确定位置的坐标。当然了,如果是在一维平面,那就是坐标轴。
在确立坐标系,我们需要考虑三个问题,分别是,原点的选取,方向的确立和单位距离\(1\)的确定。
如果我们选取的不同的原点和方向以及单位距离1,那么我们对物体的描述将会截然不同。
那么在这里,大家会不会产生一个问题,不同的坐标系的选取会带来什么影响?不同的坐标系选取又存在什么联系呢?很好,恭喜同学又提出了一个问题。
大家应该都能够理解原点和方向会对坐标系的确立产生影响,但是对于单位距离\(1\)是怎么理解的呢?这就好比,小红把一km作为一个单位距离,而小明把一英里作为一个单位距离,那么在即使坐标系原点和方向完全一致,那么他们对同一物体的描述结果也是不一样的。这里的不一样是值数值不一样,但是两者描述的事物却是相同的。这也就是在地图时,我们要关注比例尺的原因。
比如你说“苹果”,mike说‘apple’,从语言上来说,这是两个不同的东西,但其实描述的是同一物体
同样的,这里的单位距离\(1\),并不只代表物理上可以测量的量度。它可以代表任何东西,但在数值上他就是单位一。
插一嘴,数学的本质就是抽象。
我们从数字就可以看出。一个人可以用1表示,一朵花也可以用1表示,一双筷子可以用1表示,一群鱼也可以用1表示。1它什么也不是,它又什么都是。
单位一也是同样,它可以代表距离,也可以表示其他任何事物。
物体的描述——参照系
好了,我们现在已经有了两个假设
- 空间是画在方格纸上面的
- 我们自己已经选择了原点,坐标系,和单位距离\(1\),确立了一个坐标系。
那么我们就在这两个假设下,继续我们的探索。
我们小学刚开始学习的是物体的位置关系,是使用“前后左右上下”六个方位来描述物体的,这种表述是在三维空间中的表述。而在二维平面上,实际上是在地图中我们是用“东西南北,以及这四个方向之间的东南,东北,西南,西北来描述位置。
值得注意的的是,我们在使用这些词语的时候来描述一个物体都需要一个参照物,而通常我们默认是拿自己作为参照物的。
这也就是为什么广东人把广东以北的地方都叫做北方的原因吧。
遐想一下,这么说来,每个人看待世界都是以自己本身作为参照系,那么每个人眼中的世界是不是不一样的呢?
在二维平面我们通常由x,y轴来确定,把原点作为参照物。把x,y的箭头的方向称之为正方向,另一端称之为负方向,在负方向上的向量,我们在向量前添加一个横线来进行表示。
有序数对,坐标,向量
在给定坐标系之后,我们就能够通过一个有序数对来描述一个物体在坐标上的位置。同样的思路,那我们就能使用有序数对来描述二维平面上每一个点的坐标。值得注意的是,这里的数对是有序的,我们默认是横坐标在前,纵坐标在后。
同样的,我们也可以把这样的一个有序数对,写成一个向量的形式,用向量来表示坐标。那么在这种情形下,向量里的元素自然就不能交换位置了,因为他们代表的含义不同。
当然了,对于向量这个概念也有不同的理解。
在物理中,我们使用向量表示一个矢量,也就是一个带着箭头,长度的线段,在物理中,这个矢量是可以随意移动的,但是在数学中,我们一般把它的出发点固定在原点坐标上面。第一个数代表沿着x轴方向走多远,正数代表向右移动(也就是x轴正方向),负数代表向左移动(也就是x轴负方向);第二个数表示沿着平行y轴走多远,正数代表向上移动(也就是y轴正方向),负数代表向下移动(也就是y轴负方向)。
这样我们就得到了整个空间中的所有矢量,每一个矢量都可以用一个向量(数对)表示。同时我们发现每一个矢量的末端指向一个点,每一个点刚好也唯一对应一个矢量。这样我们就得到了
一一对应的关系。
为了区别向量和数对,我们通常会把向量写成一列,但这并不影响其含义。
这里的上标\(^T\)的含义就是把这个向量放倒,可以看到在向量里面的元素的前后顺序没有变化。
在计算机中,向量,可以看成允许重复的有序的物体的一个组合,也就是列表。如果向量只表示数字的话,那就是数组。值得注意的是这里面的限定词,允许重复出现,有序。
于是我们就得到了
当给出一个数字列表,我们就能在空间中将其可视化;当给定一个点,我们可以得到它的坐标;
(这里面当然包含隐藏的假设,即空间与坐标系)
基向量
在二维空间中,我们可以选择一组基向量,通常是选取从原点出发,方向分别为x,y轴方向,单位长度为1的向量作为基向量,分别记为\(i,j\)。因为这两个向量长度为单位\(1\),所以称之为单位基向量。
或者记为\(\hat{i},\hat{j}\)但这只是记号的区别。
当然我们也可以选择其他的基向量,但这两个向量能够成为二维空间的基向量的条件是,能够通过它们的线性组合生成二维空间中所有的向量。
这里我们提到了线性组合,线性组合的含义就是这两个向量的相加和数乘。这一点,我会在接下来的部分介绍。
同样的我们提到是有两个向量,这是因为我们现在是在二维空间中讨论的。如果是在三维空间中,那么一组基向量就包含三个向量。扩展到n维空间,一组基向量就需要有n个向量。
好,那么既然我们可以选择不同的基向量,那么我们自然会有疑问,不同的基向量会带来哪些不同?很好,我们又提出了一个问题。
我们注意到,我们基向量选取的\(i,j\)是从原点出发,方向分别为x,y轴方向,单位长度为1的向量。实际上如果选定不同的基向量,我们自然也就有了一个 不同的坐标系。反过来,当我们选定了不同的坐标系,自然也就有了不同的基向量。所以基向量的确定和坐标系的确定是一致的。
当我们确定基向量之后,我们可以从基向量的角度来理解向量。
对于向量\([2,3]\)来说,其含义为\(2 \times i , 3\times j\),也就是说,方向是由基向量\(i,j\)决定的,表示在基向量\(i\)方向上运动长度为单位\(1\)的两倍,再往基向量\(j\)方向运动长度为单位\(1\)的三倍所得到的那个向量。
也可以说是把\(i\)拉伸为原来的2倍,把\(j\)拉伸为原来的3倍,这两个经过缩放的向量的和就是我们的向量\([2,3]\)
向量的相加和数乘
我们考虑物理意义,向量的相加是很自然的,
我们可以从物理中运动的角度理解,向量表示一种特定的运动,即在空间中朝着某一方向迈出一定距离,如果先沿着第一个向量运动, 然后再按着第二个向量所描述的运动方式运动,总体效果与你沿着这两个向量的和运动无异
也可以看做是数轴上加法的扩展
向右移动两步,在向右移动5步,总体效果与向右移动7步无异
我们还可以从基向量的角度理解,
例如 \((1,2)+(3,4)=(1+3,2+4)=(4,6)\), 先往x轴正向移动1个单位,y轴正向移动2个单位,然后再往x轴正向移动3个单位,y轴正向移动4个单位 ,
我们不妨在将其移动在两个方向上统一起来,让我们先完成所有的水平运动,再完成所有的竖直运动
那就是往x轴正向移动1+3个单位,y轴正向移动2+4个单位,
\((1,2)+(3,4)=(1\times i,2\times j)+(3\times i,4 \times j)=(1+3)\times i , (2+4)\times j =4\times i , 6 \times j=(4,6)\)
\[\overrightarrow{ \left[ \begin {array}{1} 1 \\ 2 \end{array} \right ]} + \overrightarrow{ \left[ \begin {array}{1} 3 \\ 4 \end{array} \right ] }= \left[ \begin {array}{1} 1 \times \overrightarrow{i} \\ 2 \times \overrightarrow{j} \end{array} \right ] + \left[ \begin {array}{1} 3 \times \overrightarrow{i} \\ 4 \times \overrightarrow{j} \end{array} \right ] = (\left[ \begin {array}{1} 1 \\ 2 \end{array} \right ] + \left[ \begin {array}{1} 3 \\ 4 \end{array} \right ]) \overrightarrow{ \left[ \begin {array}{1} i \\ j \end{array} \right ]} = \left[ \begin {array}{1} 4 \\ 6 \end{array} \right ] \overrightarrow{ \left[ \begin {array}{1} i \\ j \end{array} \right ]} = \left[ \begin {array}{1} 4 \overrightarrow{i} \\ 6 \overrightarrow{j} \end{array} \right ] = \overrightarrow{ \left[ \begin {array}{1} 4 \\ 6 \end{array} \right ]} \]如果是负号,那就表示往相反方向移动,即\((1,2)-(3,4)=(1,2)+(-3,-4)=(1+(-3),2+(-4))=(-2,-2)\)
我们还可以单纯的从向量是数字列表的观点出发
向量加法就是对应项相加,向量的第一项和第一项相加,第二项和第二项相加
向量的数乘,就是保持方向不变,向量长度变为原来向量长度的k倍。
如果乘以一个负数,那么表示首先向量反向,然后长度再变为原来的k倍 , 或者说,先将向量变为原来的k倍,然后在将其反向 ,其实这两个动作是同时发生的,最终结果是一样的
在几何上这种方向不变,长度伸缩的变换称之为缩放,我们选择的数字,它们用来刻画向量(矢量)缩放的程度,称之为标量。
从基向量的理解,就只是数值相乘,方向和单位长度依然是由单位基向量\(i,j\)决定。换而言之就是改变了原来的向量对单位基向量的缩放比例。
\[3 \times \overrightarrow{ \left[ \begin {array}{1} 1 \\ 2 \end{array} \right ]} = 3 \cdot \left[ \begin {array}{1} 1 \ \overrightarrow{i} \\ 2 \ \overrightarrow{j} \end{array} \right ] = 3 \cdot \left[ \begin {array}{1} 1 \\ 2 \end{array} \right ] \overrightarrow{ \left[ \begin {array}{1} i \\ j \end{array} \right ]} = \left[ \begin {array}{1} 3 \times1 \\ 3 \times 2 \end{array} \right ] \overrightarrow{ \left[ \begin {array}{1} i \\ j \end{array} \right ]} =\left[ \begin {array}{1} 3 \\ 6 \end{array} \right ] \overrightarrow{ \left[ \begin {array}{1} i \\ j \end{array} \right ]} = \left[ \begin {array}{1} 3 \ \overrightarrow{i} \\ 6 \ \overrightarrow{j} \end{array} \right ] = \overrightarrow{ \left[ \begin {array}{1} 3 \\ 6 \end{array} \right ]} \]
从数字列表理解时,向量与标量相乘就是将向量中的每一个分量与标量相乘
于是我们又有了
也就是说,当我们讨论向量的时候,其实我们总是已经预设一组基向量,也就是预设了一个特定的空间与坐标系。
这时候我们就有
在这一系列可以相互转化的概念中,基向量是最核心的概念,正是由于基向量,我们给我们搭建了从空间到数字的桥梁。
在向量的加法中还有一个值得讨论的是问题,也就是一些需要特别注意的元素,比如零向量。显然零向量就是从原点出发指向原点的向量,也就代表原点这个点。
零元素是加法的单位元:也就是一个向量加上零向量还是它的本身。
此外有了零向量,
这里\(\overrightarrow{a}\), $ \overrightarrow{b}\(互为逆元 ,我们可以把\)\overrightarrow{b}\(记作\) - \ \overrightarrow{a}$ ,也可以把\(\overrightarrow{a}\)记作 $ - \overrightarrow{b}$,这里的 $ \overrightarrow{b}$和 $ \overrightarrow{a}$的对应关系是唯一的。
或者称\(\overrightarrow{a}\)为 \(\overrightarrow{b}\)的负元素
我们就可以定义向量加法的逆运算,减法: \(\alpha-\beta=\alpha+(-\beta)\) 。其含义为,往原点某一个方向前进一定距离,然后在反向前进同样的距离,就回到了原点。
这里需要注意的是,我们不经意地使用了“零元素,单位元,逆运算,逆元”的概念,但是这并没有影响到我们的直观理解。
此外,对于向量的加法,我们能够得到向量运算的
-
交换律 \(\overrightarrow{a}+ \overrightarrow{b} = \overrightarrow{b}+\overrightarrow{a}\)
-
结合律\((\overrightarrow{a}+\overrightarrow{b})+\overrightarrow{c}= \overrightarrow{a}+(\overrightarrow{b}+\overrightarrow{c})\)
-
消去律 $\overrightarrow{a}+\overrightarrow{b} = \overrightarrow{a}+\overrightarrow{c} ,\text{则}\overrightarrow{b}=\overrightarrow{c} $
同样的,在向量的数乘中,我们有基于数(标量)的相关运算规则
- \(k(l \ \overrightarrow{a }) = (kl)\overrightarrow{a}\)
数量乘法与加法满足下面两条规则
- \((k+l)\overrightarrow{a }=k\overrightarrow{a }+l\overrightarrow{a }\)
- \(k(\overrightarrow{a }+\overrightarrow{b })=k\overrightarrow{a }+k\overrightarrow{b}\)
上面这两条规则有着很清晰的几何表达。
线性组合与线性相关
好了,让我们尝试回答我们之前的问题,:如果我们选择不同的基向量会怎么样?
让我们任选两个向量\(\overrightarrow{v},\overrightarrow{w}\),然后通过改变缩放的比例\(a,b\),得到不同的线性组合
那么,通过改变\(a,b\),我们能够得到哪些二维向量?
通常的答案是可以得到所有的二维向量,为什么呢?
我们,可以这么做,我们不妨先固定住一个基向量,然后改变另一个向量的长度,这样他们组合就能画出一条线;然后再改变固定的基向量,就又得到了另一条线,不断重复,我们就得到了整个平面。
但是也有其他的情况
- 两个向量都是零向量,那么最终只能得到零向量
- 当一个向量是零向量的时候,我们只能得到由另一个非零向量缩放形成的直线
- 如果两个非零向量是共线的,那么最终我们也只能得到一条直线
当这两个向量能够形成整个二维空间时,我们称之为线性无关;否则我们称这两个向量是线性相关的;
在这里这两个向量能够得到的结果我们称之为这两个向量能够张成的空间
我们看到,倒数第二种有一个是零向量的时候和最后一种能够形成的结果是一致的,那我们也就可以理解我,最后一种情形下,有一个是不需要的,实际上起作用的只有一个向量
然后我们继续扩展这个概念 ,
首先,我们来看一下在三维情况下 ,我们任选三个向量 ,都是非零向量,这三个向量又能形成什么结果呢
- 三维空间中的所有向量,或者说能够组成整个三维空间
- 三维空间中的一个二维平面,这时候只有两个向量起作用了
- 三维空间中的一条直线,这时候只有一个向量起作用了
- 三个都是零向量,只能得到零向量
第一种情形,我们称之为这三个向量是线性无关的 ;剩下的情形是线性相关的
我们可以继续推广到n个向量的情形下,我们就得到了线性相关和线性无关的一个定义。
那就是,n个向量如果能够张成n维空间,那么就称这n个向量是线性无关的。否则就是线性相关的。
此外,对于线性无关,我们还有另一种表述,线性表出。它讲的是什么呢?
当我们有三个向量\(\overrightarrow{v},\overrightarrow{w},\overrightarrow{s}\),他们只能形成一个二维平面的时候。那么就意味着有一个向量\(\overrightarrow{s}\)没有发挥作用,原因是这个向量\(\overrightarrow{s}\)是落到了另外两个向量\(\overrightarrow{v},\overrightarrow{w}\)所形成的平面中。那么也就是说,这个没发挥作用的向量\(\overrightarrow{s}\)也可以被另外两个向量通过线性组合的形式表示出来即\(\overrightarrow{s}=a\overrightarrow{v}+b\overrightarrow{w}\)
如果一组向量中存在这种其中某些向量能够被其他向量线性表出的情况,我们就称这组向量是线性相关的。
基向量与线性无关
在我们介绍基的概念的时候,我们提到了
两个向量能够成为二维空间的基向量的条件是,能够通过它们的线性组合生成二维空间中所有的向量。
后面这可以用线性无关的概念重新描述 ,
两个向量能够成为二维空间的基向量的条件是,它们是线性无关的
也就是说,一组基向量肯定是线性无关的;反过来,n个线性无关的向量总是能够张成n维的线性空间。
空间的维度
在我们上面的介绍中,我们不经意频繁地使用了空间的维度这个概念。
对于维度,我们在生活中有着基本的感知,
比如,一维空间就是指一条直线,在这个空间之中,就只能沿着这条直线运行
二维空间中,也就是一个平面,你只能在这个平面上移动;
在数学中,一个空间的维度,也就是指形成整个空间的基向量的个数,也可以说是在这个空间中一组线性无关的向量的最大的个数
在计算机中,空间的维度,通常代表着不同属性的个数,比如,我们可以说身高,体重,年龄就组成了一个3维空间。
线性空间
我们介绍完了很多概念,这些概念有,线性变换,线性相关,线性无关,空间的维度,基向量 , 以及向量、数字、空间的对应关系。
那么让我们再回过头来考虑,最开始的假设条件空间是画在方格纸上面的
它究竟意味着什么呢?
空间画在方格纸上面,就是说,这个空间是线性空间,它是我们进行推理的基础,
如果这个空间是扭曲的,那么我们向量基本的加法和数乘就不一定能符合我们上面的定义了
所以我们应定义一个类似于“画在方格纸上的”空间,能够满足我们加法和数乘的基本运算。
事实上,线性空间的定义就是定义了基本的加法和数乘运算。
其数学定义为128,即
线性空间定义
-
非空集合 数域\(P\)上的一个非空集合\(V\)
-
对加法和数乘有封闭性
- 给出一个加法法则,对于\(V\)中任意两个元素\(\alpha\)与\(\beta\),在\(V\)中都有唯一的一个元素\(\gamma\)与它们对应,称为\(\alpha\)与\(\beta\)的和,记作\(\gamma=\alpha+\beta\)。
- 给出数量乘法运算,对于数域\(P\)中任一数\(k\)和\(V\)中任一元素\(\alpha\),在\(V\)中都有唯一的一个元素\(\delta\)与它们对应,称为\(k\)与\(\alpha\)的数量乘积,记作\(\delta=k\alpha\)。
-
满足8条规则
-
加法满足下面四条规则:
- 加法交换律\(\alpha+\beta=\beta+\alpha\);
- 加法结合律\((\alpha+\beta)+\gamma=\alpha+(\beta+\gamma)\);
- 零元素 在\(V\)中有一个元素\(0\),对于\(V\)中任一元素\(\alpha\)都有\(0+\alpha=\alpha\)。\(0\)称为\(V\)中的零元素。
- 负元素 对于\(V\)中的每一个元素\(\alpha\),都有\(V\)中的元素\(\beta\),使得\(\alpha+\beta=0\),。\(\beta\)称为\(\alpha\)的负元素。
-
数量乘法满足下面两条规则:
- 单位元素 \(1 \alpha=\alpha\)。
- \(k(l\alpha)=(kl)\alpha\)
-
数量乘法与加法满足下面两条规则
- \((k+l)\alpha=k\alpha+l\alpha\)
- \(k(\alpha+\beta)=k\alpha+k\beta\)
在以上规则中\(k,l\)表示数域\(P\)中的任意数;\(\alpha,\beta,\gamma\)表示集合\(V\)中的任意元素。
-
线性空间中的元素也称为向量,线性空间也称为向量空间。
再稍微扩展一下,只要能够符合线性空间的定义的,里面元素满足基本的加法和数乘运算规律的集合都可以称之为一个线性空间。这里的线性空间的元素就不再仅仅是我们数学上的向量的概念了。
例如,我们可以构建一个n维的多项式线性空间, 我们可以验证上面的定义,只要其符合,那么我们就可以称之为线性空间。在这个多项式线性空间中,我们可以选定一组基为\(1,x,x^2,\cdots,x^n\) 。
我们还可以定义一个由身高和体重组成的线性空间,但如果我们忽略掉单位,那他就是一个普通的二维线性空间。但这样定义以后,我们任意给出一个人的身高,体重,就能够在一个二维平面上绘制出相应的向量,点和坐标。
好了,我们介绍完了线性空间,接下来我们要解决的问题是,我们选定不同的基向量和坐标系,对物体的描述会带来什么影响,不同的坐标系之间的关联又是怎样的呢?