神经网络3_M-P模型

python机器学习-乳腺癌细胞挖掘（博主亲自录制视频）

https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share

http://www.hahack.com/reading/ann1/转载

什么是M-P模型

所谓M-P模型，其实是按照生物神经元的结构和工作原理构造出来的一个抽象和简化了的模型。简单点说，它是对一个生物神经元的建模。它实际上是两位科学家的名字的合称，1943年心理学家W.McCulloch和数学家W.Pitts合作提出了这个模型，所以取了他们两个人的名字（McCulloch-Pitts）。类似这样合作取名的情况很普遍，比如安全学里著名的RSA非对称加密算法，就是由Rivest、Shamir和Adleman三位大神合作的。在The Bigbang Theory里，我们的Sheldon同志就找到了诺贝尔奖得主Dr.Smoot希望进行合作，瞧瞧他的伟大计划：

生物神经元的结构

在谈M-P模型的内容之前，我们先得了解一下人脑中的神经元的结构，然后再研究M-P对人脑的神经元是如何建模的。右图是一张生物神经元的简化示意图。

神经元在结构上由细胞体、树突、轴突和突触4部分组成。

（1）细胞体

细胞体是神经元的主体，由细胞核、细胞质和细胞膜3部分组成。细胞体的外部是细胞膜，将膜内外细胞液分开。由于细胞膜对细胞液中的不同离子具有不同的通透性，这使得膜内外存在着离子浓度差，从而出现内负外正的静息电位。这种电位差称为膜电位。

（2）树突

从细胞体向外延伸出许多突起的神经纤维。负责接收来自其他神经元的输入信号，相当于细胞体的输入端（input）。

（3）轴突

由细胞体伸出的最长的一条突起称为轴突。轴突比树突长而细。轴突也叫神经纤维，末端处有很多细的分支称为神经末梢，每一条神经末梢可以向四面八方传出信号，相当于细胞体的输出端（output）。

（4）突触

一个神经元通过其轴突的神经末梢和和另一个神经元的细胞体或树突进行通信连接，这种连接相当于神经元之间的输入/输出接口（I/O），称为突触。

突触使神经细胞的膜电位发生变化，且电位的变化是可以累加的，单个神经元可以与多达上千个其他神经元的轴突末梢形成突触连接，接受从各个轴突传来的脉冲输入。这些输入可到达神经元的不同部位，输入部位不同，对神经元影响的权重也不同。输入部位不同，该神经细胞膜电位是它所有突触产生的电位总和，当该神经细胞的膜电位升高到超过一个阈值时，就会产生一个脉冲，从而总和的膜电位直接影响该神经细胞兴奋发放的脉冲数。

神经元的信息是宽度和幅度都相同的脉冲串，若某个神经细胞兴奋，其轴突输出的脉冲串的频率就高；若某个神经细胞抑制，其轴突输出的脉冲串的频率就低，甚至无脉冲输出。因此，突触可以分为兴奋性和抑制性两种，兴奋性的突触可能引起下一个神经细胞兴奋，抑制性的突触使下一个神经细胞抑制。脉冲的传递是正向的，不允许逆向传播。另外，突触传递信息需要一定的延迟。

关于上面的电位变化过程，我一直在想用一个更加通俗易懂的模型1 图 1 水桶与神经元来介绍。我们可以把一个神经元想象成一个水桶，这个水桶侧边接着很多条水管（神经末梢），水管既可以将桶里的水输出去（抑制性），也可以将其他水桶的水输进来（兴奋性）。当桶里的水达到一个高度时，就会通过另一条管子（轴突）将水输送出去。由于水管的粗细不同，对桶里的水的影响程度（权重）也不同。水管对水桶里的水位的改变（膜电位）自然就是这些水管输水量的累加。当然，这样来理解并不是很完美，因为神经元中的信号是采用一个个脉冲串的离散形式，而这里的水则是连续的。

关于权值的理解，还有人做出一个非常形象的比喻。比如现在我们要选一个餐厅吃饭，于是对于某一个餐厅，我们有好几种选择因素e.g.口味、位置、装潢、价格等等，这些选择因素就是输入，而每一个因素占的比重往往不同，比如我们往往会把口味和价格放在更重要的位置，装潢和位置则稍微不那么重要。很多个候选餐厅的选择结果最终汇总之后，就可以得到最后的决策。

综上所述，我们可以概括出生物神经网络的假定特点：