1.密码学加密
对明码进行加密:
(1)找两个很大的素数P和Q,越大越好,比如100位长的,然后计算他们的乘积
N=P×Q ......................................................................................... (17.1)
M=(P-1)×(Q-1)...................................................................................(17.2)
(2)找一个和M互素的整数E,也就是说M和E除了1以外没有公约数。
(3)找一个整数D,使得E×D除以M余1,即E×D mod M=1.
其中E是公钥,谁都可以用来加密,D是私钥用于解密,一定要自己保存好。乘机N是公开的,即使敌人知道了也没关系。
现在,用下面的公式对X加密,得到密码Y。
XE mod N = Y...........................................................................................(17.3)
好了,现在没有密钥D神仙也无法从Y中恢复X。如果知道D,根据费尔马小定理(描述一:p是一个质数,对于任何整数N,如果N、P互素,那么NP-1 ≡1(mod P)。描述二:P是质数,对于任何整数NP≡N(mod P) 。),则只要按下面的公式就可以轻而易举的从Y中得到X。
YD mod N = X.....................................................................................(17.4)
第五章 隐含马尔可夫模型
1.通信的本质是一个编解码和传输的过程。
2.雅格布森通信六个要素:发送者(信息源)、信道、接收者、信息、上下文、编码。
3.自然语言的处理问题可以看成是另外一种方式的通信(把自然语言传给计算机,计算机经过编解码后返回)。
第六章 信息的度量和作用
1.正是因为对某些事情一无所知所以它才会对我们有用,也因此对我们而言他才属于信息,而如果我们对某件事已经很了解就不需要太多的信息就能把他搞清楚。所以可以说,信息量就等于不确定性的多少。
2.信息的比特数和所有可能情况的对数函数log 有关。
3.当每支球队夺冠的可能性不等时,准确信息量是:
H= -(p1*logp1+p2*logp2+...+p32*log32 )........................................(6.1)
其中,p1,p2,....,p32分别是这32支球队夺冠的概率。想弄把它称为“信息熵”。 一般用符号H表示,单位是比特。
4.信息的作用就是消除不确定性,在网页搜索中根据用户输入的数据消除网上信息的不确定性,当用户给定的信息足够多是就能够准确的找到用户所需要的信息或者和用户所需要的信息相关的信息。
5.知道的信息越多,随机事件的不确定性就越小。
章节总结:信息的作用在于消除不确定性,自然语言处理的大量问题就是找相关的信息。
第七章 贾里尼克和现代语言处理
1.贾里尼克和吴军对教育的一些看法:
(1)小学生和中学生其实没必要花那么多时间读书,而他们的社会经验、生活能力以及在那时树立起的指向将帮助他们的一生。
(2)中学阶段花很多时间比同伴多读的课程,在大学以后用非常短的时间就可以读完,因为在大学阶段,人的理解力要强的多。举个例子,在中学需要花500小时才能学会的内容,在大学可能话100小时就够了。因此,一个学生在中小学阶段建立的那一点点的优势在大学很快就会丧失殆尽。
(3)学习(和教育)是一个人一辈子的过程,很多中学成绩好的亚裔学生进入名校后表现明显不如那些因为兴趣而读书的美国同伴,因为前者不断读书的动力不足。
(4)书本的内容可以早学,也可以晚学,但是错过了成长阶段是无法不回来的。
2.大多数时候,很多历史偶然性背后有着它必然的原因。
3.不需要高告诉你做什么,只需要告诉你不要去做什么(这样可以少犯很多错误)。
4.真正做好一件事没有捷径,需要一万小时的专业训练和努力。
第九章 图论和网络爬虫
1.定理:如果一个图能够从一个顶点出发,每条边不重复地遍历一遍回到这个顶点,那么每个顶点的度必须为偶数。