01.万恶之源-python基础
⼀.python介绍
python的创始⼈为吉多·范罗苏姆(Guido van Rossum)。1989年的圣诞节期间,吉多·
范罗苏姆为了在阿姆斯特丹打发时间,决⼼开发⼀个新的脚本解释程序,作为ABC语⾔的⼀
种继承。
最新的TIOBE排⾏榜,Python已经占据世界第四名的位置, Python崇尚优美、清晰、简
单,是⼀个优秀并⼴泛使⽤的语⾔。
由上图可⻅,Python整体呈上升趋势,反映出Python应⽤越来越⼴泛并且也逐渐得到业内
的认可!!!
Python可以应⽤于众多领域,如:数据分析、组件集成、⽹络服务、图像处理、数值计算
和科学计算等众多领域。⽬前业内⼏乎所有⼤中型互联⽹企业都在使⽤Python,如:
Youtube、Dropbox、BT、Quora(中国知乎)、⾖瓣、知乎、Google、Yahoo!、
Facebook、NASA、百度、腾讯、汽⻋之家、美团等。
⽬前Python主要应⽤领域:
云计算: 云计算最⽕的语⾔, 典型应⽤OpenStack
WEB开发: 众多优秀的WEB框架,众多⼤型⽹站均为Python开发,Youtube,
Dropbox, ⾖瓣。。。, 典型WEB框架有Django
科学运算、⼈⼯智能: 典型库NumPy, SciPy, Matplotlib, Enthought
librarys,pandas
系统运维: 运维⼈员必备语⾔
⾦融:量化交易,⾦融分析,在⾦融⼯程领域,Python不但在⽤,且⽤的最多,⽽
且重要性逐年提⾼。原因:作为动态语⾔的Python,语⾔结构清晰简单,库丰富,
成熟稳定,科学计算和统计分析都很⽜逼,⽣产效率远远⾼于c,c++,java,尤其擅⻓
策略回测
图形GUI: PyQT, WxPython,TkInter
Python在⼀些公司的应⽤:
⾕歌:Google App Engine 、code.google.com 、Google earth 、⾕歌爬⾍、
Google⼴告等项⽬都在⼤量使⽤Python开发
CIA: 美国中情局⽹站就是⽤Python开发的
NASA: 美国航天局(NASA)⼤量使⽤Python进⾏数据分析和运算
YouTube:世界上最⼤的视频⽹站YouTube就是⽤Python开发的
Dropbox:美国最⼤的在线云存储⽹站,全部⽤Python实现,每天⽹站处理10亿个
⽂件的上传和下载
Instagram:美国最⼤的图⽚分享社交⽹站,每天超过3千万张照⽚被分享,全部⽤
python开发
Facebook:⼤量的基础库均通过Python实现的
Redhat: 世界上最流⾏的Linux发⾏版本中的yum包管理⼯具就是⽤python开发的
⾖瓣: 公司⼏乎所有的业务均是通过Python开发的
知乎: 国内最⼤的问答社区,通过Python开发(国外Quora)
春⾬医⽣:国内知名的在线医疗⽹站是⽤Python开发的
除上⾯之外,还有搜狐、⾦⼭、腾讯、盛⼤、⽹易、百度、阿⾥、淘宝 、⼟⾖、新
浪、果壳等公司都在使⽤Python完成各种各样的任务。
1.1.python是⼀⻔什么样的语⾔
编程语⾔主要从以下⼏个⻆度为进⾏分类,编译型和解释型、静态语⾔和动态语⾔、强类
型定义语⾔和弱类型定义语⾔,我们先看编译型语⾔和解释型语⾔. 稍后再说强类型和弱类
型
编译和解释的区别是什么?
编译器是把源程序的每⼀条语句都编译成机器语⾔,并保存成⼆进制⽂件,这样运⾏时计算机
可以直接以机器语⾔来运⾏此程序,速度很快;
⽽解释器则是只在执⾏程序时,才⼀条⼀条的解释成机器语⾔给计算机来执⾏,所以运⾏速度
是不如编译后的程序运⾏的快的.
这是因为计算机不能直接认识并执⾏我们写的语句,它只能认识机器语⾔(是⼆进制的形式)
编译型vs解释型
编译型
优点:编译器⼀般会有预编译的过程对代码进⾏优化。因为编译只做⼀次,运⾏时不需要编
译,所以编译型语⾔的程序执⾏效率⾼。可以脱离语⾔环境独立运⾏。
缺点:编译之后如果需要修改就需要整个模块重新编译。编译的时候根据对应的运⾏环境⽣
成机器码,不同的操作系统之间移植就会有问题,需要根据运⾏的操作系统环境编译不同的
可执⾏⽂件。
解释型
优点:有良好的平台兼容性,在任何环境中都可以运⾏,前提是安装了解释器(虚拟机)。
灵活,修改代码的时候直接修改就可以,可以快速部署,不⽤停机维护。
缺点:每次运⾏的时候都要解释⼀遍,性能上不如编译型语⾔。
1.2.python的优缺点
先看优点
1. Python的定位是“优雅”、“明确”、“简单”,所以Python程序看上去总是简单易
懂,初学者学Python,不但⼊⻔容易,⽽且将来深⼊下去,可以编写那些⾮常⾮常
复杂的程序。
2. 开发效率⾮常⾼,Python有⾮常强⼤的第三⽅库,基本上你想通过计算机实现任何
功能,Python官⽅库⾥都有相应的模块进⾏⽀持,直接下载调⽤后,在基础库的基
础上再进⾏开发,⼤⼤降低开发周期,避免重复造轮⼦。
3. ⾼级语⾔————当你⽤Python语⾔编写程序的时候,你⽆需考虑诸如如何管理你
的程序使⽤的内存⼀类的底层细节
4. 可移植性————由于它的开源本质,Python已经被移植在许多平台上(经过改动
使它能够⼯ 作在不同平台上)。如果你⼩⼼地避免使⽤依赖于系统的特性,那么你
的所有Python程序⽆需修改就⼏乎可以在市场上所有的系统平台上运⾏
5. 可扩展性————如果你需要你的⼀段关键代码运⾏得更快或者希望某些算法不公
开,你可以把你的部分程序⽤C或C++编写,然后在你的Python程序中使⽤它们。
6. 可嵌⼊性————你可以把Python嵌⼊你的C/C++程序,从⽽向你的程序⽤户提供
脚本功能。
再看缺点:
1. 速度慢,Python 的运⾏速度相⽐C语⾔确实慢很多,跟JAVA相⽐也要慢⼀些,因此
这也是很多所谓的⼤⽜不屑于使⽤Python的主要原因,但其实这⾥所指的运⾏速度
慢在⼤多数情况下⽤户是⽆法直接感知到的,必须借助测试⼯具才能体现出来,⽐如
你⽤C运⼀个程序花了0.01s,⽤Python是0.1s,这样C语⾔直接⽐Python快了10倍,
算是⾮常夸张了,但是你是⽆法直接通过⾁眼感知的,因为⼀个正常⼈所能感知的时
间最⼩单位是0.15-0.4s左右,哈哈。其实在⼤多数情况下Python已经完全可以满
⾜你对程序速度的要求,除⾮你要写对速度要求极⾼的搜索引擎等,这种情况下,当
然还是建议你⽤C去实现的。
2. 代码不能加密,因为PYTHON是解释性语⾔,它的源码都是以名⽂形式存放的,不
过我不认为这算是⼀个缺点,如果你的项⽬要求源代码必须是加密的,那你⼀开始就
不应该⽤Python来去实现。
3. 线程不能利⽤多CPU问题,这是Python被⼈诟病最多的⼀个缺点,GIL即全局解释
器锁(Global Interpreter Lock),是计算机程序设计语⾔解释器⽤于同步线程的
⼯具,使得任何时刻仅有⼀个线程在执⾏,Python的线程是操作系统的原⽣线程。
在Linux上为pthread,在Windows上为Win thread,完全由操作系统调度线程的
执⾏。⼀个python解释器进程内有⼀条主线程,以及多条⽤户程序的执⾏线程。即
使在多核CPU平台上,由于GIL的存在,所以禁⽌多线程的并⾏执⾏。关于这个问题
的折衷解决⽅法,我们在以后线程和进程章节⾥再进⾏详细探讨。
当然,Python还有⼀些其它的⼩缺点,在这就不⼀⼀列举了,我想说的是,任何⼀⻔语
⾔都不是完美的,都有擅⻓和不擅⻓做的事情,建议各位不要拿⼀个语⾔的劣势去跟另⼀个
语⾔的优势来去⽐较,语⾔只是⼀个⼯具,是实现程序设计师思想的⼯具,就像我们之前中
学学⼏何时,有的时候需要要圆规,有的时候需要⽤三⻆尺⼀样,拿相应的⼯具去做它最擅
⻓的事才是正确的选择。之前很多⼈问我Shell和Python到底哪个好?我回答说Shell是个
脚本语⾔,但Python不只是个脚本语⾔,能做的事情更多,然后⼜有钻⽜⻆尖的⼈说完全
没必要学Python, Python能做的事情Shell都可以做,只要你⾜够⽜B,然后⼜举了⽤Shell
可以写俄罗斯⽅块这样的游戏,对此我能说表达只能是,不要跟SB理论,SB会把你拉到跟
他⼀样的⾼度,然后⽤充分的经验把你打倒。
1.3.python解释器
当我们编写Python代码时,我们得到的是⼀个包含Python代码的以.py为扩展名的⽂本
⽂件。要运⾏代码,就需要Python解释器去执⾏.py⽂件。
由于整个Python语⾔从规范到解释器都是开源的,所以理论上,只要⽔平够⾼,任何⼈都
可以编写Python解释器来执⾏Python代码(当然难度很⼤)。事实上,确实存在多种
Python解释器。
CPython
当我们从Python官⽅⽹站下载并安装好Python 2.7后,我们就直接获得了⼀个官⽅版
本的解释器:CPython。这个解释器是⽤C语⾔开发的,所以叫CPython。在命令⾏下运
⾏python就是启动CPython解释器。
CPython是使⽤最⼴的Python解释器。教程的所有代码也都在CPython下执⾏。
IPython
IPython是基于CPython之上的⼀个交互式解释器,也就是说,IPython只是在交互⽅
式上有所增强,但是执⾏Python代码的功能和CPython是完全⼀样的。好⽐很多国产浏览
器虽然外观不同,但内核其实都是调⽤了IE。
CPython⽤>>>作为提示符,⽽IPython⽤In [序号]:作为提示符。
PyPy
PyPy是另⼀个Python解释器,它的⽬标是执⾏速度。PyPy采⽤JIT技术,对Python代
码进⾏动态编译(注意不是解释),所以可以显著提⾼Python代码的执⾏速度。
绝⼤部分Python代码都可以在PyPy下运⾏,但是PyPy和CPython有⼀些是不同的,这就
导致相同的Python代码在两种解释器下执⾏可能会有不同的结果。如果你的代码要放到
PyPy下执⾏,就需要了解PyPy和CPython的不同点。
Jython
Jython是运⾏在Java平台上的Python解释器,可以直接把Python代码编译成Java字节
码执⾏。
IronPython
IronPython和Jython类似,只不过IronPython是运⾏在微软.Net平台上的Python解
释器,可以直接把Python代码编译成.Net的字节码。
⼆.python发展史
1989年,为了打发圣诞节假期,Guido(⻳叔)开始写Python语⾔的编译器。
Python这个名字,来⾃Guido所挚爱的电视剧Monty Python’s Flying Circus。他
希望这个新的叫做Python的语⾔,能符合他的理想:创造⼀种C和shell之间,功能
全⾯,易学易⽤,可拓展的语⾔。
1991年,第⼀个Python编译器诞⽣。它是⽤C语⾔实现的,并能够调⽤C语⾔的库
⽂件。从⼀出⽣,Python已经具有了:类,函数,异常处理,包含表和词典在内的
核⼼数据类型,以及模块为基础的拓展系统。
Granddaddy of Python web frameworks, Zope 1 was released in 1999
Python 1.0 - January 1994 增加了 lambda, map, filter and reduce.
Python 2.0 - October 16, 2000,加⼊了内存回收机制,构成了现在Python语⾔
框架的基础
Python 2.4 - November 30, 2004, 同年⽬前最流⾏的WEB框架Django 诞⽣
Python 2.5 - September 19, 2006
Python 2.6 - October 1, 2008
Python 2.7 - July 3, 2010
In November 2014, it was announced that Python 2.7 would be
supported until 2020, and reaffirmed that there would be no 2.8 release
as users were expected to move to Python 3.4+ as soon as possible
Python 3.0 - December 3, 2008
Python 3.1 - June 27, 2009
Python 3.2 - February 20, 2011
Python 3.3 - September 29, 2012
Python 3.4 - March 16, 2014
Python 3.5 - September 13, 2015
三.python的安装
⼀路确定即可. 记得path下打钩.
四. 第⼀个python程序
python程序有两种编写⽅式:
1. 进入cmd控制台. 输入python进入编辑模式. 这时候我们可以直接编写python程序
2. 也可以在.py⽂件中编写python代码. 通过python命令来执⾏python代码
注意: python2中的中⽂编码会有问题. Python2使⽤的是ASCII码编码. 处理不了中⽂. 我
们需要替换成utf-8编码.
# -*- encoding:utf-8 -*-
五. 变量
变量:将运算的中间结果暂存到内存,以便后续程序调⽤.
变量的命名规则:
1, 变量由字⺟, 数字,下划线搭配组合⽽成
2, 不可以⽤数字开头,更不能是全数字
3,不能是pythond的关键字, 这些符号和字⺟已经被python占⽤, 不可以更改
4,不要⽤中⽂
5,名字要有意义
6,不要太⻓
7, 区分⼤⼩写
推荐⼤家使⽤驼峰体或者下划线命名
驼峰体: 除⾸字⺟外的其他每个单词⾸字⺟⼤写
下划线: 每个单词之间⽤下划线分开
六.常量
在python中不存在绝对的常量. 约定俗成, 所有字⺟⼤写就是常量
例如: PI = 3.141592653
BIRTH_OF_SYLAR = 1990
七.注释
有时候我们写的东⻄不⼀定都是给⽤户看的. 或者不希望解释器执⾏. 那我们可以使⽤#来
注释掉代码. 被注释的内容是不会执⾏的.可以⽅便后⾯的程序员来拜读你的代码
单⾏注释: # 被注释的内容
多⾏注释:''' 被注释的内容 ''', """这个也是多⾏注释"""
八.python的基本数据类型
什么是数据类型?
我们⼈类可以很容易的分清数字与字符的区别,但是计算机并不能呀,计算机虽然很强⼤,但从某种⻆
度上看⼜很傻,除⾮你明确的告诉它,1是数字,“汉”是⽂字,否则它是分不清1和‘汉’的区别的,因此,在
每个编程语⾔⾥都会有⼀个叫数据类型的东东,其实就是对常⽤的各种数据类型进⾏了明确的划分,你想
让计算机进⾏数值运算,你就传数字给它,你想让他处理⽂字,就传字符串类型给他。Python中常⽤的数
据类型有多种,今天我们暂只讲3种, 数字、字符串、布尔类型(命题).
8.1 整数(int)
常⻅的数字都是int类型. ⽤于计算或者⼤⼩的比较
在32位机器上int的范围是: -2**31~2**31-1,即-2147483648~2147483647
在64位机器上int的范围是: -2**63~2**63-1,即-9223372036854775808~9223372036854775807
够你⽤了吧. 注意这些是整数.
8.2 字符串(str)
在Python中,凡是⽤引号引起来的,全是字符串.
字符串可以⽤单引号,双引号,或者三引号引起来,没有什么区别,只是⼀些特殊的格式需要不⽤的引号
⽐如:
msg = "My name is Alex , I'm 22 years old!" 这个就需要单双引号配合。
msg = """
今天我想写⾸⼩诗,
歌颂我的同桌,
你看他那乌⿊的短发,
好像⼀只炸⽑鸡。
"""
想多⾏赋值⼀个字符串,就需要三引号。
数字类型有 +-*/ 字符串有么?
字符串只有 + *。
#字符串的拼接
s1 = 'a '
s2 = 'bc'
#print(s1 + s2)
#相乘 str*int
name = '坚强'
#print(name*8)
8.3 布尔值(bool), 真或者假, True和False
九.⽤户交互
使⽤input()函数,可以让我们和计算机互动起来
语法:
内容 = input(提⽰信息)
这⾥可以直接获取到⽤户输入的内容
⼗.流程控制if语句
你在⽣活中是不是经常遇到各种选择,⽐如玩⾊⼦,猜⼤⼩,⽐如选择⾛那条路回家?Python程序中也会
遇到这种情况,这就⽤到了if语句。
第⼀种语法:
if 条件: #引号是将条件与结果分开。
结果1。 # 四个空格,或者⼀个tab键,这个是告诉程序满⾜这个条件的
结果2。
如果条件是真(True) 执⾏结果1, 然后结果2, 如果条件假(False) 直接结果2
第⼆种语法:
If 条件:
结果1
else:
结果2
代码3
第三种语法:
If 条件1:
结果1
elif 条件2:
结果2
..
else:
结果n
第四种语法(嵌套):
If 条件1:
结果1
If 条件2:
结果2
else:
结果3
else:
结果4
可以⽆限的嵌套. 但是在实际开发中. 尽量不要超过三层嵌套