tushare:
http://tushare.waditu.com/index.html
为什么是Python?
就跟javascript在web领域无可撼动的地位一样,Python也已经在金融量化投资领域占据了重要位置,从各个业务链条都能找到相应的框架实现。
我们拿上一篇文章的图再来看看,在量化投资(证券和比特币)开源项目里,全球star数排名前10位里面,有7个是Python实现的。从数据获取到策略回测再到交易,覆盖了整个业务链。
而全球注册用户数最多的商业量化平台Uqer优矿,也同样是基于Python实现和提供服务的。国内后来的其他量化平台,例如ricequant和joinquant,也主推Python环境。可见Python在量化平台应用的绝对占有程度。
Python是一门比较全面与平衡的语言,既能满足包括web在内的系统应用的开发,又能满足数据统计分析等数学领域的计算需求,同时也能作为胶水语言跟其它开发语言互通融合。
在数据分析方面,没有其他语言能像Python这样既能精于计算又能保持性能,对于时间序列数据的处理展现了简单便捷的优势。而如此适用的特点,主要得益于有如下框架和工具的支持:
Numpy:底层基于C实现的科学计算包
- 具有强大的N维数组对象Array
- 具有数据广播功能的函数库
- 具有完整的线性代数和随机数生成函数
SciPy:开源算法和数学工具包
- 最优化线性代数、积分、插值、特殊函数
- 快速傅里叶变换
- 信号处理和图像处理
- 常微分方程求解
- 其他科学与工程中常用的计算
其功能与Matlab和Scilab等类似
Pandas:起源于AQR的数据处理包,具有金融数据分析基因
- 基于Series、DataFrame和Pannel多维表结构数据
- 数据自动对齐功能
- 数据清洗和计算功能
- 时间序列数据快速处理功能
Matplotlib:基于Python的数据绘图包,能够绘制出各类丰富的图形和报表
另外,Python在机器学习领域的应用也越来越多,其中的开源的项目包括了scikit-learn、Theano、Orange等。
金融领域主要的Python书籍:
《Python for Data Analysis》
《Python for Finance》
《Mastering Python for Finance》
《Maching Learning in Action》