• 利用python数据分析与挖掘相关资料总结


    小生今年研二,目前主要从事软件工程数据挖掘与分析。之前一直苦于找不到一个从数据预处理、数据分析、数据可视化和软件建模的统一平台。因此,小生辗转反辙学习了java,R语言,python,scala等等。最后忽然发现python正是小生苦苦寻觅的“稀世珍宝”。在这里主要总结利用python分析数据的一些工具包和相关资料,还望各位指正共同进步。

    主要的工具包:

    numpy: http://www.numpy.org/                                                     数组和矢量计算库

    scipy: www.scipy.org                                                                     数学计算库

    pandas: http://pandas.pydata.org/                                                 数据处理与挖掘库

    matplotlib: matplotlib.org                                                              数据可视化工具库

    scikit-learn: http://scikit-learn.org/stable/                                   机器学习库

    snownlp: https://pypi.python.org/pypi/snownlp/0.11.1           中文文本处理库

    nltk: http://www.nltk.org/                                                             英文文本处理

    flask:http://flask.pocoo.org/                    python web轻便的开发框架

    networkx: http://networkx.github.io/                python网络关系画图

    这些库安装起来比较麻烦,它们的依赖库有很多,需要一一安装。因此,小生建议直接安装一个python解决方案包:https://www.enthought.com/。它支持各种操作系统(windows,linux,Mac OS等等),安装起来特别简单,此处不再累赘。

    pyspark: http://spark.apache.org/docs/latest/api/python/pyspark.html 此外如果数据量真的特别大,单机无法满足您的需求的话,小生推荐使用pyspark工具包替您解忧。

    当然除了上面的一些用得比较多的工具包之外,python大数据分析的相关软件包还有很多,请看下面这张脑图:

    更多信息请参考网页:http://www.xmind.net/m/WvfC

    相关书籍:

    《数学之美与浪潮之巅》

    《python cookbook》

    《Building Machine Learning Systems with Python, 2nd Edition》

    《Machine Learning in Python》

    《Python For Data Analysis》

    《Python Data Analysis》

    《python自然语言处理》

    欢迎大家补充资料,共同进步!谢谢~

  • 相关阅读:
    自相关函数 互相关函数 平稳随机过程
    MC323发短信程序+MSP430F149
    labview notes
    DSSS FHSS
    dBm与功率(w)换算关系!
    int 正负相乘
    51单片机 1602液晶显示
    51单片机 AD转换
    51单片机 蜂鸣器
    51单片机 串口通信
  • 原文地址:https://www.cnblogs.com/huiyang865/p/5550001.html
Copyright © 2020-2023  润新知