• 1.理解Numpy、pandas


    之前一直做得只是采集数据,而没有再做后期对数据的处理分析工作,自己也是有意愿去往这些方向学习的,最近就在慢慢的接触。

    首先简单理解一下numpy和pandas:
    一.NumPy:
    1.NumPy是高性能计算和数据分析的基础包。
    2.NumPy系统是Python的一种开源的数值计算扩展。
    3.可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix))。
    4.提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。

    安装numpy:
    控制台:pip install numpy

    简单测试:



    二.Pandas
    1.Pandas是用于数据清洗的库,pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
    2.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。
    3.Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

    备注:
    安装pandas需要很多依赖的库,安装相对麻烦。
    使用Anaconda,其内置了有关数据清洗和算法的库。

    pycharm中安装pandas,需要先安装numpy和python-dateutil,再安装pandas。
    
    
  • 相关阅读:
    反转字符串
    数组
    复杂度分析(二)
    复杂度分析(一)
    业务应该这么写--特性
    5种方法快速启动一个应用程序
    业务应该这么写--表达式树
    业务应该这么写--泛型
    业务应该这么写--异常处理
    关于关系型数据库外键,要减轻数据库压力的一些说法
  • 原文地址:https://www.cnblogs.com/lvjing/p/9969948.html
Copyright © 2020-2023  润新知