• Pandas系列教程(1)Pandas数据读取


    Pandas系列教程(1)Pandas数据读取

    1. 下载安装pandas

    1
    2
    pip install pandas
    pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple

    2. Pandas数据读取

    Pandas需要先读取表格类型的数据,然后进行分析

    数据类型说明Pandas读取方法
    csv, tsv, txt 用逗号分隔,tab分隔的纯文本文件 pd.read_csv
    excel 微软xls或者xlsx文件 pd.read_excel
    mysql 关系型数据库表 pd.read_sql

    2.1 Pandas读取纯文本文件

    读取csv文件

    复制代码
    # 读取csv文件,使用默认的标题行,逗号分隔符
    import pandas as pd
    
    file_path = '../files/ratings.csv'
    
    # 使用pd.read_csv读取数据
    ratings = pd.read_csv(file_path)
    print(ratings)
    
    # 查看数据的前几行
    print("查看数据的前几行:\n ", ratings.head())
    
    # 查看数据的形状(返回行数,列数)
    print("查看数据的形状:\n ", ratings.shape)
    
    # 查看列表列名
    print("查看列表列名:\n ", ratings.columns)
    
    # 查看索引列
    print("查看索引列:\n ", ratings.index)
    
    # 查看每列的数据类型
    print("查看每列的数据类型:\n ", ratings.dtypes)
    复制代码

    读取txt文件

    复制代码
    # 读取csv文件,使用默认的标题行,逗号分隔符
    
    import pandas as pd
    
    file_path = '../files/access_pvuv.txt'
    
    # 使用pd.read_csv读取数据
    pvuv = pd.read_csv(file_path, sep='\t', header=None, names=['pdate', 'pv', 'uv'])
    """
    sep: 指定列的分隔符
    header: 没有标题行设置为None
    names: 自定义列名
    """
    print(pvuv)
    
    # 查看数据的前几行
    print("查看数据的前几行:\n ", pvuv.head())
    
    # 查看数据的形状(返回行数,列数)
    print("查看数据的形状:\n ", pvuv.shape)
    
    # 查看列表列名
    print("查看列表列名:\n ", pvuv.columns)
    
    # 查看索引列
    print("查看索引列:\n ", pvuv.index)
    
    # 查看每列的数据类型
    print("查看每列的数据类型:\n ", pvuv.dtypes)
    复制代码

    2.2 读取excel文件

    复制代码
    # 读取csv文件,使用默认的标题行,逗号分隔符
    
    import pandas as pd
    
    file_path = '../files/access_pvuv.xlsx'
    
    # 使用pd.read_excel读取数据
    pvuv = pd.read_excel(file_path)
    print(pvuv)
    复制代码

    2.3 读取mysql

    复制代码
    # 读取csv文件,使用默认的标题行,逗号分隔符
    import pymysql
    import pandas as pd
    
    # 创建数据库连接
    conn = pymysql.connect(host='127.0.0.1', user='root', password='123456', database='demo', charset='utf8')
    
    # 使用pd.read_excel读取数据
    pvuv = pd.read_sql("select * from crazyant_pvuv", con=conn)
    print(pvuv)
    复制代码
  • 相关阅读:
    Linux零拷贝技术 直接 io
    纯Python模式
    c 越界 数组越界
    哈希 二叉树
    Cache busting
    sub esp
    lisp 代码即数据
    hexdump
    nmap
    对象 闭包
  • 原文地址:https://www.cnblogs.com/zkwarrior/p/15510162.html
Copyright © 2020-2023  润新知