1. 下载安装pandas
pip install pandas pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
Pandas需要先读取表格类型的数据,然后进行分析
数据类型 | 说明 | Pandas读取方法 |
---|---|---|
csv, tsv, txt | 用逗号分隔,tab分隔的纯文本文件 | pd.read_csv |
excel | 微软xls或者xlsx文件 | pd.read_excel |
mysql | 关系型数据库表 | pd.read_sql |
# 读取csv文件,使用默认的标题行,逗号分隔符 import pandas as pd file_path = '../files/ratings.csv' # 使用pd.read_csv读取数据 ratings = pd.read_csv(file_path) print(ratings) # 查看数据的前几行 print("查看数据的前几行: ", ratings.head()) # 查看数据的形状(返回行数,列数) print("查看数据的形状: ", ratings.shape) # 查看列表列名 print("查看列表列名: ", ratings.columns) # 查看索引列 print("查看索引列: ", ratings.index) # 查看每列的数据类型 print("查看每列的数据类型: ", ratings.dtypes)
# 读取csv文件,使用默认的标题行,逗号分隔符 import pandas as pd file_path = '../files/access_pvuv.txt' # 使用pd.read_csv读取数据 pvuv = pd.read_csv(file_path, sep=' ', header=None, names=['pdate', 'pv', 'uv']) """ sep: 指定列的分隔符 header: 没有标题行设置为None names: 自定义列名 """ print(pvuv) # 查看数据的前几行 print("查看数据的前几行: ", pvuv.head()) # 查看数据的形状(返回行数,列数) print("查看数据的形状: ", pvuv.shape) # 查看列表列名 print("查看列表列名: ", pvuv.columns) # 查看索引列 print("查看索引列: ", pvuv.index) # 查看每列的数据类型 print("查看每列的数据类型: ", pvuv.dtypes)
# 读取csv文件,使用默认的标题行,逗号分隔符 import pandas as pd file_path = '../files/access_pvuv.xlsx' # 使用pd.read_excel读取数据 pvuv = pd.read_excel(file_path) print(pvuv)
# 读取csv文件,使用默认的标题行,逗号分隔符 import pymysql import pandas as pd # 创建数据库连接 conn = pymysql.connect(host='127.0.0.1', user='root', password='123456', database='demo', charset='utf8') # 使用pd.read_excel读取数据 pvuv = pd.read_sql("select * from crazyant_pvuv", con=conn) print(pvuv)