pandas库疑难问题---1、pandas打乱数据集
一、总结
一句话总结:
pandas可以用sample方法返回random sample,可以用reset_index方法reset打乱之后的index
df=df.sample(frac=1.0) #打乱所有数据 df=df.reset_index(drop=True) #打乱后的数据index也是乱的,用reset_index重新加一列index,drop=True表示丢弃原有index一列
二、pandas打乱数据集
博客对应课程的视频位置:1、pandas打乱数据集-范仁义-读书编程笔记
https://www.fanrenyi.com/video/39/360
import pandas as pd
一、sample方法随机打乱数据集
In [6]:
data = pd.read_csv('./iris.data',header=None)
data
Out[6]:
In [7]:
#设置frac=0.5表示随机抽取50%的数据
data=data.sample(frac=1.0)#打乱所有数据
data
Out[7]:
为了结果的复现
可以看到设置的种子一样的时候,生成的随机数是一样的
In [9]:
data = pd.read_csv('./iris.data',header=None)
data=data.sample(frac=1.0,random_state=11)#打乱所有数据
data
Out[9]:
二、reset_index方法可以重新设置index(打乱数据集之后)
In [10]:
data = pd.read_csv('./iris.data',header=None)
data
Out[10]:
In [11]:
data=data.sample(frac=1.0)#打乱所有数据
data
Out[11]:
In [12]:
data=data.reset_index(drop=True) #打乱后的数据index也是乱的,用reset_index重新加一列index,drop=True表示丢弃原有index一列
data
Out[12]:
In [ ]:
博客对应系列课程视频位置:
1、pandas打乱数据集-范仁义-读书编程笔记
https://www.fanrenyi.com/video/39/360
2、pandas切片操作-范仁义-读书编程笔记
https://www.fanrenyi.com/video/39/379
3、loc方法和iloc方法的区别-范仁义-读书编程笔记
https://www.fanrenyi.com/video/39/380
4、DataFrame类型转换成Numpy中ndarray-范仁义-读书编程笔记
https://www.fanrenyi.com/video/39/381
1、pandas打乱数据集-范仁义-读书编程笔记
https://www.fanrenyi.com/video/39/360
2、pandas切片操作-范仁义-读书编程笔记
https://www.fanrenyi.com/video/39/379
3、loc方法和iloc方法的区别-范仁义-读书编程笔记
https://www.fanrenyi.com/video/39/380
4、DataFrame类型转换成Numpy中ndarray-范仁义-读书编程笔记
https://www.fanrenyi.com/video/39/381