一,排序
sort_values()函数的具体参数
DataFrame.sort_values(by=‘##’,axis=0,ascending=True, inplace=False, na_position=‘last’)
by=[多个变量],ascending=[多个变量的排序规则],默认是True升序
二,替换
2.1使用replace替换
1.改变所有值
前面是需要替换的值,后面是替换后的值。
df.replace(to_replace, value)
如:df.replace('a','b')
这样pandas就会搜索整个DataFrame并将文档中所有的a换成b(要注意这样的操作并没有改变文档的源数据,要改变源数据需要使用inplace = True)。
2.只改变某一列
df['列名'].replace(原值,替换值,inplace=True)
这样pandas就会只替换选中的那一列
3.改变多个值
字典法:
df.replace({k1:v1,k2:v2}) #k是原值,v是替换值
df.map({k1:v1,k2:v2}) #这里用map效果一样
列表法:
df.replace([k1,k2],[v1,v2]) #k是原值,v是替换值
df.replace([k1,k2],v) #将k1,k2都替换为v
4.正则表达式替换
df.replace('[a-z1-9]',v,regex=True)
5.只替换部分内容
df['列名'].str.replace('原值','替换值) #这样就能替换具体某个值符合的部分