python中利用pandas读写csv文件

python中利用pandas读写csv文件
问题1：错误提示：UnicodeDecodeError: 'ascii' codec can't decode byte 0xb8

原因：含有中文字符
```
import pandas

pandas.read_csv(r'C:	est.csv',encoding='gbk')
```
问题2：将DataFrame格式的文件保存为csv格式，比如，DF变量为DataFrame格式的数据
```
DF.to_csv(r'C:	est.csv',encoding='gbk')
```
问题3：将特定格式的字符串保存为csv文件，比如
```
string_data = "1111,2222,242424,,55325,36666,112414" 
pd_data = pd.Series(string_data)
pd_data_expend = pd_data.str.split(",", expand=True)
pd_data.shape
pd_data_expend.shape
```
问题4：如何删除DataFrame存在重复数据？
```
import pandas as pd

DataFrame.drop_duplicates()
```
问题5：to_csv保存的时候，如何隐藏行和列的头文件？
```
import pandas as pd

DataFrame.to_csv(r"*	est.csv", header=False, index=False)
```
问题6：dict的keys具有无序的特性，如何保证dict转为dataframe数据时，按照制定的列进行排列？比如Data ={'col2': [3, 4], 'col4': [1, 2]}
```
import pandas as pd

Data = {'col2': [3, 4], 'col4': [1, 2]}
pd.DataFrame(Data)
```
输出结果：

col2 col4
0 3 1
1 4 2
```
import pandas as pd

Data = {'col2': [3, 4], 'col4': [1, 2]}
pd.DataFrame(Data, columns=["col4","col2"])
```
输出结果：

col4 col2
0 1 3
1 2 4

如果columns中的知道的字符串不存在，将自动赋值为NAN
```
import pandas as pd
Data = {'col2': [3, 4], 'col4': [1, 2]}
pd.DataFrame(Data, columns=["col4","col2", "col10"])
```
输出结果为：

col4 col2 col10
0 1 3 NaN
1 2 4 NaN
相关阅读:
.NET基础示例系列之十二：DLLImport
.NET基础示例系列之二：Socket
Qt之msvcversion.conf loaded but QMAKE_MSC_VER isn‘t set
Ubuntu安装sshd
Quick工程设置exe图标
 git修改文件之后上传
 VS里打开Qt的pro工程
 QtQWebEngineView显示百度网页
 在gitte建立新仓库并上传本地工程
 Qt的qDebug打印加颜色
原文地址：https://www.cnblogs.com/ystwyfe/p/8289044.html