其它课程中的python---5、Pandas处理数据和读取数据
一、总结
一句话总结:
记常用和特例:慢慢慢慢的就熟了,不用太着急,慢慢来
库的使用都很简单:就是库的常用函数就这几个,后面用的时候学都来得及。
面试的时候看什么:产品、资质、潜力、热情 这几个最重要
python怎么学习:先学大纲,学主干,枝叶等用的时候再去学,这样很快
1、Pandas数据结构有哪些?
Series:数组与标签
Dataframe:表格型数据结构
◆Series -数组与标签 -可以通过标签选取数据 -定长的有序字典 ◆Dataframe -表格型数据结构 -行索引、列索引
2、直接输出变量名(比如数组)显示变量的值,是ipython的功能么?
是的:ipython比较好用
3、Pandas的Series如何创建数据?
obj = Series([4, 7, -5, 3]):无索引
obj2 = Series([4, 7, -5, 3], index=['d', 'b', 'a', 'c']):有索引
4、如何访问或者修改Pandas的Series中的数据?
用脑子:访问数组或者这些数据结构的值肯定是中括号[],如果是多个肯定是以数组的方式传入参数:比如obj2[['c', 'a', 'd']]
obj2['a']
obj2['d'] = 6
obj2[['c', 'a', 'd']]
5、查看编程语言排名的网站是什么?
TIOBE:https://www.tiobe.com/tiobe-index//
6、比如你要统计班上人的成绩,但是成绩对应的名字的索引是乱的,很麻烦,怎么解决?
Pandas的Series自动对齐索引:Series(sdata, index=states)
sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}
obj3 = Series(sdata)
obj3
states = ['California', 'Ohio', 'Oregon', 'Texas']
obj4 = Series(sdata, index=states)
obj4
7、Pandas中的Series的本质是什么?
带索引的一维数据:使用起来特别方便
8、Pandas中的Dataframe的特点是什么?
不同列数据结构不一样:不同列的数据结构可能不一样,同一列的数据结构肯定是一样的
Dataframe的某一列取出来就相当于Series
9、Pandas中的Dataframe如何创建?
用脑子:要么以数组的方式赋值,要么对原有值增加什么操作
10、Pandas中的Dataframe如何操作?
用脑子:所有这些数组类型的操作应该都差不太多
11、Pandas提供一些用于将表格型数据读取为DataFrame对象的函数?
read_csv 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为逗号
read_table 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为制表符(“ ”)
read_fwf 读取定宽列格式数据(也就是说,没有分隔符)
read_csv 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为逗号
read_table 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为制表符(“ ”)
read_fwf 读取定宽列格式数据(也就是说,没有分隔符)
read_clipboard 读取剪贴板中的数据,可以看做read_table的剪贴板版。在将网页转换为表格时很有用