返回Series
访问DataFrame中的Series,可以使用DataFrame['列名']
方式。
# 加载数据 movies_df = pd.read_csv("IMDB-Movie-Data.csv", index_col="Title") movies_df.columns = ['rank', 'genre', 'description', 'director', 'actors', 'year', 'runtime', 'rating', 'votes', 'revenue_millions', 'metascore'] # 访问列数据 genre_col = movies_df['genre'] type(genre_col)
输出
<class 'pandas.core.series.Series'>
返回的是一个Series。
返回DataFrame
要提取列作为DataFrame,需要传入列名的列表:DataFrame[['列名1', '列名2', ... '列名n']]
。
在我们的例子中,只有一个列:
genre_col = movies_df[['genre']] type(genre_col)
输出
<class 'pandas.core.frame.DataFrame'>
可以看到,返回的是一个DataFrame。
添加另一个列:
subset = movies_df[['genre', 'rating']] subset.head()
输出
genre rating Title Guardians of the Galaxy Action,Adventure,Sci-Fi 8.1 Prometheus Adventure,Mystery,Sci-Fi 7.0 Split Horror,Thriller 7.3 Sing Animation,Comedy,Family 7.2 Suicide Squad Action,Adventure,Fantasy 6.2