python dataframe数据条件筛选

一般情况下我们从一堆数据中选择我们获取想要的数据会通过一下方式：

（1）创建链表或数组；

（2）用for 循环遍历所有数据，将想要的存入链表或数组。

但是python中我们不需要这么做，我们可以用Pandas库帮我们解决这个问题：具体使用看实例：

import numpy as np
import pandas as pd
from time import time
from IPython.display import display # 允许为DataFrame使用display()
import visuals as vs
data = pd.read_csv("census.csv")
n_records =len(data['income'])
n=0
m=0
n_greater_50k = data[data['income'] == '>50K'].shape[0]#替换for循环
n_at_most_50k = data[data['income'] == '<=50K'].shape[0]
print "Total number of records: {}".format(n_records)
print "Individuals making more than $50,000: {}".format(n_greater_50k)
print "Individuals making at most $50,000: {}".format(n_at_most_50k)
print "Percentage of individuals making more than $50,000: {:.2f}%".format(greater_percent)

相关阅读:
创建一个简单的vue.js项目
安装VM
安装postgreSQL
读取pgsql扫描失败
adb install 安装apk时报错Failure [INSTALL_FAILED_TEST_ONLY]解决方法
「工具分享」Checker Script for Linux
「V 曲闲谈」《万物与我同归于寂》——终与始
Note / Solution Set 「Binomial Sum」两道例题
Solution Set 「NOIP Simu.」20221014
Solution Set 「NOIP Simu.」20221024

原文地址：https://www.cnblogs.com/fuhang/p/8551469.html