aplly-lambda-map用法
1 lambda
lambda原型为:lambda 参数:操作(参数)
lambda函数也叫匿名函数,即没有具体名称的函数,它允许快速定义单行函数,可以用在任何需要函数的地方。这区别于def定义的函数。
lambda与def的区别:
1)def创建的方法是有名称的,而lambda没有。
2)lambda会返回一个函数对象,但这个对象不会赋给一个标识符,而def则会把函数对象赋值给一个变量(函数名)。
3)lambda只是一个表达式,而def则是一个语句。
4)lambda表达式” : “后面,只能有一个表达式,def则可以有多个。
5)像if或for或print等语句不能用于lambda中,def可以。
6)lambda一般用来定义简单的函数,而def可以定义复杂的函数。
2 map
会根据提供的函数对指定序列做映射。
第一个参数 function 以参数序列中的每一个元素调用 function 函数,返回包含每次 function 函数返回值的新列表。
#单个参数的: g = lambda x : x ** 2 print(g(3)) #多个参数的: g = lambda x, y, z : (x + y) ** z print(g(1,2,2)) def sq(x): return x * x # 调用函数 tmp = map(sq, [y for y in range(10)]) print(list(tmp)) # 直接通过 lambda tmp = map(lambda x: x*x, [y for y in range(10)]) print(list(tmp))
'''
9
9
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
'''
3 Apply
Python中apply函数的格式为:apply(func,*args,**kwargs)
当然,func可以是匿名函数。
用途:当一个函数的参数存在于一个元组或者一个字典中时,用来间接的调用这个函数,并将元组或者字典中的参数按照顺序传递给参数
解析:args是一个包含按照函数所需参数传递的位置参数的一个元组,简单来说,假如A函数的函数位置为 A(a=1,b=2),那么这个元组中就必须严格按照这个参数的位置顺序进行传递(a=3,b=4),而不能是(b=4,a=3)这样的顺序。kwargs是一个包含关键字参数的字典,而其中args如果不传递,kwargs需要传递,则必须在args的位置留空。
apply的返回值就是函数func函数的返回值。
df=pd.DataFrame(np.random.randn(4,3),columns=list('bde'),index=['utah','ohio','texas','oregon']) print(df, ' ') #将函数应用到由各列或行形成的一维数组上。DataFrame的apply方法可以实现此功能 f=lambda x:x.max()-x.min() #默认情况下会以列为单位,分别对列应用函数 t1=df.apply(f) print(t1, ' ') t2=df.apply(f,axis=1) print(t2, ' ') #除标量外,传递给apply的函数还可以返回由多个值组成的Series def f(x): return pd.Series([x.min(),x.max()],index=['min','max']) t3=df.apply(f) #从运行的结果可以看出,按列调用的顺序,调用函数运行的结果在右边依次追加 print(t3, ' ') #元素级的python函数,将函数应用到每一个元素 #将DataFrame中的各个浮点值保留两位小数 f=lambda x: '%.2f'%x t3=df.applymap(f) print(t3, ' ') #注意,之所以这里用map,是因为Series有一个元素级函数的map方法。而dataframe只有applymap。 t4=df['e'].map(f) print(t4)
'''
b d e utah 1.077723 2.070481 -1.101830 ohio 0.004598 -0.500520 -1.132097 texas -1.061910 -0.698187 0.053061 oregon -0.353797 0.328029 0.076706 b 2.139633 d 2.768668 e 1.208803 dtype: float64 utah 3.172312 ohio 1.136695 texas 1.114971 oregon 0.681826 dtype: float64 b d e min -1.061910 -0.698187 -1.132097 max 1.077723 2.070481 0.076706 b d e utah 1.08 2.07 -1.10 ohio 0.00 -0.50 -1.13 texas -1.06 -0.70 0.05 oregon -0.35 0.33 0.08 utah -1.10 ohio -1.13 texas 0.05 oregon 0.08 Name: e, dtype: object
'''
# Recreate the dataframe data = dict(Size=[80000,8000000,800000000]) df = pd.DataFrame(data) def func(x): if x < 1e6: return "<1m" elif x < 1e7: return "1-10m" elif x < 5e7: return "10-50m" else: return 'N/A' df['Classification'] = df['Size'].apply(func) df['Classification'] = df['Size'].apply(lambda x: func(x)) print(df)
'''
Size Classification 0 80000 <1m 1 8000000 1-10m 2 800000000 N/A
'''
# apply 多列条件判断下新增一列 data = {'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen', 'Hangzhou', 'Chongqing', 'Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen', 'Hangzhou', 'Chongqing'], 'year': [2015,2016,2015,2017,2016, 2016, 2015,2016,2015,2017,2016, 2016], 'population': [2100, 2300, 1000, 700, 500, 500, 2100, 2300, 1000, 700, 500, 500]} frame = pd.DataFrame(data, columns = ['year', 'city', 'population', 'debt']) frame def function1(a, b): if 'ing' in a and b == 2016: return 1 else: return 0 frame['test'] = frame.apply(lambda x: 1 if (('ing' in x.city) & (x.year == 2016)) else 0, axis = 1) frame['test'] = frame.apply(lambda x: function1(x.city, x.year), axis = 1) print(frame, ' ') frame['panduan'] = frame.city.apply(lambda x: 1 if 'ing' in x else 0) print(frame)
'''
year city population debt test 0 2015 Beijing 2100 NaN 0 1 2016 Shanghai 2300 NaN 0 2 2015 Guangzhou 1000 NaN 0 3 2017 Shenzhen 700 NaN 0 4 2016 Hangzhou 500 NaN 0 5 2016 Chongqing 500 NaN 1 6 2015 Beijing 2100 NaN 0 7 2016 Shanghai 2300 NaN 0 8 2015 Guangzhou 1000 NaN 0 9 2017 Shenzhen 700 NaN 0 10 2016 Hangzhou 500 NaN 0 11 2016 Chongqing 500 NaN 1 year city population debt test panduan 0 2015 Beijing 2100 NaN 0 1 1 2016 Shanghai 2300 NaN 0 0 2 2015 Guangzhou 1000 NaN 0 0 3 2017 Shenzhen 700 NaN 0 0 4 2016 Hangzhou 500 NaN 0 0 5 2016 Chongqing 500 NaN 1 1 6 2015 Beijing 2100 NaN 0 1 7 2016 Shanghai 2300 NaN 0 0 8 2015 Guangzhou 1000 NaN 0 0 9 2017 Shenzhen 700 NaN 0 0 10 2016 Hangzhou 500 NaN 0 0 11 2016 Chongqing 500 NaN 1 1
'''