• aplly-lambda-map用法


    aplly-lambda-map用法

    1 lambda

    lambda原型为:lambda 参数:操作(参数)
    lambda函数也叫匿名函数,即没有具体名称的函数,它允许快速定义单行函数,可以用在任何需要函数的地方。这区别于def定义的函数。
    lambda与def的区别:
    1)def创建的方法是有名称的,而lambda没有。
    2)lambda会返回一个函数对象,但这个对象不会赋给一个标识符,而def则会把函数对象赋值给一个变量(函数名)。
    3)lambda只是一个表达式,而def则是一个语句。
    4)lambda表达式” : “后面,只能有一个表达式,def则可以有多个。
    5)像if或for或print等语句不能用于lambda中,def可以。
    6)lambda一般用来定义简单的函数,而def可以定义复杂的函数。

    2 map

    会根据提供的函数对指定序列做映射。

    第一个参数 function 以参数序列中的每一个元素调用 function 函数,返回包含每次 function 函数返回值的新列表。

    #单个参数的:
    g = lambda x : x ** 2
    print(g(3))
    
    #多个参数的:
    g = lambda x, y, z : (x + y) ** z
    print(g(1,2,2))
    
    def sq(x):
        return x * x
    
    # 调用函数
    tmp = map(sq, [y for y in range(10)])
    print(list(tmp))
    
    # 直接通过 lambda 
    tmp = map(lambda x: x*x, [y for y in range(10)])
    print(list(tmp))

    '''
    9
    9
    [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
    [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
    '''

    3 Apply

    Python中apply函数的格式为:apply(func,*args,**kwargs)
    当然,func可以是匿名函数。
    用途:当一个函数的参数存在于一个元组或者一个字典中时,用来间接的调用这个函数,并将元组或者字典中的参数按照顺序传递给参数
    解析:args是一个包含按照函数所需参数传递的位置参数的一个元组,简单来说,假如A函数的函数位置为 A(a=1,b=2),那么这个元组中就必须严格按照这个参数的位置顺序进行传递(a=3,b=4),而不能是(b=4,a=3)这样的顺序。kwargs是一个包含关键字参数的字典,而其中args如果不传递,kwargs需要传递,则必须在args的位置留空。
    apply的返回值就是函数func函数的返回值。

    df=pd.DataFrame(np.random.randn(4,3),columns=list('bde'),index=['utah','ohio','texas','oregon'])
    print(df, '
    ')
    
    #将函数应用到由各列或行形成的一维数组上。DataFrame的apply方法可以实现此功能
    f=lambda x:x.max()-x.min()
    #默认情况下会以列为单位,分别对列应用函数
    t1=df.apply(f)
    print(t1, '
    ')
    
    t2=df.apply(f,axis=1)
    print(t2, '
    ')
     
    #除标量外,传递给apply的函数还可以返回由多个值组成的Series
    def f(x):
        return pd.Series([x.min(),x.max()],index=['min','max'])
    t3=df.apply(f)
    #从运行的结果可以看出,按列调用的顺序,调用函数运行的结果在右边依次追加
    print(t3, '
    ')
     
    #元素级的python函数,将函数应用到每一个元素
    #将DataFrame中的各个浮点值保留两位小数
    f=lambda x: '%.2f'%x
    t3=df.applymap(f)
    print(t3, '
    ')
     
    #注意,之所以这里用map,是因为Series有一个元素级函数的map方法。而dataframe只有applymap。
    t4=df['e'].map(f)
    print(t4)

    '''
                   b         d         e
    utah    1.077723  2.070481 -1.101830
    ohio    0.004598 -0.500520 -1.132097
    texas  -1.061910 -0.698187  0.053061
    oregon -0.353797  0.328029  0.076706 
    
    b    2.139633
    d    2.768668
    e    1.208803
    dtype: float64 
    
    utah      3.172312
    ohio      1.136695
    texas     1.114971
    oregon    0.681826
    dtype: float64 
    
                b         d         e
    min -1.061910 -0.698187 -1.132097
    max  1.077723  2.070481  0.076706 
    
                b      d      e
    utah     1.08   2.07  -1.10
    ohio     0.00  -0.50  -1.13
    texas   -1.06  -0.70   0.05
    oregon  -0.35   0.33   0.08 
    
    utah      -1.10
    ohio      -1.13
    texas      0.05
    oregon     0.08
    Name: e, dtype: object
    '''
    # Recreate the dataframe
    data = dict(Size=[80000,8000000,800000000])
    df = pd.DataFrame(data)
    
    def func(x):
        if x < 1e6:
            return "<1m"
        elif x < 1e7:
            return "1-10m"
        elif x < 5e7:
            return "10-50m"
        else:
            return 'N/A'
        
    df['Classification'] = df['Size'].apply(func)
    df['Classification'] = df['Size'].apply(lambda x: func(x))
    print(df)

    '''

    Size Classification 0 80000 <1m 1 8000000 1-10m 2 800000000 N/A
    '''
    # apply 多列条件判断下新增一列
    data = {'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen', 'Hangzhou', 'Chongqing', 
                     'Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen', 'Hangzhou', 'Chongqing'],
           'year': [2015,2016,2015,2017,2016, 2016, 2015,2016,2015,2017,2016, 2016],
           'population': [2100, 2300, 1000, 700, 500, 500, 2100, 2300, 1000, 700, 500, 500]}
    frame = pd.DataFrame(data, columns = ['year', 'city', 'population', 'debt'])
    frame
    
    def function1(a, b):
        if 'ing' in a and b == 2016:
            return 1
        else:
            return 0
    
    frame['test'] = frame.apply(lambda x: 1 if (('ing' in x.city) & (x.year == 2016)) else 0, axis = 1)
    frame['test'] = frame.apply(lambda x: function1(x.city, x.year), axis = 1)
    print(frame, '
    ')
    
    frame['panduan'] = frame.city.apply(lambda x: 1 if 'ing' in x else 0)
    print(frame)

    '''
        year       city  population debt  test
    0   2015    Beijing        2100  NaN     0
    1   2016   Shanghai        2300  NaN     0
    2   2015  Guangzhou        1000  NaN     0
    3   2017   Shenzhen         700  NaN     0
    4   2016   Hangzhou         500  NaN     0
    5   2016  Chongqing         500  NaN     1
    6   2015    Beijing        2100  NaN     0
    7   2016   Shanghai        2300  NaN     0
    8   2015  Guangzhou        1000  NaN     0
    9   2017   Shenzhen         700  NaN     0
    10  2016   Hangzhou         500  NaN     0
    11  2016  Chongqing         500  NaN     1 
    
        year       city  population debt  test  panduan
    0   2015    Beijing        2100  NaN     0        1
    1   2016   Shanghai        2300  NaN     0        0
    2   2015  Guangzhou        1000  NaN     0        0
    3   2017   Shenzhen         700  NaN     0        0
    4   2016   Hangzhou         500  NaN     0        0
    5   2016  Chongqing         500  NaN     1        1
    6   2015    Beijing        2100  NaN     0        1
    7   2016   Shanghai        2300  NaN     0        0
    8   2015  Guangzhou        1000  NaN     0        0
    9   2017   Shenzhen         700  NaN     0        0
    10  2016   Hangzhou         500  NaN     0        0
    11  2016  Chongqing         500  NaN     1        1
    '''
  • 相关阅读:
    openstack首页默认跳转
    centos7.3挂在移动硬盘(亲测)
    管理openstack多region介绍与实践
    一款功能强悍的web磁盘管理工具 (A powerful web disk management tools)
    文件及目录的归属关系
    Linux 权限基础说明
    umask默认权限分配
    linux删除、读取文件原理
    linux 文件类型
    LINUX 目录结构
  • 原文地址:https://www.cnblogs.com/LXL616/p/14044731.html
Copyright © 2020-2023  润新知