udf

from pyspark.sql import SparkSession
from pyspark.sql.types import StructField, StructType, StringType, IntegerType, LongType,ArrayType
from pyspark.sql import functions as F

spark = SparkSession.builder.appName("get_app_category").enableHiveSupport().
    config("spark.driver.host", "localhost").config("spark.debug.maxToStringFields", "100").getOrCreate()
df = spark.createDataFrame([('数学', '张三', 88), ('语文', '张三', 92), ('英语', '张三', 77),
                            ('数学', '王五', 65), ('语文', '王五', 87), ('英语', '王五', 90),
                            ('数学', '李雷', 67), ('语文', '李雷', 33), ('英语', '李雷', 24),
                            ('数学', '宫九', 77), ('语文', '宫九', 87), ('英语', '宫九', 90)
                            ], ['subject', 'name', 'score'])
df.show()

spark.udf.register("is_good",lambda x:'good' if x>=85 else 'bad',StringType())
df.createOrReplaceTempView('t1')
spark.sql('select subject,name,score,is_good(score) as is_good from t1').show()

相关阅读:
[转]ARM平台下独占访问指令LDREX和STREX
ARM MMU
在字符串中查找子字符串并提取它
获得字符串的长度
连接字符串
循环用于迭代数组中的项目
循环的标准
if ... else 语句
添加一个图像切换器
css 中的z-index

原文地址：https://www.cnblogs.com/muyue123/p/13298875.html