• Spark日志,及设置日志输出级别




    文章内容来源:

    spark中提供了log4j的方式记录日志。可以在$SPARK_HOME/conf/下,将 log4j.properties.template 文件copy为 log4j.properties 来启用log4j配置。但这个配置为全局配置,不能单独配置某个job的运行日志。

    Spark-core包设置默认的日志级别为info。

    用程序是默认加载Spark-core包下面的log4j-defaults.properties日志文件。
    查看log4j-defaults.properties文件:

    # Set everything to be logged to the console
    log4j.rootCategory=INFO, console
    log4j.appender.console=org.apache.log4j.ConsoleAppender
    log4j.appender.console.target=System.err
    log4j.appender.console.layout=org.apache.log4j.PatternLayout
    log4j.appender.console.layout.ConversionPattern=%d{yy/MM/dd HH:mm:ss} %p %c{1}: %m%n
    
    # Set the default spark-shell log level to WARN. When running the spark-shell, the
    # log level for this class is used to overwrite the root logger's log level, so that
    # the user can have different defaults for the shell and regular Spark apps.
    log4j.logger.org.apache.spark.repl.Main=WARN
    
    # Settings to quiet third party logs that are too verbose
    log4j.logger.org.spark_project.jetty=WARN
    log4j.logger.org.spark_project.jetty.util.component.AbstractLifeCycle=ERROR
    log4j.logger.org.apache.spark.repl.SparkIMain$exprTyper=INFO
    log4j.logger.org.apache.spark.repl.SparkILoop$SparkILoopInterpreter=INFO
    log4j.logger.org.apache.parquet=ERROR
    log4j.logger.parquet=ERROR
    
    # SPARK-9183: Settings to avoid annoying messages when looking up nonexistent UDFs in SparkSQL with Hive support
    log4j.logger.org.apache.hadoop.hive.metastore.RetryingHMSHandler=FATAL
    log4j.logger.org.apache.hadoop.hive.ql.exec.FunctionRegistry=ERROR
    

    1、全局应用设置

    针对spark所有应用,可以在Java工程目录中新建/src/main/resources目录,把log4j.properties放置该目录。
    在这里插入图片描述

    log4j.properties生成:

    1. Spark中conf默认配置文件是log4j.properties.template,可以将其改名为log4j.properties;
    2. 将Spark-core包中的log4j-default.properties内容复制到log4j.properties文件。

    log4j内容如下:

    #  
        # Licensed to the Apache Software Foundation (ASF) under one or more  
        # contributor license agreements.  See the NOTICE file distributed with  
        # this work for additional information regarding copyright ownership.  
        # The ASF licenses this file to You under the Apache License, Version 2.0  
        # (the "License"); you may not use this file except in compliance with  
        # the License.  You may obtain a copy of the License at  
        #  
        #    http://www.apache.org/licenses/LICENSE-2.0  
        #  
        # Unless required by applicable law or agreed to in writing, software  
        # distributed under the License is distributed on an "AS IS" BASIS,  
        # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.  
        # See the License for the specific language governing permissions and  
        # limitations under the License.  
        #  
          
        # Set everything to be logged to the console  
        log4j.rootCategory=WARN, console  
        log4j.appender.console=org.apache.log4j.ConsoleAppender  
        log4j.appender.console.target=System.err  
        log4j.appender.console.layout=org.apache.log4j.PatternLayout  
        log4j.appender.console.layout.ConversionPattern=%d{yy/MM/dd HH:mm:ss} %p %c{1}: %m%n  
          
        # Settings to quiet third party logs that are too verbose  
        log4j.logger.org.spark-project.jetty=WARN  
        log4j.logger.org.spark-project.jetty.util.component.AbstractLifeCycle=ERROR  
        log4j.logger.org.apache.spark.repl.SparkIMain$exprTyper=INFO  
        log4j.logger.org.apache.spark.repl.SparkILoop$SparkILoopInterpreter=INFO  
        log4j.logger.org.apache.parquet=ERROR  
        log4j.logger.parquet=ERROR  
          
        # SPARK-9183: Settings to avoid annoying messages when looking up nonexistent UDFs in SparkSQL with Hive support  
        log4j.logger.org.apache.hadoop.hive.metastore.RetryingHMSHandler=FATAL  
        log4j.logger.org.apache.hadoop.hive.ql.exec.FunctionRegistry=ERROR
    

    在开发工程中,我们可以设置日志级别为WARN,即:
    log4j.rootCategory=WARN, console

    2、局部应用设置日志输出级别

    针对SparkContext应用,Spark有专门的api设置日志级别,如下:
    上述方法,只针对SparkContext相关的应用,而对Spark Streaming等应用无效果。

    import org.apache.log4j.{ Level, Logger }
    
    Logger.getLogger("org").setLevel(Level.WARN)
    
    Logger.getLogger("org.apache.spark").setLevel(Level.WARN)
    
    Logger.getLogger("org.eclipse.jetty.server").setLevel(Level.WARN)
    
    spark.sparkContext.setLogLevel("WARN")
    

    3、Spark log4j.properties配置详解与实例(摘录于铭霏的记事本)

    ################################################################################ 
    #①配置根Logger,其语法为: 
    # 
    #log4j.rootLogger = [level],appenderName,appenderName2,... 
    #level是日志记录的优先级,分为OFF,TRACE,DEBUG,INFO,WARN,ERROR,FATAL,ALL 
    ##Log4j建议只使用四个级别,优先级从低到高分别是DEBUG,INFO,WARN,ERROR 
    #通过在这里定义的级别,您可以控制到应用程序中相应级别的日志信息的开关 
    #比如在这里定义了INFO级别,则应用程序中所有DEBUG级别的日志信息将不被打印出来 
    #appenderName就是指定日志信息输出到哪个地方。可同时指定多个输出目的 
    ################################################################################ 
    ################################################################################ 
    #②配置日志信息输出目的地Appender,其语法为: 
    # 
    #log4j.appender.appenderName = fully.qualified.name.of.appender.class 
    #log4j.appender.appenderName.optionN = valueN 
    # 
    #Log4j提供的appender有以下几种: 
    #1)org.apache.log4j.ConsoleAppender(输出到控制台) 
    #2)org.apache.log4j.FileAppender(输出到文件) 
    #3)org.apache.log4j.DailyRollingFileAppender(每天产生一个日志文件) 
    #4)org.apache.log4j.RollingFileAppender(文件大小到达指定尺寸的时候产生一个新的文件) 
    #5)org.apache.log4j.WriterAppender(将日志信息以流格式发送到任意指定的地方) 
    # 
    #1)ConsoleAppender选项属性 
    # -Threshold = DEBUG:指定日志消息的输出最低层次 
    # -ImmediateFlush = TRUE:默认值是true,所有的消息都会被立即输出 
    # -Target = System.err:默认值System.out,输出到控制台(err为红色,out为黑色) 
    # 
    #2)FileAppender选项属性 
    # -Threshold = INFO:指定日志消息的输出最低层次 
    # -ImmediateFlush = TRUE:默认值是true,所有的消息都会被立即输出 
    # -File = C:log4j.log:指定消息输出到C:log4j.log文件 
    # -Append = FALSE:默认值true,将消息追加到指定文件中,false指将消息覆盖指定的文件内容 
    # -Encoding = UTF-8:可以指定文件编码格式 
    # 
    #3)DailyRollingFileAppender选项属性 
    # -Threshold = WARN:指定日志消息的输出最低层次 
    # -ImmediateFlush = TRUE:默认值是true,所有的消息都会被立即输出 
    # -File = C:log4j.log:指定消息输出到C:log4j.log文件 
    # -Append = FALSE:默认值true,将消息追加到指定文件中,false指将消息覆盖指定的文件内容 
    # -DatePattern='.'yyyy-ww:每周滚动一次文件,即每周产生一个新的文件。还可以按用以下参数: 
    #              '.'yyyy-MM:每月 
    #              '.'yyyy-ww:每周 
    #              '.'yyyy-MM-dd:每天 
    #              '.'yyyy-MM-dd-a:每天两次 
    #              '.'yyyy-MM-dd-HH:每小时 
    #              '.'yyyy-MM-dd-HH-mm:每分钟 
    # -Encoding = UTF-8:可以指定文件编码格式 
    # 
    #4)RollingFileAppender选项属性 
    # -Threshold = ERROR:指定日志消息的输出最低层次 
    # -ImmediateFlush = TRUE:默认值是true,所有的消息都会被立即输出 
    # -File = C:/log4j.log:指定消息输出到C:/log4j.log文件 
    # -Append = FALSE:默认值true,将消息追加到指定文件中,false指将消息覆盖指定的文件内容 
    # -MaxFileSize = 100KB:后缀可以是KB,MB,GB.在日志文件到达该大小时,将会自动滚动.如:log4j.log.1 
    # -MaxBackupIndex = 2:指定可以产生的滚动文件的最大数 
    # -Encoding = UTF-8:可以指定文件编码格式 
    ################################################################################ 
    ################################################################################ 
    #③配置日志信息的格式(布局),其语法为: 
    # 
    #log4j.appender.appenderName.layout = fully.qualified.name.of.layout.class 
    #log4j.appender.appenderName.layout.optionN = valueN 
    # 
    #Log4j提供的layout有以下几种: 
    #5)org.apache.log4j.HTMLLayout(以HTML表格形式布局) 
    #6)org.apache.log4j.PatternLayout(可以灵活地指定布局模式) 
    #7)org.apache.log4j.SimpleLayout(包含日志信息的级别和信息字符串) 
    #8)org.apache.log4j.TTCCLayout(包含日志产生的时间、线程、类别等等信息) 
    #9)org.apache.log4j.xml.XMLLayout(以XML形式布局) 
    # 
    #5)HTMLLayout选项属性 
    # -LocationInfo = TRUE:默认值false,输出java文件名称和行号 
    # -Title=Struts Log Message:默认值 Log4J Log Messages 
    # 
    #6)PatternLayout选项属性 
    # -ConversionPattern = %m%n:格式化指定的消息(参数意思下面有) 
    # 
    #9)XMLLayout选项属性 
    # -LocationInfo = TRUE:默认值false,输出java文件名称和行号 
    # 
    #Log4J采用类似C语言中的printf函数的打印格式格式化日志信息,打印参数如下: 
    # %m 输出代码中指定的消息 
    # %p 输出优先级,即DEBUG,INFO,WARN,ERROR,FATAL 
    # %r 输出自应用启动到输出该log信息耗费的毫秒数 
    # %c 输出所属的类目,通常就是所在类的全名 
    # %t 输出产生该日志事件的线程名 
    # %n 输出一个回车换行符,Windows平台为“
    ”,Unix平台为“
    ” 
    # %d 输出日志时间点的日期或时间,默认格式为ISO8601,也可以在其后指定格式 
    #    如:%d{yyyy年MM月dd日 HH:mm:ss,SSS},输出类似:2012年01月05日 22:10:28,921 
    # %l 输出日志事件的发生位置,包括类目名、发生的线程,以及在代码中的行数 
    #    如:Testlog.main(TestLog.java:10) 
    # %F 输出日志消息产生时所在的文件名称 
    # %L 输出代码中的行号 
    # %x 输出和当前线程相关联的NDC(嵌套诊断环境),像java servlets多客户多线程的应用中 
    # %% 输出一个"%"字符 
    # 
    # 可以在%与模式字符之间加上修饰符来控制其最小宽度、最大宽度、和文本的对齐方式。如: 
    #  %5c: 输出category名称,最小宽度是5,category<5,默认的情况下右对齐 
    #  %-5c:输出category名称,最小宽度是5,category<5,"-"号指定左对齐,会有空格 
    #  %.5c:输出category名称,最大宽度是5,category>5,就会将左边多出的字符截掉,<5不会有空格 
    #  %20.30c:category名称<20补空格,并且右对齐,>30字符,就从左边交远销出的字符截掉 
    ################################################################################ 
    ################################################################################ 
    #④指定特定包的输出特定的级别 
    #log4j.logger.org.springframework=DEBUG 
    ################################################################################ 
    
    
    #OFF,systemOut,logFile,logDailyFile,logRollingFile,logMail,logDB,ALL 
    log4j.rootLogger =ALL,systemOut,logFile,logDailyFile,logRollingFile,logMail,logDB 
    
    
    #输出到控制台 
    log4j.appender.systemOut = org.apache.log4j.ConsoleAppender 
    log4j.appender.systemOut.layout = org.apache.log4j.PatternLayout 
    log4j.appender.systemOut.layout.ConversionPattern = [%-5p][%-22d{yyyy/MM/dd HH:mm:ssS}][%l]%n%m%n 
    log4j.appender.systemOut.Threshold = DEBUG 
    log4j.appender.systemOut.ImmediateFlush = TRUE 
    log4j.appender.systemOut.Target = System.out 
    
    
    #输出到文件 
    log4j.appender.logFile = org.apache.log4j.FileAppender 
    log4j.appender.logFile.layout = org.apache.log4j.PatternLayout 
    log4j.appender.logFile.layout.ConversionPattern = [%-5p][%-22d{yyyy/MM/dd HH:mm:ssS}][%l]%n%m%n 
    log4j.appender.logFile.Threshold = DEBUG 
    log4j.appender.logFile.ImmediateFlush = TRUE 
    log4j.appender.logFile.Append = TRUE 
    log4j.appender.logFile.File = ../Struts2/WebRoot/log/File/log4j_Struts.log 
    log4j.appender.logFile.Encoding = UTF-8 
    
    
    #按DatePattern输出到文件 
    log4j.appender.logDailyFile = org.apache.log4j.DailyRollingFileAppender 
    log4j.appender.logDailyFile.layout = org.apache.log4j.PatternLayout 
    log4j.appender.logDailyFile.layout.ConversionPattern = [%-5p][%-22d{yyyy/MM/dd HH:mm:ssS}][%l]%n%m%n 
    log4j.appender.logDailyFile.Threshold = DEBUG 
    log4j.appender.logDailyFile.ImmediateFlush = TRUE 
    log4j.appender.logDailyFile.Append = TRUE 
    log4j.appender.logDailyFile.File = ../Struts2/WebRoot/log/DailyFile/log4j_Struts 
    log4j.appender.logDailyFile.DatePattern = '.'yyyy-MM-dd-HH-mm'.log' 
    log4j.appender.logDailyFile.Encoding = UTF-8 
    
    
    #设定文件大小输出到文件 
    log4j.appender.logRollingFile = org.apache.log4j.RollingFileAppender 
    log4j.appender.logRollingFile.layout = org.apache.log4j.PatternLayout 
    log4j.appender.logRollingFile.layout.ConversionPattern = [%-5p][%-22d{yyyy/MM/dd HH:mm:ssS}][%l]%n%m%n 
    log4j.appender.logRollingFile.Threshold = DEBUG 
    log4j.appender.logRollingFile.ImmediateFlush = TRUE 
    log4j.appender.logRollingFile.Append = TRUE 
    log4j.appender.logRollingFile.File = ../Struts2/WebRoot/log/RollingFile/log4j_Struts.log 
    log4j.appender.logRollingFile.MaxFileSize = 1MB 
    log4j.appender.logRollingFile.MaxBackupIndex = 10 
    log4j.appender.logRollingFile.Encoding = UTF-8 
    
    
    #用Email发送日志 
    log4j.appender.logMail = org.apache.log4j.net.SMTPAppender 
    log4j.appender.logMail.layout = org.apache.log4j.HTMLLayout 
    log4j.appender.logMail.layout.LocationInfo = TRUE 
    log4j.appender.logMail.layout.Title = Struts2 Mail LogFile 
    log4j.appender.logMail.Threshold = DEBUG 
    log4j.appender.logMail.SMTPDebug = FALSE 
    log4j.appender.logMail.SMTPHost = SMTP.163.com 
    log4j.appender.logMail.From = xly3000@163.com 
    log4j.appender.logMail.To = xly3000@gmail.com 
    #log4j.appender.logMail.Cc = xly3000@gmail.com 
    #log4j.appender.logMail.Bcc = xly3000@gmail.com 
    log4j.appender.logMail.SMTPUsername = xly3000 
    log4j.appender.logMail.SMTPPassword = 1234567 
    log4j.appender.logMail.Subject = Log4j Log Messages 
    #log4j.appender.logMail.BufferSize = 1024 
    #log4j.appender.logMail.SMTPAuth = TRUE 
    
    
    #将日志登录到MySQL数据库 
    log4j.appender.logDB = org.apache.log4j.jdbc.JDBCAppender 
    log4j.appender.logDB.layout = org.apache.log4j.PatternLayout 
    log4j.appender.logDB.Driver = com.mysql.jdbc.Driver 
    log4j.appender.logDB.URL = jdbc:mysql://127.0.0.1:3306/xly 
    log4j.appender.logDB.User = root 
    log4j.appender.logDB.Password = 123456 
    log4j.appender.logDB.Sql = INSERT INTOT_log4j(project_name,create_date,level,category,file_name,thread_name,line,all_category,message)values('Struts2','%d{yyyy-MM-ddHH:mm:ss}','%p','%c','%F','%t','%L','%l','%m')
    
  • 相关阅读:
    ARCDesktop 学习笔记(一) 添加地图图层
    ARCGIS 开发常用技巧参考
    关于引用动软代码 找不到dll命名空间问题
    银行转账手续费
    Silverlight 笔记
    地图API
    (转)使用ImageBrush替换PictureMarkerSymbol以加强graphic显示性能
    WPF 网摘
    ArcCatalog添加GISserverIP问题
    ARCGIS 10 中文版 3D Analyst Tools等未授权问题
  • 原文地址:https://www.cnblogs.com/aixing/p/13327370.html
Copyright © 2020-2023  润新知