flink-demo2

package cn.irisz.steam

import org.apache.flink.api.common.RuntimeExecutionMode
import org.apache.flink.streaming.api.scala._
import org.apache.flink.table.api.{EnvironmentSettings, TableResult}
import org.apache.flink.table.api.bridge.scala.StreamTableEnvironment

object Demo2 {
  def main(args: Array[String]): Unit = {
    // 1. env
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    env.setRuntimeMode(RuntimeExecutionMode.BATCH)
    env.setParallelism(1)
    val settings = EnvironmentSettings.newInstance().useBlinkPlanner().inStreamingMode().build()
    val tEnv = StreamTableEnvironment.create(env, settings)

    // 2. source
    // val fileSource: DataStream[String] = env.readTextFile("data/aceess.log_20200914.csv")
    tEnv.executeSql(
      """
        |CREATE TABLE log (
        |   `id` Int,
        |   `i_city` String,
        |   `i_country` String,
        |   `i_isp` String,
        |   `i_province` String,
        |   `ip` String,
        |   `length` BigInt,
        |   `method` String,
        |   `referer` String,
        |   `status_code` Int,
        |   `t_hour` Int,
        |   `t_minute` Int,
        |   `t` TIMESTAMP,
        |   `ua` String,
        |   `url` String,
        |   `url_param` String,
        |   `url_path` String,
        |   `version` String,
        |   `xff` String
        |)WITH (
        |   'connector' = 'filesystem',
        |   'path' = 'data/aceess.log_20200914.csv',
        |   'format' = 'csv'
        |)
        |""".stripMargin)

    tEnv.executeSql(
      """
        |CREATE TABLE `result` (
        |   `t_hour` Int,
        |   `t_minute` Int,
        |   `cnt` BigInt
        |) WITH (
        |   'connector' = 'print'
        |)
        |""".stripMargin)

    // 3. transfer

    // 4. sink
//    logStream.print()
val result: TableResult = tEnv.sqlQuery(
  """
    |   SELECT t_hour, t_minute, COUNT(1) AS cnt
    |   FROM log
    |   WHERE status_code = 200
    |   GROUP BY t_hour, t_minute
    |""".stripMargin).execute()

    result.print()

    // 5. execute
    env.execute("calc log count for minute and hour").wait()
//    tEnv.execute("calc log count for minute and hour")
  }
}

相关阅读:
实验室 Linux 集群的管理常用命令
python操作MySQL数据库
python 文件操作总结
MySQL常用的操作整理
机器学习模型数据结构：logistic regression, neural network, convolutional neural network
Python并发编程之线程池/进程池--concurrent.futures模块
python3.5实现购物车
Centos上安装python3.5以上版本
[Python]关于return逻辑判断和短路逻辑
[Python]返回函数，装饰器拾遗

原文地址：https://www.cnblogs.com/zpzhue/p/14948086.html