一,
日志文件,每一行形如:
2.051 NONE - 1.1.1.1 "-" www.example.com /data/small.jpg GET "Tengine<||>-" 404 "-" "Mozilla/5.0 (Windows NT 6.1; rv:37.0) Gecko/20100101 Firefox/37.0" "zh-CN,zh;q=0.5<||>-" "-"
每一行包含十几列,每列由空格隔开。
由于部分列本身可能存在空格,这时该列会用额外的双引号 "" 包含起来。
尝试用自己熟悉的语言,编写一个函数,实现日志解析,提取每一列。
Python 和 C 语言实现最佳,也可提供多个版本(不使用第三方库)。
评价指标
- 准确性
- 可读性
- 防御性编程(容错、健壮性、异常处理)
- 复杂度、性能
二。代码