一. 前言
由于参与的相关可视化项目进展到飞行轨迹的聚类算法部分,于是阅读了部分相关论文,并做了一些摘要。
论文均来源与中国知网,均将申明出处。
二. 论文出处
《基于谱聚类的终端区飞行轨迹分析》
马 勇,胡明华,顾 欣,袁立罡
( 南京航空航天大学民航学院,江苏 南京 210016)
航空计算技术,第45卷,第5期,2015年9月
三. 论文笔记
1.摘要:为了实现智能化处理海量航班数据,精细描述终端区运行特性,研究了基于谱聚类的终端区飞行轨迹分析方法。在分析终端区航班飞行特点的基础上,提出基于航向因子修正的欧式距离轨迹相似度计算方法; 利用高斯核函数对相似度矩阵进行平滑降噪处理,实现了函数中规模参数的自动化选取; 采用改进谱聚类算法对终端区飞行轨迹进行聚类划分。
2.核心:飞行,轨迹,聚类,谱聚类算法
3.思路笔记
3.1 轨迹由离散的点组成,以单个航班的轨迹作为聚类的基本单位,据算不同轨迹间的相似度
3.2 对雷达数据预处理、筛选,选出轨迹集,且轨迹集的轨迹等长,每一条轨迹的时间归一化 [0,1]
3.3 两条轨迹逐点对计算等角航线距离,取均值衡量轨迹之间的欧式距离相似性
3.4 对两条轨迹ti,tj,点对如下,相似度Sij = Sji,计算公式为
D(x)为方差,Δ代表航向对两条轨迹相似度的修正值(论文中代表两条轨迹中距离小雨1 n mile,但夹角大于10°的点对的个数),根据上式计算得到差异度矩阵S
3.5* 亲和度矩阵的得到,高斯降噪(参数选取)
3.6 基于亲和度矩阵的K-means聚类,2个参数,亲和度矩阵A,聚类个数k
a) 计算A中各行之和,构造对角矩阵D,即
然后构造规范亲和矩阵L
b) 前K个大特征值对应的特征向量构造矩阵Vnxk
c) V归一化为单位矩阵Z
d) Z中每一行作为一个点K-means聚类(根据聚类结果将轨迹集 T 中轨迹划分到不同的类中。当Z中的第i行被划分到类c中时,轨迹集T中第i条轨迹也相应的被划分到类c中)
3.7 矩阵L特征值分布可以确定K(对于算法第1步中求出的矩阵L,若该有限数据集中存在K个理想的彼此分离的簇,则L的前K个大特征值为1,第K + 1个特征值严格小于1)
四. 论文结果演示
以2014年3月8号广州白云机场终端区的飞行数据为例,用上述算法聚类。
轨迹数据预处理时间间隔0.01s,每条轨迹101点组成点序列描述。
考虑到进场和离场分别有 8 条和 5 条进离场程序,选择进场聚类数目 k = 8,离场聚类数目 k = 5。根据以上参数,采用上节中提出的改进 k-means 算法对选取的前 k 个特征向量进行聚类, 将 455 条原始进场飞行轨迹分为 8 类,将 439 条原始离场飞行轨迹分为 5类,聚类结果如图 1 和图 2 所示。由图可见, 算法实现了对终端区全部轨迹的明确划分,各个分类结果能够准确描述每类飞行轨迹的特征。