1. 引言
0x1:从模糊数学之父, Lotfi Aliasker Zadeh说起
1965年,身为控制论专家的扎德教授提出了模糊集合论。数学是人工智能的基础,扎德的目的是要从数学基础上来为人工智能的发展开辟道路。
经典集合论只能表达精确概念,刻板的程序使计算机在识别和控制上无法模拟人脑在识别和控制中由于使用模糊词句而带有的灵活机动性。
要想改变这种状况,必须用数学描写模糊概念,从外延上把精确集合扩展成模糊集合。
模糊数学的意义在于:
- 概念是思维的单元。模糊集合论使计算机通达人的生活概念,就可以进一步通达人的思维,这就为人工智能的发展找到了一个合适的突破口;
- 模糊数学为人类架起了一座连接定性与定量的桥梁,人文和社会科学工作者都从模糊数学获益,这就使人工智能冲破了定性知识的禁区,扫除了应用的死角,得以全方位地发展;
- 语言是思维的工具,扎德利用模糊数学来搞词计算,把人工智能的研究引入核心战场。
0x2:不确定性理论与多传感器数据融合理论的由来
为了更好地获取复杂的、关键的形势信息,人们会将多个传感器组合起来使用。
不仅是在物理世界领域,在信息技术的各个领域(包括网络安全),我们经常性地开发新技术,这些技术允许即使在最恶劣的条件下也可以研究更多事物,看得更远、更准确、更可靠。
伴随着传感器数量和采集能力的增加,由此产生的信息量及其多样性超出了人类的大脑理解能力,人类大脑可以对少量几个核心因素进行综合考虑,但无法对数百个乃至海量的高维向量进行综合处理。
另一个需要考虑的主要趋势是,在各种独立部件必须智能交互的日益复杂的系统中,集成越来越多的传感器。用于防御目的开发“系统的系统”就是这样的情形,特别是在网络中心战中,其目的是将观察、指挥和控制的一切手段网络化。
另一个例子是安全性,其国土安全的概念已经逐渐演变成全球安全,其中包括监视、信息、决策支持和保障手段的联合,没有地域国界之分。所有这些系统的部署均需要来自一组截然不用且独立的观察而收集到的大范围的非常具体的信息,然后这些信息会以满足使用需求的适当形式进行传输。
自主的“智能”系统也代表着主要进展的领域。无论是就一般的机器人技术而言,还是更具体的陆上、空中或海上飞机的资助部署而言,系统的自主决策权依赖于关键的观察数据及其环境的解释。系统需要实现的功能非常多样化:
- 导航
- 观测
- 侦查
- 规划
- 干预
在这些场景中,往往需要一个高层次的感知能力的发展,能够提供可能遇到非常多变情况下的详细的认识,这通常需要基于不充分的观察数据。
决策支持是问题多样性和复杂性需要不断进步的另一个领域。无论是在医学诊断、专业技术、情报、安全业务支持还是监视方面,目的是使用通常难以解释的多种观察数据,重建定义不清的认知数据。
0x3:解决大量复杂因素不确定问题的理论发展分支
在所有的应用领域中,需要协作处理大量的多维度因素,尤其是性质和质量方面都不同的因素。因此,基于现有的目标设计出能够适应输入数据不完善的处理技术很有用。
同时,不完善的因素非常多元化,正如每个观察数据都有其优点和弱点一样,这取决于如何利用它。例如:
- 一个定义欠佳的事件的不确定性
- 一个难以估计的值的不准确性
- 部分不可观察的现象的不完整性
- 由于使用条件限制导致的可靠性缺乏
因此,一个特定的数据处理技术的质量直接关系到其处理各级信息缺陷的能力,以便更充分和更好地利用真正有意义的内容而不会被不完善的知识所迷惑,无论其采用何种形式。解决这一问题的一个核心理论就是“不确定性理论”。
1、概率论模型 -- 解决不确定性问题的首次尝试
这些理论中最古老的、目前最广泛使用于商业系统的是概率论。概率论专门处理不确定性,即评估事件发生的可能性,使用相对简单。但是其局限性也非常明显,其中最大的点就在于“难以产生可靠的概率模型”。
每个概率论模型都有其对应的前提假设(例如.i.i.d.独立同分布假设),只有满足了对应的前提假设后,概率模型才能对目标问题进行正确的“建模”,模型的预测结果才具有可解释意义。
很多时候,概率模型在特定场景下失效,并不是概率论模型本身或者计算过程有问题,而是使用了错误的前提假设。
2、模糊集理论
另一种理论就是“模糊集”理论,由Zedeh于1965年以同名的开创性文章[ZAD65]创立。这一相对容易理解的理论较好地补充了先前的理论,皆在应对所使用值的不精确性,即只有这些值的大概的认识。这一可用于高度非线性或难以识别系统的推理以及鲁棒控制的技术,由于其易于使用且能够即刻自然考虑可用数据的事实,迅速变得非常成功。
Zedeh以此作为他的可能性理论创建的基础。可能性理论专门致力于处理事件的不确定性。模糊集理论比概率论更灵活,并与理论设计的不确定性处理完美兼容,这一方法使得用户能够通过适应可用知识来管理复杂的推理过程。
3. Dempster-Shafer证据理论
Dempster在1967年发表了一篇“由一个多值映射引起的上下概率”的早期研究论文,以该研究为跳板,Shafer于1976年在他的《证据数学理论》一书中奠定了可信度函数理论的基石。
这一理论较之先前的理论,在不确定性和不精确性的充分分析方面更加有影响力。在D-S证据理论中,“概率”和“可能性”是可信度函数的两种不同的具体例子,这就使得这一理论成为共同处理多样性数据的一个普遍的和总体的框架。
4. 多传感器数据融合理论
多传感器数据融合理论完美地契合了数据融合的关注点,数据融合的研究使得科学界自 1998 年信息融合的国际协会成立以来定期聚在一起,其年度会议“融合”以及信息融合的国际期刊也具有越来越多的影响力。
Relevant Link:
不确定性理论与多传感器数据融合 阿兰•阿皮诺 https://www.cnblogs.com/huadongw/p/7497946.html
2. 使用多传感器数据融合的考量因素
为什么我们需要寻求研究多个传感器的组合,它们都有哪些具体的考量因素和对应的挑战呢?
0x1:信噪比方面的考量和成本因素的挑战
使用多传感器的第一个优势可能是,可以使用多个相同的传感器以提升其性能。然而,如果 n 个传感器在相同的信噪比条件下提供相同的估值,那么这 n 个传感器联合起来使用充其量将导致信噪比产生的增益,同时导致结果系统的所有因素(成本、重量、体积等)要乘以一个接近于 n 的因子。
此外,在这种情况下,往往有可用的更简单和更有效的解决方案,即基于从单个传感器获得数据的时间积分得到的特别的解决方案。
这一例子强调的事实是,多传感器的组合使用,仅仅是在其具有无可辩驳的优势时,即在单个传感器无法提供信息生成的特定条件下。
0x2:鲁棒性方面的考量
多传感器的第二个好处是,它们在任意观察环境中的鲁棒性,这通常是选择使用这类系统的决定性因素。
例如,系统可能对干扰不那么敏感,无论是人为的(例如特定波长的干扰信号、无用的花指令),或是自然的(例如影响测量的大气因素)。
当观察环境或条件妨碍单个传感器工作而如果同时使用多个观察设备又不具有相同效果的情况下,多传感器系统却具有可以正常工作的能力。
除此之外,用某些数据来训练给定传感器,识别出的与目标相关的对象,也有一些代表性的问题。如果所使用的训练数据并不具有代表性,识别目标对象的唯一方案是交叉访问来自不同传感器的数据。
0x3:信息收集多维度方面的考量
多传感器的第三个好处是,收集信息的敏锐性和丰富性。
例如,一个传感器可能不依赖于其大小而基于转动件的特征来区分目标,而另一个传感器不能够观察到这些特征,却通过大小进行区分。
类似地,能够提供良好测距的雷达和带有良好角分辨率的无源光学器件的多普勒成像仪的联合,能够在四维空间产生细粒度的分析结果,这些维度是位置、方向、距离和多普勒效应。某些传感器的部分不可得的数据,也可以通过另一个传感器的数据进行补偿。
这些传感器各自独特的观察角度的联合,将很明显地有助于细化最终的分类,即所谓的高维多元线性分类器理论上可以无限逼近任意目标函数。
多传感器带来的多维度探测能力还有另一个优势,每个不同的传感器可以并行地专注于适合自身能力的特定的职责,随后通过采集和处理的协同工作优化整个系统的反应性。
例如,雷达可以很容易地用简单的波形对空间进行快速的“预筛分(具有高检出率和高虚警率的检视)“,从而显著降低光电子识别系统的识别压力,相当于起到了一层信息过滤层的作用。
3. 面临的挑战和问题
0x1:复杂的应用场景
实际上,不同传感器的组合使用可能对两类目标有用:
- 离散集区分:针对检测、提取、分类、识别、鉴定、计数或更普遍的诊断功能的情形
- 估算连续集的变量:例如定位、追踪、导航,或者更一般的计量(基于观测的定量描述)功能
在这两种情况下,融合算法不仅要尽可能地利用所有可用信息的丰富性,而且也要满足日趋复杂系统因不同观测方式的联合所产生的高层次的操作需求。
0x2:数据诠释与建模方面的挑战
1、异构理论框架下数据融合中的数据不一致问题
融合过程中的数据输入来自于传感器的输出,例如:
- 尺寸
- 信号
- 图像
- 某一时间段内进程启动日志
- 某一段时间内网络flow日志
同时所有有帮助的知识均从这些数据中收益,例如资料库、专家知识、先验特征、或者先期或在线识别模式,无论它们是动态的、统计的、描述性的或者行动性的。
因此,这些数据非常多样化,这里的多样化包括:
- 语境语义的多样化:不同的传感器由于其所处环境、采集对象的不同,所采集到的信号所代表的的语境是不同的
- 各个传感器所采集数据的用途不同
- 不充足性的不一致:多传感器系统的运行过程中,必须不断融合”有用数据“和”不良数据“。然而,好的和坏的数据的简单组合总是会产生不准确的结果,因为坏数据”污染“了好数据。因此,需要不断地使用所有可用的信息,不论是外衍或者是系统内生的,并据此在理论框架内对其建模,以此来在运行时中不断评估和修正来自不同传感器的观察数据,并基于其相关性加以利用。
当然,凡是都有两面,多传感器融合进一步增加了需要整合的信息的复杂性和容量,反过来又进一步增加了处理的复杂性。实时操作必须要求反映迅捷度方面的目标,通常与”在线处理能力“参数相关。因此,在数据融合处理方面的一个关键目标是在确保所需收益的复杂性和适应操作限制的简单性之间寻求折中。
2、数据的不确定和不精确问题
- 不确定性表示对所发生的事件缺乏了解(如可能会下雨)
- 不精确性表示不能准确知道其数值(如海流速度的估计)
不确定性是由于系统训练不充分或不适当;不精确性通常是由于传感器采集端的灵敏度不足或近似的描述。
3、数据不完整
多传感器的数据通常也是不完整的,因为系统没有进行所有必要的训练,或者关注事件暂时不可观察。
某些需要的特性因此也不能基于适当的观察值直接进行评估,而必须基于其他可用信息尽可能地近似。
4、不同信息片断的异质性
除了考虑信息的不同性质,还需要考虑不同信息片断各自缺陷的异质性。因此,这些信息片断必须在相同的总的理论框架内共同处理。
0x3:可靠性方面的挑战
由于数据融合的主要目的是通过使用一个或多个其他的传感器来补偿某个传感器的缺陷,当遇到的一个或多个信息段不可靠时,必须尽可能地确保高质量的信息段不能被错误地污染。这是非常重要的,因为当一个好的和差的信息段不小心融合后,结果通常继承的是两者质量水平中差的那个。
因此,这一目标只有在系统对不同信源的相对可靠性具有足够的知识,并能够有效地利用该知识时才能实现。这就提出了基于附加信息尽可能地准确地进行可靠性评估的问题,或者预先编译或实时获取关于背景和环境的信息。
这种附加信息必须在合适的理论框架中进行处理,通过将附加信息有效的嵌入到合适的理论框架(理论前提假设)中,我们得以处理新信息中提供的或多或少的不确定性。
此外,重要的是融合过程可确保有关可靠性的信息集成在观测过程中。
考虑到这一点,需要确定适当的处理体系结构,并采用合适的运算以校正基于每个知识片段相关性的观察所得出的知识。即需要基于一定的策略和规则,给不同的知识片断以不同的权重。
在融合过程中,还必须对不同信息片段作用于处理最后结论的效果进行排序,基于其特异性对目标问题的功效,鉴于该信息演变的潜力(背景、要求等)。
0x4:异构理论框架下知识传播与迁移方面的挑战
如前所述,输入数据的必然的多样性,意味着在对那些数据建模时,必须使用适合于特定不同数据的理论集。但这里可能会面临一些挑战:
- 一方面,为了能够支持最终决策,必须将可用的知识在最终决策层归为合乎决策的统一集合,这一集合必然高于输入集。
- 另一方面,复杂系统中的许多资源汇集在一起并且不同层次的资源彼此相互影响。同一个信息段可能用于不同的目的,这就要求我们采用不同的理论框架,来对在不同语境下的同一个信息段进行建模
- 最后,为了执行可操作的系统,有必要考虑环境可能同时发生的演变,不同时刻会产生不同的观测信息。因此,能够在某一时间在给定的集合内观察可用的知识片段,并在同一个集合内使用可能随时间演变的情况模型,并将其转换到稍后的时间段是有用的。
所有这一切暗示着有必要发展将某个集合中的给定知识片段转移到第二个不同的集合中的能力。这种转移当然只有在第二个集合中的元素与第一个的链接关系已知时才有可能。然而,一般情况下,由可获得的专业知识给出的关系定义是不确定或不精确的,并且需要在执行过程中考虑。
0x5:模糊数据匹配(不同传感器视角下的同一对象的联合)方面的挑战
由多个传感器观测的单一对象,通常由其各自在针对该对象的集合内进行分析。因此,使用不同传感器获取到对象的不同视图,通过比较对比这些视图,系统能够获得关于它的更准确的描述。
但是,当同时观测大量对象时,问题开始变得复杂。
在这种情况下,困难在于正确地组合每一个传感器对同一个对象的观测数据,确保只融合了关于该特定对象的数据。
这里我们举两个典型的例子,来更好地说明这种挑战,值得说明的是,这些例子本身都是抽象性的,意味着它们是可以迁移到其他具体的场景中的,比如网络安全,笔者会在讨论中建立二者之间的联系。
1、空间模糊数据匹配问题
第一个问题是空间模糊数据匹配,也称为“去重影”。
例如,假设两个远程无源传感器,共同观察一个处于穿过这两个传感器所在平面的目标,然后每个传感器报告检测目标的方位角,被观测的目标通过三角测量定位,即传感器报告的两个方向的交叉点。
但是,如果观测平面上出现了2个目标,那么每个传感器就会报告2个方位角,这样三角测量就发现4个交叉点。这些交叉点中的其中2个对应了目标的实际位置,而另外2个则是虚像,也称为“重影”。
融合系统所要做的事就是,尽力消除这两个虚像以明确确定两个目标的位置。
笔者插入:
“重影问题”在网络安全入侵检测中非常常见。作为系统行为日志采集器的传感器,时刻处于观测状态,而同一时刻,由攻击者引起的异常行为和系统自身运行的合法软件,都可能会产生大量的观测结果,这些观测结果之间互相产生“重影”,典型的表现就是,很难精确统计出不同观测对象的概率分布。
2、暂时的模糊数据融合问题
第二个问题是暂时的模糊数据融合,也称为“去残影”。
假设某一个传感器在给定时刻检测到两个邻近的移动目标,而另一个传感器存在一定的时延,即在不同的时刻,也检测到了两个邻近的移动目标。显然,由于目标在这段延迟的时间窗口中已经移动过了,所以第二个传感器检测到的位置一定不同于第一个传感器的检测。
现在问题就变成了,如何确定来自第一个和第二个传感器对同一个目标的检测,哪个与事实更相符?是否可以融合起来成为一个统一的结论?
一般来说,模糊数据融合要求审查可用信息,以识别可能反映观测数据相似性特征的资料,目的是匹配数据。不幸的是,一般情况下,当孤立考查数据片段时,现有的数据不足以可靠地确定其正确的联合,只有通过共同地使用众多不完善的信息片段,处理才有效果。在对这些数据建模时必须考虑到由此产生的不确定性,并在处理时进行匹配。
笔者插入:
“残影问题”在网络安全领域中同样非常常见,我们知道,基础安全入侵检测中最重要的一个概念就是“攻击链路(killchain)”,攻击链路是一个串行的时序概念,攻击并不是在一瞬间完成的,而是按照一定的逻辑、时序顺序,在一个不固定长度的时间窗口内完成的。同时,HIDS/NIDS中的采集器分署于不同的系统模块中,它们就像上文中提到的“错位的传感器”那样,对同一个killchain对象,不同的采集器所采集的日志是存在时延,甚至时间断层的。这就对多传感器的异构日志融合带来了不小的挑战。
0x6:信源组合方面的挑战
1、组合运算 -- 多源信源融合的方法论
信源组合是数据融合过程中的核心。因此,自然地成为主要困难的焦点。
正如前面章节讨论的,我们根据所考察数据的不同性质和质量要求,使用最合适的理论形式对每条信息进行建模。这里主要的挑战在于,在每一种情况下,找到能够包括所有面临问题的同时尽量减少所产生的复杂性的理论框架。
此外,被融合的数据通常以不同的集合表示,反过来,融合的结果需要用不同于输入集的形式表示,这也就意味着,融合的结果需要用不同于输入集的形式表示。
因此,能够同时融合并传播数据并确保尽可能“最佳地”利用其“有用”内容,成为了一个关键挑战因素。
解决上述问题的解决思路是“组合运算(combinatorial operation)”。
对组合运算来说,至关重要的一点是底层逻辑的定义,以及根据公理需要得到满足的逻辑的表述。例如,逻辑可能是合取(共识)、析取(多元化)等,而公理通常典型地是中性元素、单调性、交换性、相关性等定义。
当选择逻辑时,其目的是满足施加在融合过程的要求。同时由于期望通常是最大化信息输出量,因此联合一般是要考虑的第一个选择。
2、信源冲突问题 -- 联合典型问题一
在选择底层逻辑的时候,信源之间经常出现的冲突是一个大问题,可能导致联合毫无意义。
例如,如果一个信源给出集合A的解决方案,而第二个源给出完全区别于A的集合B的方案,这些意见的联合产生了一个空集的解决方案!
这种情况的发生往往是由如下几个原因导致,
- 所考虑的解决方案的集合不全面,信源本身就存在信息丢失,甚至是关键的核心特征部分存在信息丢失
- 所考虑的解决方案的集合非专用,信源所用的理论框架和信源对象的假设前提不匹配
- 并非所有的源都是可靠的等
在这种情况下,最好的方法是分析冲突,确定其原因,充分纠正它,并重复该问题的建模。但是如果实际证明这是不充分或不可能的,唯一的选择就是寻找仅利用现有数据一致部分的组合方案,忽略不能相互验证的数据。
3、动态性问题 -- 联合典型问题二
数据融合的另一个主要挑战是考虑动态性方面,特别是考虑到所有源并不都在完全相同的时间传送数据的这是事实。
所以,通过模拟对象的时间演变,推算来自每个源的知识到那一刻,通常是有必要的。此外,某些源可能产生几乎常见的、几乎最新的信息等。具体地说,这涉及知识预测、更新、修订等问题。
4、信源数据质量附加信息
由信源传送的数据的处理,也必须包括所有需要处理对应不完善性的语义或专家信息。这是执行数据融合的一个关键点。
因此,在有必要在数据建模时,合理有效地确定用于描述数据质量的信息形式。
5、信源间相关性问题
需要特别注意的是,在大多数时候,信源之间不是互相独立的。如果忽略了这一点,融合的数据之间的相互依存关系可能会导致不适当的确认或从某种角度来看的破坏。
因此,需要对这种关系的影响进行建模,并在处理时加以考虑,以避免任何对过程结论的有害影响。另一方面,在某些情况下,数据之间的相关性事实上可提供额外的有用信息,因此有必要适当地加以特别利用。
0x7:融合程度问题
该领域经常出现的问题是融合程度问题,即分布式融合问题。
- 分布式融合:越靠近信源的低层次的数据融合,这种类型产生的语义信息最丰富,因为它离传感器最近。但另一方面,这种原则可能不适用于其他要求或约束。特别是,在非常早的阶段融合数据可能被证实为没有意义,可能对结果质量无用甚至有害,这取决于期望结论的粒度和意图。
- 集中式融合:在较高的语义等级融合,减轻了每次测量时局部处理的困难。集中处理通常用于压缩有用信息并由此减少数据传输所需的吞吐量。
4. 决策
决策是数据处理的最后一步操作,实际上是基于完成的观察产生了所需的情报,或观察形势所需的直接行动。
下图说明了系统决策所采取的主要路径:
第一步是审视所有数据,以评估预先确定与待解决的特定问题相关的不同假象的可能性。 这些似然性的融合随后生成形势评估,要么直接传送到运算以服务于决策支持,要么通过自动处理加以利用从而帮助自主系统。
在整个决策过程中,同样存在很多问题和挑战,我们接下来逐个讨论它们。
0x1:输入数据和结论需求之间兼容性的挑战
第一个困难来自于,确保输入数据和结论需求之间信息容量或大或小的兼容性。
因此,需要界定该系列所有等级的信息模型和底层决策原则,以在其性质和敏锐性量方面产生关于唯一可用知识的唯一合法结论。服务于该目的的多或少的复杂的决策原则相应地在运算方面必须严格表述,结论的形式必须能够尽可能准确地严格表述可用知识。
0x2:决策矛盾
决策过程的第二个主要困难是处理不可避免的矛盾,例如,Condorcet悖论。
这里简要介绍Condorcet悖论,有三个决策者 D1、D2、D3,负责在三种可能的动作 A1、A2、A3 之间进行选择,假设决策者的偏好如下:
如果对动作进行两两比较以通过多数投票建立协商一致的偏好,结果就如下图所示:
Condorcet悖论的不可及性
可以看到,一组不可及的同等偏好使得任何结论成为不可能,出现了一种叫“循环悖论”的现象。
更一般地,Arrow验证了集体决策的属性,基于负责连贯的5条规律:
- 不受限制的域:迎合所有的个人选择
- 全体一致性:如果所有选民都是 x>y,则 x>y 为团体投票
- 两两独立性:两个选项的集体排名仅仅依赖于这两个选项各自的单项排名
- 完整性:所有的组合都能排名
- 传递性:如果 x>y,并且 y>x,则 x>z
Arrow证明仅有的能够满足所有这5条规律的决策规则是绝对专制的,即只考虑一种意见而忽略所有其他的!
因此,任何实际的解决办法必须是合理性(Arrow规律的表达)、有效性(在任何情况下得出结论)、以及共识(尊重多数意见)的折中。
5. 解决方案
需要说明的是,并没有一个通用的解决方案,一次性解决前面章节提到的所有问题与挑战。虽然学术界目前有很多理论框架,但它们每个都是为处理需求的不同方面而专门设计,通常,这些理论最初并不是为数据融合而设计,但却显示出良好的迁移性。
因此,我们接下来重点讨论一下这些理论框架,主要包括两个部分:
- 第一,为了处理问题的某个方面,每个理论框架的特异性
- 第二,可以在这些理论之间建立的所有协同以确保构成不同环节的处理链的整体一致性
0x1:各种理论框架综述
多传感器数据融合关联的主要理论框架图
图框之间的重叠区域表示为了其共同开发,可形式化表示所讨论理论之间的联系。
- 用于处理不确定性的理论:可信度函数理论以及后续将研究的两个本质不用的特例,概率论和可能性理论。
- 用于处理不精确性的理论:本质上是模糊集理论。除去与可能性理论联合利用的不确定性和不精确性之间的二元性,模糊集理论可以很容易地与不确定性理论结合起来共同应对不确定性和不精确性。
- 信息度量:可用于评估由处理传递的不确定性和不精确性的程度,尤其是用于评估数据融合的进程。
- 多准则汇聚的不同方法,可分为两个主要类别。
- 第一类是完全传递汇聚的方法,合成为需要在决策空间优化的单个准则。这类方法的原型是多属性效用理论
- 第二类包括部分汇聚方法,在得出所获得偏好的结论之前,两两比较所有的解决方案
- 数学逻辑:推动了高级别的推理过程,这些逻辑可以有效地与不精确性和不确定性理论相结合以整合知识(模糊逻辑、能度逻辑等)的缺陷,它们比感兴趣的系统本身更紧密地关联了多传感器数据融合所产生的具体的信息利用。
- 联结方法:特别是神经网络,其基本思想是,从足够数量的真实案例中提取历史经验,并在未来的预测中进行复现。这是一个有用的思想,但从方法论的角度来看,数据融合需要克服在未完成学习的基础上的归纳问题。考虑到这一点,例如贝叶斯方法确定的神经模糊方法和某些类推法是切题的,但联结方面并不是可能服务于先前陈述的要求的突破点所关心的问题。
- 鲁棒优化方法:对使用复杂成本函数在融合过程的所有阶段,大范围搜索解决方案。
总之,鉴于上述讨论,接下来的讨论将集中于不确定性和不精确性理论,目的是发现能够为需求服务的理论框架工具。
0x2:融合模型的特殊性
数据融合实际上涵盖了非常广泛的问题,取决于被利用的信息的性质和行动的目标。关于被利用信息,可以根据先验区分为四大类:
- 由传感器获取的观察数据
- 以数据库、专家知识库、信息、情报等形式得到的知识
- 多决策者在多准则决策中使用的偏好
- 为确定权利、责任等,在所有情况下所有参与者需要解决的多重法规、冲突和矛盾
总的来说,多传感器数据融合的输入包括观测数据和知识(关联的、推理的、外衍的等),其目标是现实世界模型的开发和更新。
6. 多传感器数据融合的应用
多传感器数据融合理论还是一个在不断发展中的理论,但是其应用范围仍然是非常广泛的。当然,防御系统是主要的应用,尤其是:
- 战术态势评估
- 多平台协同参与
- 防空系统
- 监控和报警系统
- 识别系统和情报
在其他领域也同样存在很多应用空间,这些领域需求的范围尚未进行完全定义,包括:
- 一般意义上的信息系统,为了处理不同的数据集,通常设计用于决策支持
- 一般意义上的机器人,由不用传感器捕获的数据用于或多或少复杂性的自动功能
- 非侵入性诊断方法,特别是在医疗和网络安全领域
- 智能协作系统