信号处理

熵，事物的混乱程度；

熵有很多种计算方式；

概念介绍

如何理解呢？或者说两个均值相减怎么就能反应时间序列的复杂性？

首先，简单思考下这个计算过程，先用 m 长的窗口滑动生成一组 m 长的数组，假设 m = 2，那就是一个 (n-m+1)x2 的数组，然后计算每行之间的距离，这其实就是计算原时间序列中相邻元素的距离，或者说相关性，然后看看所有相邻元素的相关性如何(均值)；

接着，把每相邻元素变成每 3 个元素，变成 (n-m+1)x3 的数组，然后再计算相关性；

如果原时间序列很平稳，我们可以想象成恒等于某个值，那么相邻 2 个相关性很大，相邻 3 个相关性还是很大，也就是说窗口变长并没有降低相关性；

反之，如果原时间序列没那么平稳，只存在短期相关，那么相邻 2 个相关性较大，相邻 3 个相关性会大大降低，此时两个相关性相减差就会比较大，这就得到了近似熵；　　【此次的平稳是我们通俗说的平稳】

所以，近似熵越大，时间序列越不平稳，或者说越复杂；

从原理上看，三者都是评价波形前后的混乱程度的，也就是评价波形重复性的，也就是频率，熵越大，包含的不同频率越多，越混乱；

三个之间的区别的话
近似熵，1991年的算法。
样本熵，2000年的算法。近似熵在比较的时候有一个自身比较的数值在里面，这个算法优化了。
模糊熵，2007年的算法。前面两个算法在评价时加入了一个阈值：大于阈值就混乱，小于就不混乱。模糊熵加入了一个fuzzy的思想在里面。更科学一些。
啥叫fuzzy，就比如说，原来分男女，只有 是 或者 不是 这种。现在加入了模糊思想，就告诉你，这货有0.8的概率是男的，有0.2的概率是女的这种。这种软分类其实更科学的。更多的可以参考fuzzy c means算法。

与近似熵相比，样本熵具有两个优势：样本熵的计算不依赖数据长度；样本熵具有更好的一致性，即参数m和r的变化对样本熵的影响程度是相同的。

目前样本熵在评估生理时间序列（EEG，sEMG等）的复杂性和诊断病理状态等方面均有应用。

还有一个是排列熵，是评价数据周期性随机性的；

Python 样本熵

python 自带了一个库；

pip install sampen

参数解释

def sampen2(data, mm=2, r=0.2, normalize=False)

data：一维信号

mm：窗口长度，一般选择 2，偶尔选择 3，一般不选其他值

r：在很大程度上取决于实际应用场景，通常选择 $r = 0.2 * s t d$

示例

from sampen import sampen2

# initialize a list（初始化list）
series_data = []

# open the file and read each line into the list（按行读取）
with open('relative/path/to/file.txt', 'r') as file:
    for row in file:
        series_data.append(float(row.strip(' 	

')))

# calculate the sample entropy
sampen_of_series = sampen2(series_data)

输出

[
    (0, 2.140629540027156, 0.0028357991885715863)
    (1, 2.162868347337613, 0.004903248034526253),
    (
        # Epoch length for max epoch（最大长度）
        2,
        # SampEn（样本熵的值）
        2.123328492035711,
        # Standard Deviation（标准偏差）
        0.007596323621379352
    ),
]

参考资料：

https://www.zhihu.com/question/266285555/answer/1151247378　　知乎

https://sampen.readthedocs.io/en/stable/　　　　官网代码

https://blog.csdn.net/Fanhe_ecust/article/details/101778803　　样本熵的python代码实现

https://blog.csdn.net/cratial/article/details/79707169

https://blog.csdn.net/u011389706/article/details/80984209　　信号处理算法（2）：样本熵（SampEn）　　有原理

相关阅读:
石家庄地铁线路查询系统（补）
构建之法阅读笔记03
构建之法阅读笔记02
Day 3-3 内置方法
Day3-2 函数之递归
Day3-1 函数
Day2 列表,元组,字典,集合
Day1 基础知识
Day1. Python基础知识
iptables防火墙配置

原文地址：https://www.cnblogs.com/yanshw/p/13225811.html

信号处理

概念介绍

如何理解呢？或者说 两个 均值相减 怎么就能反应 时间序列 的复杂性？

Python 样本熵

如何理解呢？或者说两个均值相减怎么就能反应时间序列的复杂性？