动态时间规整算法: 从DTW到FastDTW

2023年7月28日上午6:21 • 人工智能 • 阅读 64

总结：

FastDTW作者对DTW的改进点很巧妙！先通过举例说明在一些情况下目前现有的方法对DTW改进的缺陷，然后阐述自己的算法如何避免这些缺陷，最后还在三个数据集上证明在较长时间序列数据中取得线性复杂度。说明在做算法时，在无法找到更低复杂度的方法的时候，可以考虑在牺牲一些可接受的准确度的情况下实现更低的复杂度算法！！！同时，必须通过实验证明准确度降低的程度，文中就使用正常复杂度算法和近似复杂度算法进行对比，从而计算出降低的准确率！！最后，可以吸取现有的一些改进的基础上，再进一步改进，就比在原始的DWT算法上改进的效果更好！！！！

简介 1

Dynamic time warping：动态时间扭曲 (DTW) 是一种在两个时间序列之间找到最佳对齐的技术，其中一个时间序列可以通过拉伸或收缩其时间轴来非线性地”扭曲”。这种比对可用于找到对应的区域或确定两个时间序列之间的相似性。 DTW 经常用于语音识别，以确定两个波形是否代表相同的口语短语。在语音波形中，每个语音的持续时间和声音之间的间隔是允许变化的，但整体语音波形必须相似。 DTW 还用于许多其他学科，包括数据挖掘、手势识别、机器人技术、制造和医学。一个时间序列”扭曲”到一个示例如图所示:

FastDTW：动态时间规整 (DTW) 具有平方时间和空间复杂度，这限制了它在大时间序列中的使用。后面有很多优化，本文主要解释 FastDTW，它是 DTW 的近似，具有线性时间和空间复杂度。 FastDTW 使用多级方法，从较粗的分辨率递归地投影计算并细化投影。从理论上和经验上证明了 FastDTW 的线性时间和空间复杂度。FastDTW 与其他两种现有的近似 DTW 算法进行比较来分析 FastDTW 的准确性：约束（例如 Sakoe-Chiba Bands）和抽象。与现有方法相比，准确性有了很大提高。使用的方法太过巧妙，如下所示：

1) 粗化——将时间序列缩小为更小的时间序列，以更少的数据点尽可能准确地表示相同的曲线。

2) 投影——在较低分辨率下找到最小距离扭曲路径，并将其用作更高分辨率最小距离扭曲路径的初始猜测。

3) 细化——通过局部调整扭曲路径来优化从较低分辨率投影的扭曲路径。

; DTW 1

动态时间扭曲 (DTW) 是一种在两个时间序列之间找到最佳对齐的技术，其中一个时间序列可以通过拉伸或收缩其时间轴来非线性地”扭曲”。最初的实现是使用动态规划，使用数学表达如下：

D ( i , j ) = D i s t ( i , j ) + m i n [ D ( i − 1 , j ) , D ( i , j − 1 ) , D ( i − 1 , j − 1 ) ] , 其中： i = 1 , 2 , ⋯ , x _ l e n + 1 ; j = 1 , 2 , ⋯ , y _ l e n + 1 D(i,j)=Dist(i,j)+min[D(i-1,j),D(i,j-1),D(i-1,j-1)], \其中：i=1,2,\cdots,x_len+1;j=1,2,\cdots,y_len+1 D (i ,j )=D i s t (i ,j )+min [D (i −1 ,j ),D (i ,j −1 ),D (i −1 ,j −1 )],其中：i =1 ,2 ,⋯,x _l e n +1 ;j =1 ,2 ,⋯,y _l e n +1
代码实现如下2：


import numbers
import numpy as np
from collections import defaultdict
from scipy.spatial.distance import euclidean

def dtw(x, y, window=None, dist):
"""
    @param x 序列1，可以是向量，矩阵，不局限于一个数列，但是dist要匹配
    @param y 序列2，可以是向量，矩阵，不局限于一个数列，但是dist要匹配
    @param window 序列设置要走的范围，当使用Sakoe-Chiba Bands就需要自定义缩小的范围，这里默认None会矩阵全走一遍
    @param dist 自定义距离计算方法，可以是欧氏距离，汉明距离等等
"""
    len_x, len_y = len(x), len(y)
    if window is None:
        window = [(i, j) for i in range(len_x) for j in range(len_y)]

    window = ((i + 1, j + 1) for i, j in window)

    D = defaultdict(lambda: (float('inf'),))
    D[0, 0] = (0, 0, 0)

    for i, j in window:
        dt = dist(x[i-1], y[j-1])
        D[i, j] = min((D[i-1, j][0]+dt, i-1, j), (D[i, j-1][0]+dt, i, j-1),
                      (D[i-1, j-1][0]+dt, i-1, j-1), key=lambda a: a[0])

    path = []
    i, j = len_x, len_y
    while not (i == j == 0):
        path.append((i-1, j-1))
        i, j = D[i, j][1], D[i, j][2]
    path.reverse()
    return (D[len_x, len_y][0], path)

if __name__ == '__main__':
    x = np.array([1, 2, 3, 4, 5], dtype='float')
    y = np.array([2, 3, 4], dtype='float')
    distance, path = dtw(x, y, dist=euclidean)

FastDTW之前，后来主要有两种近似计算DWT的算法，损失一定准确率的前提下减少时间和空间复杂度：

1、约束 – 限制在成本矩阵中评估的单元数

典型有两种：constraints: Sakoe-Chiba Band (left) and Itakura Parallelogram (right)；很明显，缺点是当全局最优解不在band内时，就有误差。图中的阴影区域是成本矩阵的单元格，它们被填充由每个约束的 DTW 算法。每个阴影区域或窗口的宽度由参数指定。当使用约束时，DTW 会通过约束窗口找到最优的扭曲路径。但是，如果全局最优扭曲路径不完全在窗口内，则将无法找到它。使用约束以一个常数因子加速 DTW，但如果窗口大小是时间序列长度的函数，则 DTW 仍然是 O ( N 2 ) O(N^2)O (N 2 )。约束在时间序列的时间对齐只有很小差异的领域中效果很好，并且最佳扭曲路径预计接近线性扭曲并以相对直线对角线穿过成本矩阵。但是，如果时间序列是在完全不同的时间开始和停止的事件，则约束效果不佳。在这种情况下，warp 路径可能会偏离线性 warp 很远，并且必须评估几乎整个成本矩阵以找到最佳 warp 路径。

下图描述了约束 DTW 不能很好地工作的情况的简化示例，必须评估整个成本矩阵以获得良好的结果。这可能发生在时间序列是受监控设备的应用程序中，这些设备以可预测的顺序发出命令（例如开/关），但命令之间的时间量（稳态条件）未指定。此类数据的示例包括航天飞机阀门特征。

2、抽象——对数据的简化表示执行 DTW

这种方法作者在FastDTW中也用上，如图所示，就是在低分辨率的矩阵中求解，也会有误差，因为路径不够细化。抽象通过对数据的简化表示进行操作来加速 DTW 算法。这些算法包括 IDDTW 、PDTW 和 COW 。时间序列的大小被缩小以使成本矩阵更易于计算。为较低分辨率的时间序列找到了一个扭曲路径并被映射回到全分辨率。

由此产生的加速取决于使用了多少抽象。显然，计算出的翘曲路径随着抽象级别的增加，它变得越来越不准确。投影低分辨率扭曲全分辨率的路径通常会创建一个远非最佳的扭曲路径。这是因为即使如果最优扭曲路径通过低分辨率单元，则将扭曲路径投影到更高的分辨率忽略了扭曲路径中可能非常重要的局部变化。 因此不适用于局部变化剧烈的序列。

FastDTW：使用多级粗化的方法 1

FastDTW使用下面三种方法进行改进：

1) 粗化——将时间序列缩小为更小的时间序列，以更少的数据点尽可能准确地表示相同的曲线。

投影——在较低分辨率下找到最小距离扭曲路径，并将其用作更高分辨率最小距离扭曲路径的初始猜测。
细化——通过局部调整扭曲路径来优化从较低分辨率投影的扭曲路径。

总结：

1、FastDTW中的分级使用更高分辨率计算，弥补了之前的Abstract的方法，原来只使用一次降低分辨率；

2、FastDTW中的细化使用半径参数控制，弥补原来的Band的方法那种不灵活性，因为Band的方法需要依靠先验知识判断最优路径大概在那些位置；而半径参数只是作为分级粗化投影的一个补充。确实很巧妙！！！

如图所示具体如下：粗化通过平均相邻的点对来减少时间序列的长度（或分辨率）。生成的时间序列比原始时间序列小两倍。粗化运行多次以产生时间序列的不同分辨率。投影采用以较低分辨率计算的扭曲路径，并以较高的分辨率确定它通过的单元格。由于分辨率增加了两倍，因此低分辨率扭曲路径中的单个点将映射到更高分辨率的至少四个点（如果 |X| = |Y |，则可能 > 4）。然后在细化过程中将此投影路径用作启发式方法，以找到更高分辨率的扭曲路径。细化在投影路径的邻域中找到最佳的扭曲路径，其中邻域的大小由半径参数控制。在我们的多级方法中，成本矩阵仅填充在从先前分辨率投影的路径的附近。由于扭曲路径的长度随着时间序列的长度线性增长，我们的多级方法是 O(N) 算法。 FastDTW 算法首先使用粗化来创建将被评估的所有分辨率。图中显示了一个时间序列上的例子在运行 FastDTW 算法时创建的四个分辨率（使用多少个分辨率的粗化矩阵按照实际序列长度确定）。

在图中，从 1/8 分辨率的扭曲路径的投影显示为 1/4 分辨率的重度阴影单元。为了细化投影路径，使用非常具体的约束运行受约束的 DTW 算法，即仅评估投影扭曲路径中的单元格。这将通过从较低分辨率投影的扭曲路径区域找到最佳扭曲路径。然而，全局最优扭曲路径可能不完全包含在投影路径中。为了增加找到全局最优解的可能性，有一个半径参数来控制投影路径每一侧上的额外单元数，这些单元格也将在优化扭曲路径时进行评估。在图中，半径参数设置为 1。由于半径而在扭曲路径细化过程中包含的单元格被轻微着色。一旦以 1/4 分辨率细化扭曲路径，该扭曲路径将投影到 1/2 分辨率，扩大半径 1，然后再次细化。最后，将扭曲路径投影到图中的全分辨率 (1/1) 矩阵。投影被半径扩展并最后一次细化。这个细化的扭曲路径是算法的输出。 FastDTW 在所有分辨率下评估了 4 + 16 + 44 + 100 = 164 个单元，而 DTW 评估了 256 (162) 个单元。对于这个小问题，效率的提高并不是很显着，尤其是考虑到创建所有四个分辨率的开销，在长序列有很大差距。然而，FastDTW 评估的单元数与时间序列的长度成线性关系，而经典的动态时间扭曲算法总是评估N 2 N^2 N 2个单元（如果两个时间序列的长度均为 N）。

代码实现：

FastDTW的递归实现2：


from __future__ import absolute_import, division
import numbers
import numpy as np
from collections import defaultdict
from scipy.spatial.distance import euclidean

def dtw(x, y, window=None, dist):
"""
    @param x 序列1，可以是向量，矩阵，不局限于一个数列，但是dist要匹配
    @param y 序列2，可以是向量，矩阵，不局限于一个数列，但是dist要匹配
    @param window 序列设置要走的范围，当使用Sakoe-Chiba Bands就需要自定义缩小的范围，这里默认None会矩阵全走一遍
    @param dist 自定义距离计算方法，可以是欧氏距离，汉明距离等等
"""
    len_x, len_y = len(x), len(y)
    if window is None:
        window = [(i, j) for i in range(len_x) for j in range(len_y)]

    window = ((i + 1, j + 1) for i, j in window)

    D = defaultdict(lambda: (float('inf'),))
    D[0, 0] = (0, 0, 0)

    for i, j in window:
        dt = dist(x[i-1], y[j-1])
        D[i, j] = min((D[i-1, j][0]+dt, i-1, j), (D[i, j-1][0]+dt, i, j-1),
                      (D[i-1, j-1][0]+dt, i-1, j-1), key=lambda a: a[0])

    path = []
    i, j = len_x, len_y
    while not (i == j == 0):
        path.append((i-1, j-1))
        i, j = D[i, j][1], D[i, j][2]
    path.reverse()
    return (D[len_x, len_y][0], path)

def reduce_by_half(x):
"""
    分辨率减半，使用平均的方法
"""
    return [(x[i] + x[1+i]) / 2 for i in range(0, len(x) - len(x) % 2, 2)]

def expand_window(path, len_x, len_y, radius):
"""
    计算radius下的时间窗
"""
    path_ = set(path)
    for i, j in path:
        for a, b in ((i + a, j + b)
                     for a in range(-radius, radius+1)
                     for b in range(-radius, radius+1)):
            path_.add((a, b))

    window_ = set()
    for i, j in path_:
        for a, b in ((i * 2, j * 2), (i * 2, j * 2 + 1),
                     (i * 2 + 1, j * 2), (i * 2 + 1, j * 2 + 1)):
            window_.add((a, b))

    window = []
    start_j = 0
    for i in range(0, len_x):
        new_start_j = None
        for j in range(start_j, len_y):
            if (i, j) in window_:
                window.append((i, j))
                if new_start_j is None:
                    new_start_j = j
            elif new_start_j is not None:
                break
        start_j = new_start_j
    return window

def fastdtw(x, y, radius, dist):
    min_time_size = radius + 2

    if len(x) < min_time_size or len(y) < min_time_size:
        return dtw(x, y, dist=dist)

    x_shrinked = reduce_by_half(x)
    y_shrinked = reduce_by_half(y)

    distance, path = fastdtw(x_shrinked, y_shrinked, radius=radius, dist=dist)

    window = expand_window(path, len(x), len(y), radius)
    return dtw(x, y, window, dist=dist)

结果

错误率计算：

在准确度上：

相比Band和Abstraction的方法，错误率更低，而且随着radius的增加，错误率降低，后面已经很接近DTW算法；

在时间上：

虽然在数列长度200以内体现不出区别，但是随着时间序列长度的增加，越来越接近线性时间复杂度。

参考：

Original: https://blog.csdn.net/KPer_Yang/article/details/126678842
Author: KPer_Yang
Title: 动态时间规整算法: 从DTW到FastDTW

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/719935/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于SPSS的聚类分析原理概述

文章目录 1. 聚类分析的基本概念 * 1.1 方法概述 1.2 聚类方法 2. 系统聚类 * 2.1系统聚类的类型 2.2 两个距离概念 2.3亲疏程度的度量 – 2…

人工智能 2023年6月19日
0089
18-一种准确高效的领域知识图谱构建方法

杨玉基,许斌,胡家威,仝美涵,张鹏,郑莉.一种准确高效的领域知识图谱构建方法.软件学报,2018,29(10). 关键词：semantic web; knowledge graph…

人工智能 2023年6月1日
0090
哪种蓝牙耳机最好?2022年值得推荐的真无线蓝牙耳机

在平价商品中寻找好东西是买东西的真正本领，我已经掌握了在数字世界使用降噪耳机低价起步的原则。以下四款推荐的低价降噪耳机，每一款都有超高的性价比，是很多蓝牙耳机用户通常会直接跳过的款…

人工智能 2023年5月27日
0060
【层次化文本分类】Hierarchy-Aware Global Model for Hierarchical Text Classification

Hierarchy-Aware Global Model for Hierarchical Text Classification 1、背景 1、作者（第一作者和通讯作者）Zhou…

人工智能 2023年6月25日
0059
八种点云聚类方法（三）

本文为博主原创文章，未经博主允许不得转载。本文为专栏《python三维点云从基础到深度学习》系列文章，地址为”https://blog.csdn.net/suiying…

人工智能 2023年5月31日
0080
PyTorch中的数据并行和模型并行有什么区别？如何实现这两种并行方式

问题描述本问题涉及PyTorch中的数据并行和模型并行，要求详细解释这两种并行方式的区别，并介绍它们的实现方法。需要包括算法原理、公式推导、计算步骤、复杂Python代码示例和代…

人工智能 2024年1月3日
0036
【SQL实战项目】电商平台数据分析项目

一.分析背景和目的背景介绍电商平台数据分析是最为典型的一个数据分析赛道，且电商数据分析有着比较成熟的数据分析模型，比如：人货场模型。此文中我将通过分析国内最大的电商平台——淘宝…

人工智能 2023年7月15日
00124
hugegraph–基于希腊神话人物关系数据的常用查询

随着社交、电商、金融、零售、物联网等行业的快速发展，现实社会织起了了一张庞大而复杂的关系网，亟需一种支持海量复杂数据关系运算的数据库即图数据库。本系列文章是学习知识图谱以及图数据库…

人工智能 2023年6月1日
0086
Pytorch框架中余弦相似度（Cosine similarity）、欧氏距离（Euclidean distance）源码解析

一、矩阵操作用于计算余弦相似度余弦相似度：我们知道，分子是矩阵的乘法，分母是两个标量的乘积。分母好办，关键是如何在计算分子？很简单，我们可以将公式变变形：那么我们只需在矩阵乘…

人工智能 2023年7月21日
0077
R语言 xlsx 读写Excel数据

【基础】简单读取excel文件数据【基础】简单写入数据到excel文件【进阶】随心所欲读取excel中的各种信息【进阶】随心所欲将数据写入excel文件感谢Adrian A. Dr…

人工智能 2023年7月18日
0047
傻瓜攻略（十五）——MATLAB中简单的聚类分析方法

本文是对聚类分析较为简单的介绍，笔者自从大二开始接触数学建模，就使用过Q型聚类和R型聚类，但是一直到研一结束，都没有一个具体的认识，浅尝辄止，不敢言通。最近参加研究生数学建模比赛，…

人工智能 2023年6月2日
0076
计算机视觉人体骨骼点动作识别-1.训练自己的关键点检测模型

人体关键点检测算法关键点并不特指人体骨骼关键点，还有人脸关键点，物体的关键点。其中人体的关键点，也叫作pose Estimation，是最热门，也是最有难度，应用最广的。应用可以…

人工智能 2023年6月26日
00136
Python导出csv中文乱码utf_8_sig没用

python读写文件基本操作在数据过滤操作中，常常需要对源文件（source）中的数据进行读取、分析、判别处理，而后再写入新的文件。在文件的读取上可以是 .xlsx也可以是 .c…

人工智能 2023年7月7日
0073
PyTorch版本更新后无法调用GPU显卡的原因及解决办法

Index 目录索引问题剖析解决方法参考问题剖析使用 PyTorch在网络模型训练过程中，如果更新了 PyTorch的版本（例如由 1.7.0更新为 1.8.1），则可能…

人工智能 2023年6月24日
0080
2023最新SSM计算机毕业设计选题大全（附源码+LW）之java抗包虫病药物查询与推荐系统rx40p

毕业设计其实不难，主要毕业的时候任务太紧了，所以大家都非常忙没有时间去做，毕业设计还是早做准备比较好，多花点时间也可以做出来的，建议还是自己动手去做，比如先选一个题，这样就有方向，…

人工智能 2023年6月27日
00127
Python数据标准化

目录一.数据标准化方式 1.实现中心化和正态分布的Z-Score 2.实现归一化的Max-Min 3.用于稀疏数据的MaxAbs 4.针对离群点的RobustScaler 二.P…

人工智能 2023年7月5日
0093

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

动态时间规整算法: 从DTW到FastDTW

目录

总结：

简介 1

; DTW 1

FastDTW：使用多级粗化的方法 1

结果

大家都在看