1. 背景
心电信号是生命体最重要的生物电信息之一,也是临床医生诊断心血管疾病的重要依据 [1] ,对心电数据序列进行处理以及以散点图的形式输出处理结果具有十分重要的实用价值。心电散点图是一项以非线性分析方法为基础,运用计算机软件技术将较长时间记录的心电图数据转换为高密度散点数据,制成直观、简约图形表示的前沿技术 [2] 。心电散点图将传统的1D连续心电图信号序列表现为高维图示化散点表示。大数据时代,利用现代概率和统计分析工具对心电数据进行处理,有助于提取和挖掘隐含在大样本的心电数据中,难以被传统心电图识别技术识别出来的特殊类别的非线性生理和病理信息。在这个研究方向,目前可以看到的处理模型主要是基于近代混沌理论和法国科学家彭加莱100年前提出的图示处理方法。这类方法已经在判别不同的心律失常疾病中逐渐发挥作用 [2] 。
由于特定疾病类型可能具备相似的变化规律,例如:如何根据长时间心电监测数据,快速、精确地区分出正常心律和心律失常的心电图中蕴含的特殊差别,对探讨的长时间心电数据的计算机辅助诊断和分析模式是一个值得进行深入研究的课题。本文使用变值可视化特征分析技术处理心电数据序列,根据序列密码分析模式正在发展的一类原创型的连续信号分析技术,该类技术能有效地将1维的连续心电图信号,分解成为四基元的伪基因多路离散信号,从而利用一套有效地用于序列密码分析的前沿技术工具,将所处理的信号形成可视化分布图式。本文中的心电数据序列经过处理之后得到的输出结果是一系列的正常和异常心电的2D图谱。
2. 体系结构
处理心电数据序列的整个框架结构如图1所示:
图1中的计算模型(CM)包括基值计算模型(BVCM)、范围值计算模型(RVCM)以及区间取值计算模型(RCM)。下面就这三个模型详细介绍。图2是基值计算模型(BVCM),图3是范围值计算模型(RVCM),图4是区间取值计算模型(RCM)。
图1中的测量模型(MM)可以使用图5进行详细介绍。
2.1. 计算模型(CM)
本文中所使用的输入参数有:w表示滑动窗口值,s表示稳态区间值,m表示分段段长。
2.1.1. 基值计算模型(BVCM)
基值计算模型(BVCM)的作用是通过公式1对连续心电数据序列
进行处理,从而获得相应的基值序列
。

Figure 2. Basic value computation model (BVCM)
图2. 基值计算模型(BVCM)

Figure 3. Range value computation model (RVCM)
图3. 范围值计算模型(RVCM)

Figure 4. Region computation model (RCM)
图4. 区间取值计算模型(RCM)
(1)
输入:
心电数据序列:
;
滑动窗口值:w;
输出:
基值序列:
。
2.1.2. 范围值计算模型(RVCM)
范围值计算模型(RVCM)通过公式2计算范围值序列:
。
(2)
:表示包含在滑动窗口内的心电数据序列的最大值;
:表示包含在滑动窗口内的心电数据序列的最小值。
输入:
心电数据序列:
;
滑动窗口值:w;
稳态区间值:s;
输出:
范围值序列:
。
2.1.3. 区间取值计算模型(RCM)
区间取值计算模型(RCM)通过公式3计算心电数据序列的区间值:
。
(3)
经过以上三个关键计算模型的处理,连续的心电信号数据序列
被转换为区间取值序列
。现根据区间范围参数表示如下:
(4)
经过上述比较,进一步将区间取值序列
转换为由生物学上的四个碱基
组成的伪DNA序列。
输入:
心电数据序列:
;
稳态区间值:s;
基值序列:
;
范围值序列:
;
中间参数:
区间取值序列:
输出:
区间范围取值向量:
2.2. 测量模型(MM)
测量模型(MM)的主要作用是将伪DNA序列转换成0-1序列,根据输入的分段段长m将0-1序列转换为逻辑空间的四元符号:
组成的序列 [3] ,最后分别运用归一化和非归一化方法计算四个基元的概率测度。
2.2.1. 变值模型(VM)
变值模型(VM)的作用是把伪DNA序列转换为由变值逻辑空间的四个基元组成的序列(图6)。
输入:
区间范围取值向量:
;
分段段长:m;
中间参数:
0-1序列:由0和1组成的一串0-1序列。
输出:
变值逻辑空间四元符号:
。
在该模型中,首先将区间取值模块输出的区间范围取值向量以映射的方式转换为0-1序列。假设
,对于一个区间范围取值向量的每一位
存在映射 [4] 如下:
(5)
那么一组输入向量可以对应四组0-1序列,分别是对于“A”的映射
,对于“B”的映射
,对于“C”的映射
,对于“D”的映射
。根据不同的映射策略输出对应的0-1序列。根据分段段长m将0-1序列进行分段处理,每段段长为m。将前后两段序列进行如下公式6进行转换,输出变值逻辑空间的四种变值状态,分别为:
。变值 [5] 表示如下:
(6)
经过上述变换,得到的输出结果为:
。
2.2.2. 概率测量(PM)
概率测量模型(PM)的主要作用是使用归一化和非归一化方法来计算变值逻辑空间四种状态
的概率测度
。
本文中使用
表示0的测度,
表示1的测度,
表示⊥的测度,
表示+的测度,
表示-的测的,
表示T的测度。则有:
,其中:
,
。
归一化方法如下表示:
(7)
(8)
非归一化方法表示如下:
(9)
根据以上两种方法输出得到10个概率测度,分别是归一化方法输出的6个:
和非归一化方法输出的4个
。本文从非归一化方法所产生的4个中任意选取2个作为可视化模块的输入,从而得到2D图谱。
3. 可视化结果
本文主要是比较正常和异常心电在不同的子段段长输入条件下的可视化分布特征,所以,文中使用的滑动窗口值m为30,稳态区间值s为0.95。这两个输入值的选取能够使得可视化结果具有明显的分布特征。
图7是健康人的心电信号图示信息,图8是室性失常病人的心电信号图示信息。
非归一化方法:选择机制为
。
归一化方法:选择机制为
。
从图9中可以观察到健康人的心电序列处理得到的2D图谱中的每一个子图与室性失常病人的心电序列处理得到的2D图谱中对应的子图具有明显的分布特征。其中健康人的心电该模型方法下所呈现的分布是:主要集中于2个区域,呈现四边形分布;而室性失常病人的分布呈现三角形分布。
从图10中同理也能观察到健康人和室性失常病人的2D图谱中的对应分段段长的子图分布具有明显的差异。健康人的分布呈现的是复杂性的分布,而室性失常病人所呈现的分布是比较混沌,几乎布满整个平面。

Figure 9. Non-normalized Model: (a1)-(a3) ECG of the Healthy People, Maps of component T; (b1)-(b3) ECG of the Ventricular Arrhythmia, Maps of component T
图9. 非归一化模型:(a1)~(a3)是健康人的心电,针对分量T进行映射的图谱;(b1)~(b3)是室性失常病人的心电,针对分量T进行映射的图谱

Figure 10. Normalized Model: (a1)-(a3) ECG of the Healthy People, Maps of component T; (b1)-(b3) ECG of the Ventricular Arrhythmia, Maps of component T
图10. 归一化模型:(a1)~(a3)是健康人的心电,针对分量T进行映射的图谱;(b1)~(b3)是室性失常病人的心电,针对分量T进行映射的图谱
4. 总结
心电信号的分析在现代医学领域,尤其是临床诊断中扮演者一个比较重要的角色,本文的心电数据处理和可视化模型能够快速、方便、简洁、直观地描述出正常心电和异常心电的分布特性。这种基于变值逻辑的数据处理机制及可视化模型易于理解和操作,对于正常和异常的心电信号,在同一分组大小下,都会产生对应四个碱基字母所对应的图谱,从这四个图谱中可以分析正常心电数据和异常心电数据的分布特性。
利用变值可视化技术,目前观察到正常和异常心电数据的图形分布具有可以观察到的显著差异,期待进一步系统处理更多的数据之后,该类方法可能形成处理大容量心电图数据的标准检测模式,对普通心电图、动态心电图等传统技术方法起到补充作用。
致谢
感谢我导师郑智捷教授对我这篇文章的细心指导;感谢山路医生的帮助;感谢云南大学软件学院、云南省软件工程重点实验室信息安全基金以及郑智捷教授国家自然科学自然基金的支持。
*通讯作者。