固定阈值是通过实验确定的经验值。然而,很难为不同的参与者或动作选择一个通用的固定阈值。因此,我们提出了一种基于最优阈值的SampEn方法。该实现分为三个步骤:计算SampEn、基于固定阈值检测活动段和计算最佳阈值。
在第一步中,计算分析窗口的样本(M个样本,M=512)。9信道信号之和的时间序列sEMGsum(k)构造如下:
表面肌电总和(k)=∑ i=1c表面肌电i(k)(1)
其中C是通道总数(C=9),i是通道数,k是分析窗口中的点数。
然后,将标量时间序列sEMGsum(k),k=1,2,…,M嵌入延迟的M维空间,以形成一组M维向量(长度为M的数据段)(Zhang和Zhou,2012;Yentes等人,2013):
{sEMGsumm(j)=[Semgsum(j+p)]p=0m−1j=1,2,…,M-M+1(2)
匹配m个点的两个序列的概率Bm(r)通过计算其距离低于相似公差r的向量对的平均数量来计算。类似地,可以计算m+1维的概率Am(r)。最后,SampEn计算为:
SampEn(m,r,m)=-ln8290;(A,m(r)B,m(r))(3)
尺寸m和相似公差r的选择决定了SampEn的计算结果。这些值有经验公式(Pincus,1991;Costa等人,2002):m=1或2,r=(0.15-0.25)∗ σ. 其中σ是整个数据序列sEMGsum的标准偏差。在本文中,这些值为:m=2,r=0.25∗ σ.
在第二步骤中,执行基于固定阈值的活动段检测。根据第一步,获得第l个分析窗口的采样点(l)。然后,计算第l个分析窗口的状态函数s(l):
s(l)={0,SampEn(l)<Th1,SampEn(l)≥第(4)条
其中Th是固定阈值。基于状态函数的活动段的条件是:
{s(l1−1) =0ands(l1)=1s(l2−1) =1和(l2)=0 L=l2−l1≥L0=12×秒(5)
其中,l1和l2是活动段的开始和结束分析窗口,L是l1和l2之间的分析窗口数,秒表示时间秒,L0是活动段中分析窗口的预设数。只有当L不小于L0时,该活动段才能被视为有效活动段。否则,该活动段仍被视为噪声。此外,可以在采集的sEMG信号中检测到多个活动段(例如n个)。为了区分每个活动段,每个活动段的l1和l2分别存储在长度为n的一维数组x1和x2中。
在第三步中,通过迭代计算最佳阈值。目标函数不仅要精确检测已知的n0个活动段(本文中的n0=5),还要使每个活动段尽可能长,以包含更多的运动信息。因此,目标函数通过两个循环实现,流程图如图5所示。
图5
noraxon
图5.计算最佳阈值的流程图。
外循环和内循环的循环变量分别是活动段中分析窗口的数量L0(将L0替换为秒,10)≥秒≥1) 并且SampEn阈值Th(0≤Th≤2). 循环体按顺序执行前两步,并输出检测到的活动段数n,并确定其是否等于n0。如果n等于n0,则输出此时的x1、x2和Th值。以执行从上到下运动的中风参与者为例,9通道表面肌电信号的活动段检测结果如图6所示。
图6
noraxon
图6.从上到下运动中基于自适应采样笔阈值算法的活动段检测。DT,斜方肌下降部分;左腹直肌;右腹直肌;左腹外侧斜肌;右外斜肌;左胸竖脊肌;右胸竖脊肌;左腰竖脊肌;右腰竖脊肌。
特征提取
与频域和时频域特征相比,时域特征简单且耗时较少。因此,我们选择了五种常用的时域特征来建立特征向量。这些特征包括均方根(RMS)、方差(Varrecchia等人,2018)、MAV、波形长度(WL)和四阶自回归模型系数(4th ARMC)。
RMS是给定分析窗口中表面肌电信号平均功率的平方根。计算如下:
均方根i(t)=1m∑ k=1 M表面肌电i t(k)2(6)
其中i是信道号(i=1、2、3、…、9),t是分析窗口均方根i(t)=1m∑ k=1 M表面肌电i t(k)2(6)
其中,i是信道编号(i=1、2、3、…、9),t是分析窗口编号,k是第t个分析窗口中的点数。
VAR反映了表面肌电信号偏离平均值的程度,计算公式如下:
{AVR i(t)=1米∑ k=1m表面肌电i t(k)VAR i 8290;(t)=1m∑ k=1m(表面肌电i(k)-AVR i(t))2(7)
在统计学中,表面肌电信号近似为平均值为零的随机信号。平均值不反映信号特性。因此,表面肌电信号的绝对值被平均,这是MAV的定义。计算如下:
MAV i(t)=1m∑ k=1 M |sEMG i t(k)|(8)
WL是sEMG信号长度的简单累积,可以反映sEMG信号波形的复杂性。其定义为:
WL i(t)=∑ k=1 M |表面肌电(k+1)-表面肌电t(k)|(9)
AR模型是用于表面肌电信号时间序列分析的线性模型。其定义为:
表面肌电t(k)=∑ j=1qajsemgit(k-j)+eit(k)(10)
其中q是AR模型的阶数(q=4),aj是第j阶AR系数,eit(k)是白噪声残差。
从单通道表面肌电信号的每个分析窗口提取五个时域特征。本文采集了9通道表面肌电信号,因此1∗ 45 (5 ∗ 9) 从每个分析窗口提取一维特征向量。然而,中风患者受影响的一侧可能是左手或右手。不同的受影响侧导致相反方向的SE和TR补偿。这导致四对肌肉(LRA/RRA、LOEA/ROEA、LTE/RTE和LLE/RLE)产生相反的效果。相应地,从后8通道表面肌电信号中提取的特征向量的一致性较差,甚至相反,这不利于分类。因此,为了减少不同受影响手的影响,我们将后部8通道表面肌电信号的五个时域特征重建为:
{feat i′(t)=feat i(t)+feat i+1⁘(t)feat i+1′(t)=abs⁎(feat i(t)-feat i+1 |(t))i=2、4、6、8(11)
其中,i是第i个通道,t是分析窗口号,feati(t)代表上述五个时域特征(均方根、VAR、MAV、WL和第四个ARMC)中的任何一个。特征重构仅改变特征值,但不改变特征维数,因此每个分析窗口提取1∗ 45维特征向量。此外,考虑到该方法在临床应用中的便利性,连续减少了四对躯干肌肉的数量,最后研究了9、7、5和3个通道。相应地,每个分析窗口提取的特征向量维数为1∗ 45, 1 ∗ 35, 1 ∗ 25和1∗ 分别为15。
分类
由于SVM算法实现了结构风险最小化原则(Burges,1998),因此它在解决小样本、非线性和高维模式识别方面具有独特的优势。一些研究(例如,Bellingegni等人,2017;Quitadamo等人,2017)也表明支持向量机具有更高的分类性能。因此,我们选择了支持向量机分类器。支持向量机的目的是寻找最优超平面来分割样本。分割的原则是使区间最大化,并最终将其转化为凸二次规划问题(Scholkopf和Smola,2001),表示为:
{min1 2||w| | 2 s.t.y t(w*8290x t+b)-1≥ 0 (12)
其中(xt,yt)是第t个数据点,(w,b)是超平面参数。拉格朗日乘子用于求解该问题。
TCD模型为四类模型(NC、LF、TR和SE),因此采用一对一策略进行多分类。我们使用LIBLINEAR(Fan等人,2008)工具包进行SVM分类器。当使用L2正则化L2损失支持向量分类时,只需搜索惩罚因子C(Hsu等人,2003)。在本文中,交叉验证用于将参数C从小到大调整。当增加的C对分类结果没有太大影响时,调试完成,并选择相对较小的C值以提高模型的收敛速度(最后,C=1)。此外,还使用了保持方法来评估分类器的性能。具体而言,为了尽可能保持数据分布的一致性,将训练子集和测试子集随机划分为每个类特征集的80:20%。将四个类的训练子集和测试子集分别组合以形成训练集和测试集。此外,我们使用100次保持法获得了稳定可靠的评估结果。此外,我们选择分类准确度、F1得分、受试者操作特征(ROC)曲线和曲线下(AUC)作为模型eva模型评估参数。分类准确度是最常用的分类模型评价指标,是指正确分类的样本数与总样本数的比值。F1分数是精确性和召回率的调和平均值。ROC曲线是一条评估曲线,其中假阳性率(FPR)为横轴,真阳性率(TPR)为纵轴。AUC定义为ROC曲线和坐标轴包围的区域。
结果和讨论
后果
分类精度
为了研究该方法的可行性,我们基于健康组数据集和中风组数据集建立了两个躯干补偿模型。首先,研究了通道数量对分类的影响。从图7可以看出,较少的通道导致较低的平均精度。根据最佳精度原则,以下仅报告九个通道的详细检测结果。
图7
noraxon
图7.不同通道数建立的健康组和中风组模型的平均精度。
结果表明,健康组模型和患者组模型的平均准确度分别为95.0%和83.1%(图7)。两个模型的混淆矩阵作为灰度图像给出(图8)。混淆矩阵中的对角元素(n,n)(n=1,2,3,4)表示每个类别的分类精度,而其他元素表示错误分类率。
图8
noraxon
图8.干线补偿检测模型的混淆矩阵。(A) 健康组。(B) 中风组。NC,无补偿;左前倾;TR,躯干旋转;SE,肩部标高。
ROC和F1得分
由于每个参与者的运动功能不同,四个班的样本分布略有不平衡。因此,我们还选择F1分数、ROC和AUC作为模型评估参数。这些参数通常用于不平衡分布的二元分类。然而,本文建立的模型是四类模型,因此需要进行转换才能获得这些参数。我们将当前类视为正类,其余类视为负类。通过这种方法,获得了四类ROC和AUC(图9)。在ROC曲线中,曲线左上角越凸,模型性能越好。AUC越接近1,模型性能越好。本文中单个类别的AUC达到1,表明模型在检测这些类别时表现出期望的识别性能。
图9
noraxon
图9.主干补偿检测模型的ROC曲线。(A) 健康组。(B) 中风组。NC,无补偿;左前倾;TR,躯干旋转;SE,肩部标高。
F1分数是精确性和召回率的调和平均值。F1分数越接近1,模型性能越好。我们使用相同的转换方法计算每个类的F1分数,结果如图10所示。
图10
noraxon
图10.健康和中风组模型各类别的F1得分。NC,无补偿;左前倾;TR,躯干旋转;SE,肩部标高。
讨论
本文提出了表面肌电bTCD方法,并验证了其可行性。据我们所知,这是第一项基于9块浅表躯干肌肉的表面肌电信号检测健康受试者模拟躯干代偿和中风受试者真实躯干代偿的研究。此外,提出了一种基于最佳采样笔阈值的活动段检测方法,并分别用于检测健康组和中风组的表面肌电信号的活动段。提取活动段中每个通道的五个复合时域特征以形成特征向量空间,包括RMS、VAR、MAV、WL和第四ARMC。使用SVM分类器,建立、训练和测试了两个四类模型,用于检测三种躯干补偿(LF、TR和SE补偿)和NC运动,包括健康检测模型和中风检测模型。此外,还研究了通道数对分类的影响,结果表明,基于九个通道的两种检测模型均达到了最佳精度。因此,下面仅分析九个通道的实验结果。
首先,基于健康组的表面肌电信号建立健康检测模型。测试结果表明,每个类别的准确率均>90%(平均95.0%)。与88.6(Ranganathan等人,2017年)和85.9%(Taati等人,2012年)的准确度相比,使用本文提出的方法获得了更高的检测准确度。我们还选择了AUC和F1- |