血压测量与预测研究及分类算法实现
血压的测量和预测对于心脏病患者和有心脏问题的人来说至关重要。本研究使用了BP Data-UNSW数据集,其中包含350条记录,从155名受试者收集而来,共包含9个特征。这些特征在表1中给出。数据集中的第一行显示了标签,其中SBP和DBP点分别标记为1和2,其他点标记为0。在预处理步骤中,找到了示波波的包络,并且特征被提取出来。SBP和DBP点由柯氏音确定。然而,由于没有根据确定DBP点的标准,对检测到的点进行目视检查。示波波与袖带压力的波形如图3所示。在该图中,蓝线用长示波波形标准化,红线用长示波波形标准化是袖带压力。绿色区域代表收缩前区域,黄色区域代表收缩点和舒张点之间的区域,紫色区域代表舒张后区域。
本研究将血压估计转化为分类问题,除了数据集中给出的收缩压和舒张压点标签外,它们还被重新标记为收缩压前、收缩压和舒张压之间以及舒张压后。研究使用的框图如图4所示。使用示波波获得的数据集,首先重新标记示波波包络。使用的标签在表2中给出。图5显示了根据特征的类别分布。可以清楚地看到,类根据特征交织在一起。数据集分为训练子集和测试子集。300名受试者被定义为训练,50名受试者被定义为测试子集。首先,分类器针对每个类别进行训练,并为测试数据子集生成模型。
图6给出了样本测量过程的实际值和预测值。对血压测量周期中发生的所有心跳进行类别估计。
本研究使用了三种不同的分类算法,分别是k近邻(kNN)、加权k近邻(WkNN)和Bagged Trees。k近邻(kNN)是一种非参数惰性学习算法,测量新数据和训练数据之间的距离,并将新数据标记为K最近类别的值。加权k近邻(WkNN)的工作方式为kNN,距离根据特征进行加权。Bagged Trees是一种集成决策树结构,每个决策树评估数据,并根据所有估计做出最终决策。