长江日报
武汉晚报 2024年10月10日 星期四
往期回顾
返回目录

智能手表测得的指标有用吗?

    一些常见指标的准确程度,准确性最高为5星,最低为1星

    测量心率的金标准是心电图;智能手表可连续测量心率,简便但准确性稍低。

    从心率、血压、睡眠到能量消耗、疲劳状况、最大摄氧量,智能手表手环显示的指标越来越多,可各项指标的准确程度差别很大。那么,准或不准、有多准、怎么做才能测得更准确呢?

    准不准,看指标是测量的、估算的,还是新创的?

    现在一块几十克的智能手表,能集成近10种传感器,比如测量心率的光电传感器、测经纬度的GPS传感器,还有气压、温度、加速度传感器等等。

    可穿戴设备(智能手表、手环、戒指等)通过传感器直接测量,为我们显示有限的一批基础指标(原始数据也需要算法处理,为了方便理解这里写为直接测量);这批指标经过整合和计算,再源源不断地产出新指标。

    指标是越来越多了,但它们全都靠谱吗?只要测量,就一定不可避免出现误差,但多数指标都存在一个公认误差最小的测量方法,这种方法一般被称为“金标准”。举例来说,测量心率的金标准是心电图,测睡眠时间和阶段的是多导睡眠监测,测能量消耗的是双标记水法。

    金标准一般在实验室条件下测量,大部分设备昂贵,测量步骤复杂,还需要有经验的操作人员协助。目前智能手表、手环或戒指提供的指标里,没有一项是通过金标准测出来的。所以,文章开头的表格里,没有一个指标能得到5星。牺牲一些数据准确性,可穿戴设备换来了更方便、成本更低的测量方式。

    差距有多大?

    跟金标准比比就知道了

    想知道指标有多准,分别用可穿戴设备和金标准测量,然后比较结果,不就知道了吗?

    1.心率,目前最准确的指标之一

    测量心率的金标准是心电图,通过放在胸部和四肢的电极,检测心脏的电活动并测量心率。

    可穿戴设备连续显示心率时,测量方式通常是光电体积描记法。这种测量方式会受到多种因素影响,例如运动强度、运动类型、腕部活动、腕带松紧、皮肤色素和表面的污垢、心律失常等。

    根据18项研究的综合测试,心率测量在静息状态或低强度运动时较为准确,随着运动强度的增加,能测出数据的概率和数据的可靠性会显著降低。因此,在安静状态下,可穿戴设备显示数值稳定时,心率数据相对可信,剧烈运动时数据准确性降低,如果想获得更准确的数据,可以佩戴胸式心率带。

    2.睡眠,总时间略优于阶段和质量

    测量睡眠的金标准是多导睡眠监测,“多导”指同时测量多种信号,包括脑电图、心电图、眼动图和肌电图等。得到原始数据后,睡眠专家会综合各项结果得出睡眠时间,并手动评分来分析睡眠阶段。

    可穿戴设备评价睡眠的方式,是通过测量心率和手腕活动(加速度传感器),算出心率变异性和呼吸频率等指标,再结合个人的年龄、身高、体重和性别等背景信息,基于神经网络模型,最终得到上床和起床时间、睡眠开始和结束时间、睡眠总时长和睡眠潜伏期、清醒时长,各个睡眠阶段的时长和比例,以及基于这些信息得出的总体睡眠评分。

    从测量方法来看,如果入睡前长时间静止不动,有可能会被误判为进入睡眠状态,高估睡眠总时长。

    各个品牌的具体算法不一致,导致了不同的误差。一篇关于可穿戴技术在睡眠中应用的综述文章提到,与多导睡眠图相比,手表在估计睡眠总时间上表现相对良好,整体准确率约为 70%—90%;在测量睡眠阶段上的表现较差,浅睡眠判断准确率约为 50%—90%,深睡眠和快速眼动睡眠准确率约为30%—80%。

    对于睡眠这类估算出来的指标,其中比较准确的可以作为参考,比如睡眠总时间,其余指标则不应该引起焦虑。

    3.恢复情况,最不准确的指标之一

    以上指标都有金标准,还有一些指标没有金标准,它们基于某个理论被创造出来,例如恢复情况。

    训练要想取得进步,需要不断增加训练压力但又不触及过度训练这条线,因此衡量和检测恢复情况非常重要。但恢复情况是一个非常综合且复杂的指标,它受训练(训练量、类型、强度等)、非训练(工作、人际关系、疾病、药物等)和恢复(睡眠、饮食、恢复时间、恢复手段等)因素影响。

    由于没有金标准,一些可穿戴设备厂商会使用加权模型估算恢复情况。具体方法是收集一系列可能影响恢复的指标,例如心率、睡眠和训练情况等,算出心率变异性、呼吸频率、耗氧量等数据,然后根据运动科学原理对不同指标加权求和,得到的值就代表恢复情况。

    这种做法的缺点是无法穷尽所有影响因素,例如生理周期和人际关系可以影响恢复,但可能没有被模型计算在内,导致显示数据与实际状态有差别,用数据作指导时出现训练不足或过度的情况。

    这些指标,到底该怎么利用?

    按文章开头的分类方法,可以把所有指标分成测量、估算、创造等三类。

    测量的指标,通常误差比较小,比如心率、距离、心率变异性和配速等。这些指标相对可信,可以用作观察健康状况、调整生活方式和锻炼计划的参考。比如,今天早晨起来心率比平时高,是不是昨晚没有睡好?还是最近锻炼过度了?要不要减量或者休息一天?

    估算的指标,是在测量指标的基础上通过算法得出的,例如睡眠、能量消耗和摄氧量等。此时,测量误差叠加算法误差,可能使估算指标的准确性降低。解读这类指标时,需要更加谨慎。就像,总体睡眠评分有时与困倦程度一致,有时存在差距;可穿戴设备估算的步行能量消耗也许比较准确,但抗阻(力量)训练的消耗可能被低估。

    以上两者是有金标准的指标,即使目前测量还不是很准确,我们可以期待测量技术或算法进步,使数据越来越逼近准确值。

    创造的指标,是一些不存在测量金标准的指标,它们是在前两类指标的基础上,算法根据一些定义或想法创造出来的,例如恢复情况、训练效果等。由于没有测量金标准可以比较,加上不同厂商之间的传感器硬件和算法不一致、指标的算法也不公开,很难验证数据的准确性。

    因此,对于这些创造的指标,我们不必过多纠结于数字的绝对值,可以通过了解指标的变化趋势,结合自己的主观感受,去更主动地理解身体对于日常生活和运动的反应。

    据科普中国