9版:天下搜秘 PDF版下载上一版下一版

武汉晚报 2024年10月10日星期四

往期回顾

返回目录

智能手表测得的指标有用吗？

一些常见指标的准确程度，准确性最高为5星，最低为1星

测量心率的金标准是心电图；智能手表可连续测量心率，简便但准确性稍低。

从心率、血压、睡眠到能量消耗、疲劳状况、最大摄氧量，智能手表手环显示的指标越来越多，可各项指标的准确程度差别很大。那么，准或不准、有多准、怎么做才能测得更准确呢？

准不准，看指标是测量的、估算的，还是新创的？

现在一块几十克的智能手表，能集成近10种传感器，比如测量心率的光电传感器、测经纬度的GPS传感器，还有气压、温度、加速度传感器等等。

可穿戴设备（智能手表、手环、戒指等）通过传感器直接测量，为我们显示有限的一批基础指标（原始数据也需要算法处理，为了方便理解这里写为直接测量）；这批指标经过整合和计算，再源源不断地产出新指标。

指标是越来越多了，但它们全都靠谱吗？只要测量，就一定不可避免出现误差，但多数指标都存在一个公认误差最小的测量方法，这种方法一般被称为“金标准”。举例来说，测量心率的金标准是心电图，测睡眠时间和阶段的是多导睡眠监测，测能量消耗的是双标记水法。

金标准一般在实验室条件下测量，大部分设备昂贵，测量步骤复杂，还需要有经验的操作人员协助。目前智能手表、手环或戒指提供的指标里，没有一项是通过金标准测出来的。所以，文章开头的表格里，没有一个指标能得到5星。牺牲一些数据准确性，可穿戴设备换来了更方便、成本更低的测量方式。

差距有多大？

跟金标准比比就知道了

想知道指标有多准，分别用可穿戴设备和金标准测量，然后比较结果，不就知道了吗？

1.心率，目前最准确的指标之一

测量心率的金标准是心电图，通过放在胸部和四肢的电极，检测心脏的电活动并测量心率。

可穿戴设备连续显示心率时，测量方式通常是光电体积描记法。这种测量方式会受到多种因素影响，例如运动强度、运动类型、腕部活动、腕带松紧、皮肤色素和表面的污垢、心律失常等。

根据18项研究的综合测试，心率测量在静息状态或低强度运动时较为准确，随着运动强度的增加，能测出数据的概率和数据的可靠性会显著降低。因此，在安静状态下，可穿戴设备显示数值稳定时，心率数据相对可信，剧烈运动时数据准确性降低，如果想获得更准确的数据，可以佩戴胸式心率带。

2.睡眠，总时间略优于阶段和质量

测量睡眠的金标准是多导睡眠监测，“多导”指同时测量多种信号，包括脑电图、心电图、眼动图和肌电图等。得到原始数据后，睡眠专家会综合各项结果得出睡眠时间，并手动评分来分析睡眠阶段。

可穿戴设备评价睡眠的方式，是通过测量心率和手腕活动（加速度传感器），算出心率变异性和呼吸频率等指标，再结合个人的年龄、身高、体重和性别等背景信息，基于神经网络模型，最终得到上床和起床时间、睡眠开始和结束时间、睡眠总时长和睡眠潜伏期、清醒时长，各个睡眠阶段的时长和比例，以及基于这些信息得出的总体睡眠评分。

从测量方法来看，如果入睡前长时间静止不动，有可能会被误判为进入睡眠状态，高估睡眠总时长。

各个品牌的具体算法不一致，导致了不同的误差。一篇关于可穿戴技术在睡眠中应用的综述文章提到，与多导睡眠图相比，手表在估计睡眠总时间上表现相对良好，整体准确率约为 70%—90%；在测量睡眠阶段上的表现较差，浅睡眠判断准确率约为 50%—90%，深睡眠和快速眼动睡眠准确率约为30%—80%。

对于睡眠这类估算出来的指标，其中比较准确的可以作为参考，比如睡眠总时间，其余指标则不应该引起焦虑。

3.恢复情况，最不准确的指标之一

以上指标都有金标准，还有一些指标没有金标准，它们基于某个理论被创造出来，例如恢复情况。

训练要想取得进步，需要不断增加训练压力但又不触及过度训练这条线，因此衡量和检测恢复情况非常重要。但恢复情况是一个非常综合且复杂的指标，它受训练（训练量、类型、强度等）、非训练（工作、人际关系、疾病、药物等）和恢复（睡眠、饮食、恢复时间、恢复手段等）因素影响。

由于没有金标准，一些可穿戴设备厂商会使用加权模型估算恢复情况。具体方法是收集一系列可能影响恢复的指标，例如心率、睡眠和训练情况等，算出心率变异性、呼吸频率、耗氧量等数据，然后根据运动科学原理对不同指标加权求和，得到的值就代表恢复情况。

这种做法的缺点是无法穷尽所有影响因素，例如生理周期和人际关系可以影响恢复，但可能没有被模型计算在内，导致显示数据与实际状态有差别，用数据作指导时出现训练不足或过度的情况。

这些指标，到底该怎么利用？

按文章开头的分类方法，可以把所有指标分成测量、估算、创造等三类。

测量的指标，通常误差比较小，比如心率、距离、心率变异性和配速等。这些指标相对可信，可以用作观察健康状况、调整生活方式和锻炼计划的参考。比如，今天早晨起来心率比平时高，是不是昨晚没有睡好？还是最近锻炼过度了？要不要减量或者休息一天？

估算的指标，是在测量指标的基础上通过算法得出的，例如睡眠、能量消耗和摄氧量等。此时，测量误差叠加算法误差，可能使估算指标的准确性降低。解读这类指标时，需要更加谨慎。就像，总体睡眠评分有时与困倦程度一致，有时存在差距；可穿戴设备估算的步行能量消耗也许比较准确，但抗阻（力量）训练的消耗可能被低估。

以上两者是有金标准的指标，即使目前测量还不是很准确，我们可以期待测量技术或算法进步，使数据越来越逼近准确值。

创造的指标，是一些不存在测量金标准的指标，它们是在前两类指标的基础上，算法根据一些定义或想法创造出来的，例如恢复情况、训练效果等。由于没有测量金标准可以比较，加上不同厂商之间的传感器硬件和算法不一致、指标的算法也不公开，很难验证数据的准确性。

因此，对于这些创造的指标，我们不必过多纠结于数字的绝对值，可以通过了解指标的变化趋势，结合自己的主观感受，去更主动地理解身体对于日常生活和运动的反应。

据科普中国

放大

缩小

全文复制