新聞 | iThome ( ) • 2024-06-13 10:11

大型语言模型已经被用于处理各种模态的资料,包括文字、图像、音讯和影片等,而现在Google也将大型语言模型应用于理解和推理个人健康问题和资料上,主要目标是要提升个人健康,该新研究特别著重于睡眠与健身这两项早期死亡预测因子。

Google研究展示了大型语言模型在健康资料上的潜在应用,可分析穿戴式装置的健康资料,将零碎的资料点转化为个人健康报告。大型语言模型利用程式码生成和资讯检索工具强化分析能力,使得人工智慧代理可以经迭代处理,分析穿戴式装置多维时序资料。

人工智慧代理运用Python直译器进行复杂运算辨识趋势,再透过搜寻引擎存取最新的医疗和健康知识库,就可针对使用者给出个人化的建议和解释。使用者可以询问像是「如何在白天感觉更清醒且充满活力?」等问题,人工智慧代理依据使用者穿戴式装置所纪录的睡眠时间,以及运动频率给出具体建议。

穿戴式装置量测个人生理状态和行为,纪录连续且精细的资料,诸如步数、心率变异、睡眠持续时间等,结合大型语言模型,经由提供个人化报告与建议协助使用者实现健康目标。不过这件事并不容易,模型必须能够对复杂时间序列和零散资料进行推理,并在个人健康背景下生成个人化解释和建议。

研究人员以「如何改善睡眠品质?」问题为例,说明人工智慧代理需要经历一连串复杂分析步骤才能给出答案。步骤包括检查资料的可用性、计算平均睡眠时长、辨识一段时间内的睡眠模式异常,并借由全面分析使用者的健康状况,做出更具意义和针对性的分析,再加上睡眠标准知识,提供使用者量身打造的睡眠改善建议。

Google研究人员使用了Gemini模型微调版本PH-LLM。透过使用多模态编码器,PH-LLM能够更好地理解和解释文字及时序感测资料。研究人员创建一组基准资料集,来评估模型与专家的能力差距,在健身领域,无论是Gemini Ultra 1.0模型还是PH-LLM模型的效能,都与健身专家没有统计学上的差异,而在睡眠评估上,PH-LLM则与专家表现接近。

过去虽然也有各种大型语言模型的医疗相关应用,但是却很少使用来自行动或是穿戴式装置的复杂资料,研究人员认为这些资料对于个人健康监测非常重要。该Google研究的主要贡献,在于展示大型语言模型可以用于分析和解释穿戴式装置资料,并且证明其能力可媲美人类专家。