医学大数据的来源
目录:
未來的醫療是什麼模樣? | 張智威 Edward Y. Chang | TEDxTaoyuan (十一月 2024)
医学中大数据的简单定义是“与患者保健和福祉相关的全部数据”(Raghupathi 2014)。但这些类型的数据究竟是什么,它们来自何处?
以下是对医疗保健提供者,研究人员,支付者,政策制定者和行业感兴趣的大数据的类型和来源的广泛概述。这些类别并不相互排斥,因为相同的数据可能来自各种来源。
这份清单也没有详尽无遗,因为大数据分析的实际应用肯定会继续扩大。
临床信息系统
这些是医疗保健提供者习惯于观看的传统临床数据来源。
- 电子健康记录(EHR)收集,存储和显示人口统计学,过去的病史,活跃的医疗问题,免疫接种,过敏,药物,生命体征,实验室和放射学测试结果,病理报告,医疗保健创建的进度记录等信息提供者,行政和财务文件
- 电子病历(EMR)与EHR不同,通常与特定医生存储的数据有关。
- 健康信息交换是不同临床信息系统之间的中心
- 由医疗保健组织为其自己的患者维护的患者登记处通常与EHR相关联。其他登记处在更广泛的地理范围内跟踪免疫接种,癌症,创伤和其他公共卫生问题。
- 患者门户允许患者访问存储在医疗保健组织的EHR中的个人健康信息。一些患者门户还允许用户请求处方补充并与医疗团队交换安全的电子消息。
- 临床数据仓库汇总来自多个临床信息系统的患者级数据,例如上面列出的EHR和其他来源
来自付款人的索赔数据
公共支付者(例如医疗保险)和私人支付者拥有大量关于其受益人的索赔数据库。一些健康保险公司现在也提供分享您的健康数据的激励措施。
研究
研究数据库包含有关研究参与者,实验治疗和临床结果的信息。大型研究通常由制药公司或政府机构赞助。根据临床试验数据的模式,个性化医疗的应用是使个体患者与有效治疗相匹配。
这种方法超越了应用基于证据的医学原则,医疗保健提供者通过该原则确定患者是否与试验参与者具有广泛的特征(例如年龄,性别,种族,临床状态)。通过大数据分析,可以根据更细粒度的信息选择治疗方法,例如患者癌症的遗传特征(见下文)。
临床决策支持系统(CDSS)也在迅速发展,现在已成为医学中人工智能(AI)的重要组成部分。他们使用患者数据帮助临床医生做出决策,并且经常与EHR结合使用。
遗传数据库
人类遗传信息库继续快速积累。自人类基因组计划于2003年完成以来,人类DNA测序的成本已降低了一百万倍。哈佛医学院于2005年推出的个人基因组计划(PGP)旨在对来自世界各地的100,000名志愿者的完整基因组进行测序和宣传。由于数据量和数据的多样性,PGP本身就是大数据项目的一个主要例子。个人基因组包含大约100千兆字节的数据。除了对基因组进行测序外,PGP还从EHR,调查和微生物组概况中收集数据。
许多公司在商业基础上为健康,个人特征和药物遗传学提供直接面向消费者的基因测序。
这些个人信息可能会被大量数据分析所征服。例如,截至2013年11月22日,23andMe已停止向新客户提供与健康相关的遗传报告,以符合美国食品和药物管理局的要求。然而,在2015年,该公司再次开始提供其基因唾液测试的某些健康成分,这次是在FDA的批准下。
公共记录
政府会详细记录与健康有关的事件,例如移民,婚姻,出生和死亡。自1790年以来,美国人口普查每10年收集一次大量信息。截至2013年,人口普查统计网站拥有3700亿个小区,每年增加约110亿个小区。
网络搜索
Google和其他网络搜索提供商收集的网络搜索信息可以提供与人口健康相关的实时洞察。但是,通过将其与传统的健康数据源相结合,可以提高Web搜索模式中的大数据的价值。
社交媒体
Facebook,Twitter和其他社交媒体平台全天候生成丰富的数据,可以查看用户的位置,健康行为,情绪和社交互动。社交媒体大数据在公共卫生中的应用被称为数字疾病检测或数字流行病学。例如,Twitter已被用于分析一般人群中的流感流行病。
从宾夕法尼亚大学开始的世界福祉项目是研究社交媒体以更好地了解人们的经历和健康的另一个例子。该项目汇集了心理学家,统计学家和计算机科学家,他们分析在线交互时使用的语言,例如,在Facebook和Twitter上撰写状态更新时。科学家正在观察用户的语言如何与他们的健康和幸福相关。自然语言处理和机器学习的进步正在帮助他们的努力。宾夕法尼亚大学最近的一份出版物通过分析社交媒体研究了预测精神疾病的方法。通过研究我们对互联网的使用,可以发现抑郁症和其他心理健康状况的症状。科学家希望将来这些方法能够更好地识别和帮助有风险的个体。
物联网(IoT)
还收集大量与健康有关的信息,并将其存储在移动和家庭设备上。
- 智能手机:成千上万的mHealth应用程序捕获有关用户身体活动,营养摄入,睡眠模式,情绪和其他参数的信息。原生手机应用程序(例如GPS,电子邮件,短信)也可以提供有关个人健康状况的线索。
- 可穿戴式显示器和设备:嵌入在皮肤下的计步器,加速度计,眼镜,手表和芯片也可以收集与健康相关的信息,还可以将它们发送到云端。
- 远程医疗设备允许医疗保健提供者监测患者的参数,例如血压,心率,呼吸频率,氧合,温度,ECG描记和体重。
金融交易
患者的信用卡交易包含在Carolinas HealthCare System使用的预测模型中,用于识别重新入院的患者。总部位于夏洛特的医疗保健提供者使用大数据将患者分成不同的群体,例如,基于疾病和地理位置。
道德和隐私的含义
需要强调的是,在某些情况下,在收集和访问医疗保健数据时可能会产生重要的道德和隐私影响。新的大数据来源可以提高我们对个人和人口健康影响的理解,但是,需要仔细考虑和监控不同的风险。现在也已经认识到,可以重新识别先前被认为是匿名的数据。例如,哈佛大学数据隐私实验室的Latanya Sweeney教授审查了1,130名参与个人基因组计划的志愿者。她和她的团队能够根据他们分享的信息(邮政编码,出生日期,性别)正确命名42%的参与者。这些知识可以提高我们对潜在风险的认识,并帮助我们做出更好的数据共享决策。