互联网时代,社交媒体是一种生活方式,很多人习惯于在社交网络上分享自己的动态、心情或感悟。浏览完一个社交网络爱好者的朋友圈后,我们能够了解这个朋友的许多私人信息,包括外貌、性格甚至健康状况。近期,来自宾夕法尼亚大学的学者发表了一项最新研究成果,他们通过分析志愿者的Facebook帖子,准确预测了他们的健康状况,其中,对糖尿病和包括焦虑、抑郁、精神病的精神健康状态的预测尤为准确。 利用Facebook帖子预测志愿者潜在疾病的方法。图片来源:PLoS ONE 研究人员从999名志愿者的近100万条Facebook动态中抓取了2000多万个单词,并进行编码,生成“词语云”,经过学习预测模型后输出他们关注的21种疾病类别的预测结果,并与人口统计信息的预测结果进行对比。两种预测结果都由电子病例来验证。 研究人员关注的21种疾病。图片来源:PLoS ONE 研究人员将志愿者的电子病历(EMR)与他们的社交媒体数据联系起来,以确定他们是否可以通过社交媒体上发布的语言预测个人的医疗诊断,以及他们是否可以从社交媒体帖子中识别出特定的疾病标记。该团队构建了三个模型来分析他们对患者的预测能力:一个模型评估了Facebook的后期语言,另一个模型评估了年龄、性别种族等人口统计信息,以及最后一个模型组合了两个数据集。研究人员表示:“这是第一项利用Facebook上的语言预测人们状况的研究,它能够有效得将患者的日常生活与健康联系起来,提供了个性化医疗的新方式。” 研究结果表明,与年龄、性别和种族等标准人口统计学因素相比,仅使用Facebook语言可以更好地预测10种医疗状况(见下图)。 Facebook和人口统计数据对不同疾病预测准确性对比。图片来源:PLoS ONE 尤其需要关注的是,与人口统计信息相比,Facebook帖子中使用的语言在预测糖尿病和精神健康状况(包括焦虑、抑郁和精神病)方面特别有效。 帖子中的抓取出的高频词是一些疾病的有效“标记物”。例如,酒精滥用的标志是提到饮料、醉酒和瓶子。表达敌意的言论,如愚蠢和某些咒骂,则作为药物滥用和精神病的指标。而和抑郁症最相关的话题一般是身体(例如胃痛、头痛、伤口)和情绪困扰(例如痛苦、哭泣、眼泪)方面的词汇。而性传播疾病患者的社交媒体中则常常出现需要“打星号”的词语。 不同“词语云”预测的疾病(第二行真的很粗鄙了)。图片来源:PLoS ONE 研究人员还发现了一个有趣的现象。糖尿病的语言标记出现了很多宗教词汇(例如上帝、家庭、祈祷)。这当然不意味着信仰某种宗教(吃糖教除外)会导致糖尿病,而是暗示了宗教或许会在糖尿病管理或控制中起作用。 研究人员在论文中写道:“每天有超过20亿人通过社交媒体分享他们的日常生活信息,透露出他们的情绪、个性、性别、年龄、种族、行为等等。这些内容对医生的诊断来说无疑是重要的,尤其对一些生活习惯或状态造成的慢性疾病。临床医生不可能看到这些内容。我们第一次将电子病历数据与志愿者的社交媒体数据联系起来。我们发现患者的Facebook状态可以预测许多健康状况,确定疾病发作或恶化的可能性。”这对于及时干预疾病进程无疑有重要帮助。 不过凡是涉及社交媒体的数据,安全性和隐私保护总是不能绕开。利用社交媒体进行疾病的预测甚至辅助诊断自然有其独到的优点,但从另一个角度说,这些数据可能会暴露用户健康方面的隐私。此外,有一个人工智能时代的伦理学难题:如果通过准确率极高的数据分析发现一个人的犯罪概率极高,执法部门应该在他犯罪之前采取措施吗?类似的,如果本文讨论的技术变得非常成熟,能够预测出一个人极大概率会变成酒鬼、神经病甚至瘾君子,有关部门应当采取什么措施呢? 当然,我们希望互联网、社交媒体、人工智能代表的技术浪潮能够最大程度地改善人们的生活,并把“恶”的一面控制在最小程度。没有人愿意自己发的朋友圈被某些人或公司用来推销药物、保健品,或者推广“XX系”医院吧?想想都有点不寒而栗。
发帖习惯,可能暴露你的健康状况
化学科普3.9W+
版权声明:本网站发布的内容如果涉及侵权请尽快告知,我们将会在第一时间删除。
还木有评论哦,快来抢沙发吧~