化学经纬
化学经纬

看结构识气味,AI又成显眼包

chem化学科普7.0K+

无论是下围棋还是玩电脑游戏,无论是预测反应收率还是设计合成路线,人工智能(AI)在很多方面比人类表现的更好已经不是什么新鲜事。总体来看,在一些重复性高、规则性强、数据量大的工作中,目前AI往往可以更快、更准确地完成任务。就模拟人类感觉来说,AI在视觉和听觉方面的表现已经非常出色,其中一个重要的原因就是对于视觉和听觉已经有了完善的映射,可以将外来信号的物理性质(如频率和波长)与人类感知性质(如音高和颜色)联系起来。但对于嗅觉和味觉,却难以如此操作。气味感知与分子结构之间,充满了不确定性,几乎没有任何规律。为了更好地理解嗅觉编码,或许需要一个更准确的映射关系。

看结构识气味,AI又成显眼包 第1张

生物神经网络示意图。图片来源:Nat. Commun[1]

为了解决这个问题,近日,谷歌研究院(Google Research)的Alexander B. Wiltschko团队与莫奈尔化学感官中心(Monell Chemical Senses Center)的Joel D. Mainland团队合作在Science 杂志上发表论文,采用图形神经网络(graph neural networks, GNN)生成了“主气味图”(principal odor map,POM)。通过对模型的训练,可以根据分子结构准确预测不同分子的气味,为嗅觉的数字化铺平了道路。值得一提的是,Wiltschko还是初创公司Osmo的联合创始人及CEO。Osmo总部位于美国马萨诸塞州,是从谷歌研究院独立的一家衍生公司,致力于AI嗅觉研究和应用,在首轮融资中筹得6000万美元 [2]

看结构识气味,AI又成显眼包 第2张

“主气味图”。图片来源:Osmo [3]

研究者借鉴了近年来深度学习领域中的热门概念——图神经网络(GNN),这种学习方式更接近人类。相比于将简单的文本和图像转化为脉冲信号,GNN则是利用图像承载数据,分析图数据中提取的节点,进行深度学习。由于图经常是动态的,因此节点顺序、模式等也都是随时变化的,通过对非欧空间中不同大小且无序节点的处理,完成机器学习。

看结构识气味,AI又成显眼包 第3张

欧式空间中的图像、非欧空间中的图形节点。图片来源:AI Open[4]

为了生成分子的结构与气味之间的映射关系,研究者构建了一个消息传递神经网络(MPNN),它是GNN的一种特殊类型。每个分子都被表示为一个图,其中每个原子由其价态、键数、氢的数量、杂化方式、电荷形式、原子序数等多个维度进行定义。与传统的指纹技术不同,GNN可以判断不同片段在气味表达中所占的权重。随后,他们整理了约5000种分子的数据集,每种分子由多个气味标签进行描述,并让机器对这些分子和气味标签进行学习。

看结构识气味,AI又成显眼包 第4张

机器学习利用GNN绘制“主气味图”。图片来源:Science

如何验证机器学习的可靠性呢?人类的嗅觉或许是评判气味特性的唯一标准。尽管不同个体对气味的感知差别很大,但是在经过训练后,评审小组(≥15人)可以准确的从55个气味形容词中找到匹配的描述,且平均评分具有稳定性。于是比赛开始,人类小组和GNN算法分别对400种气味物质进行标签选择及评分,人类基于嗅觉判断,而算法基于分子结构,结果显示,GNN模型竟然表现出人类水平的嗅觉分辨性能。

看结构识气味,AI又成显眼包 第5张

GNN模型和人类评审小组对气味分子进行标签预测及评分。图片来源:Science

有趣的是,GNN模型对大蒜味和鱼腥味的判断上表现最佳,因为大蒜味分子多含硫,而鱼腥味多为胺类,具有明确的结构决定因素。而对于包括了至少五个不同结构类别(大环、多环、硝基、类固醇型和直链)的麝香标签,模型的识别率最差。如果按化学类别分类,GNN模型和评审小组的表现整体相对一致,且含硫分子表现最好。

此外,对于学习次数较多的标签(即常见气味),如水果味、甜味、花香味,GNN模型表现良好;而对于训练较少的标签,除了分子结构特征明显的一些标签(如鱼腥味、松香味),其他则表现较差(如臭氧味、刺激性气味、发酵味)。

看结构识气味,AI又成显眼包 第6张

GNN模型判断分子的气味。图片来源:Science

当然,气味的复杂性表现在于,相似的分子结构可能表现出完全不同的气味(下图A中②和③),而结构不同的分子,则可能表现出相似的气味(下图A中①和)。研究者对这种现象进行测试,GNN模型对这种特殊结构-气味关系的预测正确率为50%,而传统机器学习模型——随机森林(Random Forest,RF)的正确率仅为19%。

看结构识气味,AI又成显眼包 第7张

特殊结构-气味关系的预测。图片来源:Science

基于GNN模型,研究者预测了50万种分子的气味,甚至大多数物质从未被合成过。如果利用人力对这些分子进行嗅觉判断,需要70人连续工作1年的时间。

看结构识气味,AI又成显眼包 第8张

利用“主气味图”进行嗅觉预测。图片来源:Science

有趣的是,作为人类气味评审小组的成员之一——Jonathan Deutsch——在接受Science杂志采访时表示,作为一名研发主厨(research chef),他同意加入小组利用嗅觉对400瓶未标记的液体进行测评时,完全没有想到竞争对手竟然是计算机 [5]

看结构识气味,AI又成显眼包 第9张

Jonathan Deutsch测评未知化学物质的气味。图片来源:Science [5]

Osmo公司的神经科学家里克•格金Rick Gerkin(论文作者之一)曾在十年前参加了莫奈尔化学感官中心组织的AI“嗅探器”比赛并获奖,这也成为他们合作的契机。现在,研究者可以预测更多的气味分子。“现实世界中遇到的复杂气味,往往是混合物”,Gerkin说,“这是我们的算法下一步要解决的问题” [5]

Alexander Wiltschko也表示,他们正在根据机器学习的结果,设计并合成新的气味剂。不过,也有研究者认为,“主气味图”没有揭示人类嗅觉背后的生物学原理,即不同分子如何与人类鼻子中约350个气味受体相互作用 [6],其中更多的化学和生物方面的未解之谜,等待科学家们继续探索。


A principal odor map unifies diverse tasks in olfactory perception
Brian K. Lee, Emily J. Mayhew, Benjamin Sanchez-Lengeling, Jennifer N. Wei, Wesley W. Qian, Kelsie A. Little, Matthew Andres, Britney B. Nguyen, Theresa Moloy, Jacob Yasonik, Jane K. Parker, Richard C. Gerkin, Joel D. Mainland, Alexander B. Wiltschko
Science, 2023, 381, 999-1006, DOI: 10.1126/science.ade4401

参考文献:
[1] S. Subbulakshmi Radhakrishnan, et al. A biomimetic neural encoder for spiking neural network. Nat. Commun. 2021, 12, 2143. DOI: 10.1038/s41467-021-22332-8
[2] Osmo公司官网
https://www.osmo.ai/
[3] Science Paper Shows Osmo AI Passes the Sniff Test
https://www.osmo.ai/blog/science-paper-shows-osmo-ai-passes-the-sniff-test
[4] J. Zhou, et al. Graph neural networks: A review of methods and applications. AI Open2020, 1, 57-81, DOI: 10.1016/j.aiopen.2021.01.001
[5] AI rivals the human nose when it comes to naming smells
https://www.science.org/content/article/ai-rivals-the-human-nose-when-it-comes-to-naming-smells
[6] AI predicts chemicals’ smells from their structures
https://www.nature.com/articles/d41586-023-02714-2

发布评论0条评论)

您需要 登录账户 后才能发表评论

还木有评论哦,快来抢沙发吧~