反应条件优化让人头秃？来看AI怎么做

chem化学亮点2021-03-154.9W

在有机化学研究领域中，反应条件的优化需要化学家评估各种反应参数（如底物、催化剂、试剂、添加剂、溶剂、浓度、温度以及反应器类型等，图1a），无疑是让人挠头到头秃的挑战。有意思的是，在热火朝天的人工智能（AI）领域中，参数优化也同样无处不在。对这两个领域来说，参数优化是实现反应高产率/高选择性和AI模型优异表现的关键，从某种程度上看颇具相似性。但由于实验成本高、耗时长，这两个领域的科学家通常只能从大量（超）参数空间中选择一小部分来评估。幸运的是，高通量实验（THE）的现代发展扩展了实验能力，能够在有限的条件下收集几千个数据点。而且，化学家通常通过查阅化学文献寻找相似的反应，并凭借知识和经验找出最可能有效的反应参数来进行实验（图1b）。而AI专家在经验的基础上，有时候会采用贝叶斯优化算法（Bayesian optimization）在允许的实验时间内找到可能的最优参数组合（图1c），这是因为贝叶斯优化算法是一种基于响应面的迭代全局优化算法，在机器学习模型的调试中展现出卓越的性能。

最近，贝叶斯优化在化学领域也得到了应用，如来自利物浦大学的Andrew I. Cooper课题组就利用贝叶斯优化算法来引导合成机器人更高效的做实验（Nature, 2020, 583, 237–241）。然而，它在合成化学反应条件优化中的应用和评价却尚未得到研究。近日，美国普林斯顿大学的Abigail G. Doyle教授和Ryan P. Adams教授合作在Nature上发表研究论文，开发了贝叶斯反应优化框架和开源软件工具，并将贝叶斯优化算法应用到反应条件优化中（如Mitsunobu反应和脱氧氟化反应），结果显示贝叶斯优化的平均优化效率（实验次数）和一致性（结果相对于初始可用数据的方差）均显著高于人类化学家。

反应条件优化让人头秃？来看AI怎么做第1张

图1. 当前反应优化与本文工作。图片来源：Nature

首先，作者从文献中收集了钯催化的Suzuki–Miyaura反应和Buchwald-Hartwig反应作为数据集（图2），用于贝叶斯优化器的开发和评估。其中Suzuki反应数据集（反应1，3696个反应）由硼酸衍生物、芳基卤化物、配体、碱和溶剂以及对应的反应产率所组成；Buchwald-Hartwig反应数据集（反应2a-e，792个反应）则由芳基卤化物、Pd预催化剂、添加剂和碱以及对应的反应产率所组成。作者利用这两个反应数据集确定了基本的贝叶斯优化器框架。

反应条件优化让人头秃？来看AI怎么做第2张

图2. 用来选择贝叶斯优化器参数的训练数据。图片来源：Nature

随后，作者系统地比较了贝叶斯优化器与人类化学家的优化效率。以咪唑的芳基化反应为例（反应3，图3a），他们通过高通量反应器得到了涵盖1728个反应的化学空间，其中包括12种配体、4种碱、4种溶剂、3种温度和3种浓度。为了将贝叶斯优化器的性能与化学家进行直观对比，作者开发了一个“游戏”程序。具体而言，参与者有“一个月”的时间来寻找反应3的最佳条件，并且每个工作日可以进行5次实验，每次实验“运行”后会返回相应实验的实际结果，也就是说，总共可以进行100次实验来寻找反应3的最佳条件。总共有50名来自学术界和工业界的化学家参与了反应优化“游戏”（图3c）。与此同时，贝叶斯反应优化器也进行了50次“游戏”（图3b），且每次初始实验条件都是随机选择。结果显示，人类化学家的初始选择明显优于贝叶斯优化器的随机选择（平均高出15%）。然而，在第3轮实验后，贝叶斯优化器的风头就盖过了人类化学家；而且，与人类化学家相比，贝叶斯优化器在50次“游戏”中都能找到产率>99%的反应条件（CgMe-PPh、CsOPiv or CsOAc、DMAc、0.153 M、105 °C）。值得一提的是，CgMe-PPh此前从未被用作咪唑芳基化反应的配体，因此有经验的化学家起初并不倾向于选择这种配体。为了更直观地比较贝叶斯优化器和人类化学家的表现，作者还计算了人类化学家最佳和最差情况的边界以及每种情况的p值（图3d、3e）。从中可以明显看出，经过第5轮实验后贝叶斯优化器的平均表现显著优于人类化学家。

反应条件优化让人头秃？来看AI怎么做第3张

图3. 本文涉及的自动合成反应以及人类化学家与贝叶斯优化器的表现。图片来源：Nature

接下来，作者进行了现实案例的贝叶斯优化测试。由于Mitsunobu反应在标准反应条件下通常只能提供中等的产率，因此定义明确但可扩展的潜在反应试剂使Mitsunobu反应成为贝叶斯优化的理想测试案例。如图4所示，作者选择了反应4作为Mitsunobu反应例子，该反应空间由6种氮杂二羧酸、12种膦和5种溶剂组合而成。此外，他们还确定了底物浓度、氮杂二羧酸当量、膦当量和温度作为连续的参数，总共构成了有18万种可能的条件优化空间。在此基础上，作者随机选取第1轮的10个条件进行实验，随后每轮的实验条件都用贝叶斯优化器选择。值得注意的是，作者发现优化器很快就超过了基准产率（60%），并且在第4轮就找到了三组产率达到99%的反应条件。

作者第二个研究体系便是醇的脱氧氟化反应（反应5，图4）。该反应空间由10种磺酰氟化物、10种有机碱和5种溶剂组成，加上底物浓度、磺酰氟当量、碱当量和温度等连续参数，总共有312,500种组合。类似地，作者首先用标准反应条件得到36%的产率，然后随机选取第1轮的5个条件进行实验，随后每轮的实验条件都用贝叶斯优化器选择，结果显示在第3轮得到的最高产率就超过了标准条件的产率。经过10轮实验，最高产率达到69%。重要的是，在两个测试反应中，贝叶斯优化都识别了一系列实验条件，并且其参数设置与标准条件大有不同。尽管这些参数设置在大多数维度上有所不同，但都提供了很好的实验结果。

反应条件优化让人头秃？来看AI怎么做第4张

图4. 贝叶斯反应优化器在Mitsunobu反应（4）和脱氧氟化反应（5）中的应用。图片来源：Nature

总的来说，作者通过钯催化的芳基化反应开发了贝叶斯优化器，随后以咪唑的芳基化反应为例系统地比较了贝叶斯优化器与人类化学家在反应优化中的表现，发现贝叶斯优化器的平均优化效率显著优于人类化学家。最后，作者通过Mitsunobu反应与脱氧氟化反应两个案例，将贝叶斯优化方法应用到日常的有机实验室的条件优化中，说明纯数据驱动的反应优化策略有时候比化学家的直觉和经验更高效。

简评

Abigail G. Doyle教授课题组此前就用过机器学习预测偶联反应的收率（Science, 2018, 360, 186–190），即利用高通量+量化描述符结合机器学习预测反应产率，本文从逻辑上看其实也是类似的组合，只不过换了一个新的应用。从技术上来说，本文用到的贝叶斯优化算法创新性较少。笔者认为，本文最大的亮点是让化学家认识到固有的优化反应条件的思维定势不一定是一个最优解，用机器学习完全可以更高效的优化反应。不过贝叶斯优化器需要化学家预先给出可能的反应空间，才能在限定空间内探索。这也意味着这个优化器很难跳出化学家的经验思维，只不过是可以更快的找到合适的条件组合。或许随着技术的进步，将来真的能出现类似AlphaGo Zero一样无需人类经验的AI，给我们带来天马行空般的反应条件优化体验。

Nature, 2021, 590, 89-96, DOI: 10.1038/s41586-021-03213-y

本文地址：https://www.chemrss.com/964.html