研究论文介绍

Nature synthesis:神经网络NNET模型指导的Clovane倍半萜全合成

作者:西风

导读

近日,耶鲁大学Newhouse课题组在Nature Synthesis上报道了以神经网络NNET模型预测关键反应产率,辅助实现三个Clovane天然产物的高效全合成,为机器学习模型在复杂小分子合成中的应用提供了范例。

“A neural network model informs the total synthesis of clovane sesquiterpenoids

Pengpeng Zhang#, Jungmin Eun#, Masha Elkin, Yizhou Zhao, Rachel L. Cantrell & Timothy R. Newhouse*

Nat. Synth.2023. DOI: 10.1038/s44160-023-00271-0

正文:

高效合成复杂小分子,如活性天然产物,通常涉及详细的逆合成分析和对推测性合成路线的实验验证。而对于高风险策略的实验验证通常需要耗费大量的时间和资源,特别是当关键反应处于合成后期时,将为合成带来极大的风险。随着化学信息学和人工智能领域的飞速发展,计算机辅助的合成路线设计技术不断涌现,然而它们的实际应用仍存在一定局限性。不同于由计算机设计路线的Synthia 及Reaxys等商业化平台,耶鲁大学的Newhouse课题组提出了将人脑的创造性思维与计算机强大的虚拟分析能力相结合的策略,即首先由研究人员对目标分子的逆合成提出创新性关键步,随后通过训练机器学习模型预测所设计关键步的可行性,并通过虚拟筛选最优底物结构,以实现目标分子的高效全合成和多样性合成。该工作以“A neural network model informs the total synthesis of clovane sesquiterpenoids”为题,于2023-3-20发表于Nature Synthesis(DOI:10.1038/s44160-023-00271-0)。

Clovane倍半萜广泛存在于各种陆地和海洋生物中,具有多样的生物活性。其结构上具有独特的 [3.3.1] 桥环并五元环骨架(A-B-C)及三个全碳季碳中心。如何高效构建含双季碳中心的B环是其合成的最大难点,已知超过十余篇报道均采用前期引入或构建B环的策略,。区别于已知策略,作者设计了以6-endo-trig自由基环化为关键步在合成后期构建B环的策略。由于以类似转化构建6元桥环的例子较少,而以其竞争反应5-exo-trig为产物的报道居多,使得这一策略具有较高风险。

作者首先借助传统DFT计算方法分析反应过渡态能垒,ΔΔG计算结果表明其竞争反应5-exo环化在化学动力学上更易发生;6-endo环化作为热力学稳定产物,作者分析了120个已知6-endo-tig反应的能量变化(ΔGrxn)与产率之间的关系,发现两者并无相关性。因此,作者设想通过训练机器学习模型进行多参数的分析,以实现对自由基环化反应产率的预测。

按照图1b所示的流程图,作者以Reaxys数据库中收录的自由基反应为研究样本,经分类和筛选、快速DFT计算并提取物化参数;并经数据预处理、模型训练与验证等过程,最终以神经网络模型(NNET)实现对6-endo-trig自由基环化最佳反应产率的预测(R2 = 0.82,MAE = 12%)。随后以Y随机化测试、随机数测试等方式进一步检验模型,并以外推法对新底物类型的自由基反应进行预测(MAE = 15.7%)。

随后,申请人利用训练好的神经网络NNET模型评估不同逆合成切断方式(7-9),证明以前体8的6-endo-tig自由基环化反应具有较高可行性(预测产率46%);并通过对100个潜在底物结构进行虚拟筛选,为该家族分子的多样性合成挑选了相应底物结构(1014)。在模型指导下,作者从商业可得的原料15出发,经5步转化实现了clovan-2,9-dione的全合成;其中6-endo-tig自由基环化实验产率45%(6-endo:5-exo = 1:1)与模型预测的46%相一致。

此外,在模型指导下,作者通过对中间体17进行结构修饰得到另一自由基反应前体10硒化物23),并以38% 的收率顺利实现6-endo自由基环化,进而分别实现天然产物canangaterpene II (2)和rumphellclovane A (26)的8步首次全合成,并结合NMR计算修正了canangaterpene II(2)的立体结构。此外,作者还选取了另外5个不同类型的反应前体(11-1227-29)做为实验验证,验证不同取代基对自由基反应产率的影响;它们的实验产率均与模型预测产率相一致(MAE=6.3%),证明了NNET模型预测的准确性和可靠性;通过对比前体278的预测产率(24% vs 46%)可以看出模型对化合物结构的具有较高敏感性。

总结

耶鲁大学Newhouse团队讲述了以文献数据(Reaxys及SciFinder)训练机器学习模型,预测6-endo-trig自由基环化反应产率,进而辅助实现三个Clovane倍半萜的全合成,表明“人机互补”策略在复杂小分子合成中的优势。该工作是在Tim Newhouse教授指导下,由张鹏鹏博士及研究生Jungmin Eun等人合作完成,为其他类型预测模型的开发和应用提供了借鉴流程。

(本文由Tim Newhouse教授课题组供稿)

参考文献:

  •  Mikulak-Klucznik, B. et al. Computational planning of the synthesis of complex natural products. Nature 588, 83–88 (2020).
  •  Bideau, F. L. et al. Tricyclic sesquiterpenes from marine origin. Chem. Rev. 117, 6110–6159 (2017).
  •  Liu, G., Zhang, Z., Fu, S. & Liu, B. Asymmetric total synthesis of rumphellclovane E. Org. Lett. 23, 290–295 (2021)
  •  Zhou, Y., Qin, J.-L., Xu, W., Yu, Z.-X., Total Synthesis of Clovan-2,9-dione via [3 + 2 + 1] Cycloaddition and Hydroformylation/Aldol Reaction. Org. Lett. 24, 5902–5906 (2022)

相关链接:

世界著名化学家-Timothy R. Newhouse

Timothy R. Newhouse教授课题组主页https://campuspress.yale.edu/newhousegroup/tim-newhouse/

本文版权属于 Chem-Station化学空间, 欢迎点击按钮分享,未经许可,谢绝转载

Related post

  1. 南开大学李鑫教授团队Angew: B(C6F5)3/CPA催化酮…
  2. Angew:苄基胺与三氟甲基芳烃的α-二氟烷基化反应方法学
  3. JACS:Darobactin A的阻转选择性全合成研究
  4. 5-羟色氨酸选择性生物偶联反应
  5. Angew:铜催化的C(sp3)-胺化反应方法学研究
  6. Org. Lett.:钯催化二氮丙啶酮与炔烃的Domino反应合…
  7. 简单的反应也能玩出花 —Lancifodilacton G醋酸酯…
  8. 余志祥课题组:金属杂Claisen重排反应的发现与启发

Comment

  1. No comments yet.

  1. No trackbacks yet.

You must be logged in to post a comment.

Pick UP!

微信

QQ

广告专区

PAGE TOP