作者:石油醚
本期热点研究,我们邀请到了本文第一作者,来自耶鲁大学的张鹏鹏博士为我们分享。
2023年3月20日,Nature Synthesis在线发表了来自耶鲁大学Newhouse团队题为「A neural network model informs the total synthesis of clovane sesquiterpenoids」的研究论文。文中,报道了以神经网络NNET模型预测关键反应产率(6-endo-trig自由基环化反应),辅助实现三个Clovane天然产物的高效全合成,为机器学习模型在复杂小分子合成中的应用提供了范例。
“A neural network model informs the total synthesis of clovane sesquiterpenoids
Pengpeng Zhang#, Jungmin Eun#, Masha Elkin, Yizhou Zhao, Rachel L. Cantrell & Timothy R. Newhouse*
Nat. Synth., 2023. DOI: 10.1038/s44160-023-00271-0”
Q1. 请对“A neural network model informs the total synthesis of clovane sesquiterpenoids”作一个简单介绍。
复杂天然产物的合成存在实验周期长、试错成本高等诸多挑战。随着计算机技术和人工智能领域的飞速发展,合成化学研究也迎来了新的机遇和挑战。耶鲁大学Newhouse团队提出了将人脑的创造性思维与计算机强大的虚拟分析能力相结合的策略,通过训练神经网络NNET模型预测关键反应——6-endo-trig自由基环化反应的产率,用于判断所设计高风险路线的可行性并指导底物结构设计,从而进行 Clovane家族天然产物的高效全合成和多样化合成。该策略极大提高了合成效率,也为其他类型预测模型的开发和应用提供了借鉴流程。
Q2. 有关本次研究的时候遇到过怎样的困难呢?又是怎样克服的呢
本次研究时间处于美国COVID肆虐的大环境下,遇到的困难应该是几经波折心态的调整和团队成员积极性的调动,因为科研中实验人员的心态对于实验的成功也至关重要。起初我设计的合成路线被合作者认为可行性较低而不愿开展实验,好在我及时以机器学习模型证明路线具有良好可行性,使团队具有信心和动力开展合成实验。当我们初步实现所设计的关键反应6-endo-trig环化时,心中虽充满欢喜,但其产率仅为20%与模型预测的46%相差甚远,模型预测的准确性再次受到质疑。经过坚持不懈的条件优化,我们最终得到45%的最优产率,于是对模型重拾信心,并根据预测结果合成了另外的天然产物。同时实验验证结果进一步证明了模型预测的准确性,也打消了审稿人的疑虑。
Q3. 本次研究主体,有没有什么让您感觉特别辛苦和烧脑呢?
让我感觉到辛苦的是模型训练时的数据预处理过程:因为从数据库中直接获取的数据通常会存在一些误差,为了保证数据质量我查找了所有相关文献及支持信息,对数百个化合物结构和数据信息进行逐一比对,这一过程较为枯燥和费时。另外,我认为文章撰写和修改过程是比较烧脑的,该课题内容繁多,涉及到有机合成、DFT计算、NMR计算、机器学习等多个方面。考虑如何以简练的图表整合各方面内容,并在有限的篇幅内讲述完整故事且突出重点,以及数十遍的文章修改过程都令人绞尽脑汁。
Q4. 将来想继续研究化学的哪个方向呢?
我未来要研究人工智能辅助的合成化学及药物化学等方向。我认为这一研究领域极具发展潜力,希望自己能为合成化学的自动化和智能化发展贡献力量。
Q5. 最后,有什么想对各位读者说的吗?
科研中即要保持积极乐观的心态,也要有坚持到底的执着!借用陆游的诗句“山重水复疑无路,柳暗花明又一村”与大家共勉。
作者教育背景简介
教育背景:
2009-2013 兰州大学,本科(导师:曹小平教授、陈兴国教授)
2013-2018 北京大学,博士(导师:杨震教授、龚建贤副教授)
2018-至今 耶鲁大学博士后研究员(合作导师:Prof. Timothy Newhouse)
本文版权属于 Chem-Station化学空间, 欢迎点击按钮分享,未经许可,谢绝转载
No comments yet.