Meta AI 公司于 5 月 14 日发布博文,发布了全新化学数据集 Open Molecules 2025(OMol25)以及通用原子模型 Universal Models for Atoms(UMA)。
OMol25 数据集:化学研究新利器
OMol25 是迄今为止规模最大的分子模拟数据集,由 Meta 与美国能源部劳伦斯伯克利国家实验室(Berkeley Lab)联合打造,该数据集包含超过 1 亿个 3D 分子快照,基于密度泛函理论(DFT)计算而成。
DFT 是一种强大的工具,能精确模拟原子间相互作用,帮助科学家预测每个原子的受力及系统能量,从而揭示分子运动和化学反应的规律。
传统的 DFT 计算需要巨大的计算资源,随着分子规模增大,计算需求呈指数级增长,使用最先进的计算设备,也难以模拟现实世界中复杂的分子系统。
基于 DFT 数据训练的机器学习原子间势(MLIPs)能以快 1 万倍的速度提供同等精度的预测,让科学家能在普通计算系统上模拟大型原子系统。OMol25 作为化学多样性最高的分子数据集,为训练 MLIPs 提供了前所未有的数据支持。