全网最佳IP代理服务商- 9.9元开通-稳定的代理服务
如果您从事外贸、海外视频博主、海外推广、海外广告投放,欢迎选择我们。
让您轻易使用国外主流的聊天软件、视频网站以及社交网络等等

购买clash节点

购买clash节点

一种快速计算结合情况的方法使得虚拟筛选和药物工程等关键应用成为可能。而现有方法计算上昂贵,原因是它们依赖于对大规模候选分子采样、打分、排名和微调等。文章提出EquiBind模型,该模型是一种SE(3)-Equivariant几何深度学习模型,它可以直接预测(1)受体上的结合位置(盲对接)和(2)配体的结合姿态和方向。其实这里可以理解为一种“双盲”,对配体的结合姿态的盲和对受体结合口袋位置的盲。这个模型相比最新模型具有更好的计算速度和预测质量。除此之外,文章还发现使用微调对该模型具有提升作用;并且在最后提出了一个能够调整可旋转键的扭转角度,来加速预测结合情况的过程。

总而言之就是,又快(推理速度快了几千倍)又好(推理的结合情况准确度具有竞争力),需要的信息又少(可以在不需要知道蛋白质口袋精确位置下推理,也可以在不知道配体结合姿态下推理)。

药物结合是药物发现中的关键问题。药物发现的核心问题之一是理解药物类分子(配体)如何与目标蛋白(受体)形成复合物,也就是药物结合,这是虚拟筛选药物分子的前提。描述配体受体结合机制是涉及多方面的困难问题,包括结合动力学、构象变化(分子内部弹性)、化学和几何原子相互作用。例如,分子复合物形成的经典模型是“锁和钥匙”,“诱导适应”和“构象选择”,而疏水购买clash节点、氢键和π-堆积是最常见的原子结合相互作用,但在结合过程中也会出现其他类型。

现有药物结合模型计算非常低效。在我们的实验中,GNINA方法针对单一配体-受体对平均需要146秒,而商业软件Glide的速度更是比它慢9倍。这是由于之前所有结合模型采用的策略导致的。首先,通过彻底抽样可能的结合位置和姿态(例如,数以百万计)生成大量的候选复合物,导致候选规模太大;然后,使用评分和排名步骤来检索最有前途的实例;最后,采用基于能量的微调方法最好地吻合配体到相应的口袋位置上。

一个新的药物结合模型直接预测配体-受体复合体结构clash节点链接怎么用,。引入新的几何图深度学习药物结合模型,EquiBind。使用图匹配网络(GMN)和E(3)等变图神经网络(E(3)-GNN)来直接预测配体-受体的复杂结合结构,而无需过量采样,因此加速了推理时间。

由于3D结构数据的稀疏性,需要从物理化学或者生物的一些规则中为模型提供先验,从而仅仅使用系数的数据就期望能够得到可靠的模型:(1)输入分子对的3D位置和方向的独立性(即,即使输入的分子对的位置和方向变化,也应该得到相同的结合体);(2)改变可旋转键的扭转角度来增加配体弹性,从而避免根据不同的姿态大量的采样;(3)使用一个非交叉损失来避免结合的时候相撞。

该模型以配体分子图的随机三维构象和受体结构作为输入,输出结合后的复合结构。首先,该模型将输入分子表示为空间k近邻图(k-NN Graph)。配体图G =(V,E)使用原子、构象中的3D坐标和初始特征比如原子类型作为G的节点。边界包括距离截止4˚A内的所有原子对。受体图将残基、3D坐标和节点特征作为节点,连接采用图中距离小于30˚A的10个最近节点相连。后续的设计都是针对以上提出的物化生规则的。

独立的E(3)等变变换。为了输入分子对的3D位置和方向的独立性,我们使用独立的E(3)等变图匹配网络(IEGMN),它结合了MGN和E(3)-GNN。该架构联合转换特征和3D坐标,以执行内部和外部神经图消息传递。从形式上讲,IEGMN(X,F,X,F)= Z,其中Z,Z是变换后的坐标,而H,H则是特征嵌入。从形式上讲,IEGMN(X,F,X,F)= Z,其中Z,Z是变换后的坐标,而H,H则是特征嵌入。 IEGMNs的核心是,堆叠任意数量的这些层保证原始输入结构的任何独立旋转和平移都将完全反映在输出中。结构中显示的Z,H,Z,H输出是通过堆叠几个IEGMN层获得的。IEGMN转换的输出Z和Z将用于不同的角色:识别刚体变换和键合位点,以及通过训练Z来表示变形原子点云来模拟配体灵活性。

通过结合关键点的刚性变换。为了将配体对齐正确的位置和方向,我们使用SE(3)等变多头注意机制计算配体和受体结合关键点。这些关键点经过训练,以匹配真实的结合靶点。在我们的情况下,真实结合口袋点定义为将配体原子与受体原子(例如侧链)相连的段的中点,距离小于4˚A。对于结合配体灵活性的模型,这些口袋点被定义为距离任何受体原子小于4˚A的所有配体原子。当配体和受体尚在分离时,我们试图将相应的结合位置及其使用两个预测关键点集Y和Y的精确匹配。如果预测得很完美,将Y和Y重合的SE(3)变换将精确地执行配体对接。

建模化学可行的配体灵活性。为了避免根据不同的姿态大量的采样,对配体的灵活性进行建模。在过去,人们一直假设药物类分子最灵活的部分是可旋转键,而局部原子结构(LAS,键长和相邻的键角)或小环大多是刚性的。我们通过Z来模拟配体灵活性,使用两个额外的损失函数项训练我们的模型:配体RMSD(均方根偏差)和Kabsch-RMSD1。我们对LAS施加距离几何约束:这个过程的首要目标是在每次坐标变换后,在IEGMN层中强制执行LAS距离约束。从形式上讲,如果转换后的坐标Z在两两位置之间的距离与固定构象X的两两位置之间的距离足够接近,则它们满足LAS距离几何约束。

分子点云进一步拟合。由于模型有时会产生不真实的分子结构,为了解决这个问题,我们只改变初始(RDKit)构象X的扭转角度,以尽可能匹配Z,同时保持LAS不变,从而强制保证化学上合理的输出结合构象。输出将是一个新的构象,其中C和X的距离几何约束为0。首先,C初始化为X,只改变其可旋转键的扭转角度。其中一种选择是优化C,以最小化Kabsch-RMSD(Z,C)。 但是,这种方法需要优化所有可旋转键的扭转角度的迭代优化策略,这可以使用微分进化算法或其他局部随机搜索策略来完成。这在计算上是昂贵的(例如,单个44可旋转键分子需要51分钟),可能无法找到良好的局部最小值。基于梯度的方法可以更好地捕获各种分子相互作用,但是考虑到二面角的几何依赖性,键的扭转角度是非平凡的。 我们提出了一种更便捷的无需优化的替代方案。

我们使用来自PDBBind(Liu等,2017)的蛋白质-配体复合物,它是蛋白质数据库(PDB)(Berman等,2003)的一个子集,提供单个蛋白质和复合物的三维结构。最新版本PDBBind v2020包含19 443个蛋白质-配体复合物,其中3890个独特的受体和15 193个独特的配体。在19 119个预处理的复合体中,有1512个是在2019年或更新的时候发现的。在这些复合物中,我们随机抽样125个不同的蛋白质并收集其中所有新的复合物(363个)以创建最终的测试集。测试样本量很低,是为了使与耗时的经典物理密封法进行比较成为可行的。从2019年之前的其他复合体中,我们去除了那些含有测试集中的配体的复合体,剩下17 347个用于训练和验证的复合体。这些复合物分为968个验证复合物和16 379个训练复合物,其中没有配体与剩余的复合物相同。在两种实验设置下进行,分别是Self-docking和Re-docking。

Blind Self-docking(配体在结合以前不知道自己的结合姿态)。这组实验反映了在最典型的应用场景中,即未知配体结合角度和距离(用于重新加载)情况下可能得到的性能。从2D分子图获得初始近似构象时,我们使用随机RDKit构象。结果表1显示,vanilla EQUIBIND在识别近似结合位置方面表现良好,并且有显著的推理速度提升,使我们的方法适用于诸如ZINC之类的拥有上千万分子的数据库的虚拟筛选等极高吞吐量的应用。因此,实践者可以将我们的方法与先前的微调基线相结合,并根据感兴趣的下游任务来决定质量和速度的折中。

与最快的基准线相比,EQUIBIND的速度快了三个数量级,在 4°A预测中也有所改善。EQUIBIND对于难以预测的复合物(例如由于配体尺寸)表现更好。针对质心距离,实际构象不是关键,方法主要必须找到正确的结合口袋位置。在这里,EQUIBIND已经能够与经典方法匹配。

这一阶段实验主要结论是:EquiBind比其他模型速度快得多,其预测离真实构象较为接近,并且可以使用快速微调得到非常低的预测结果。

Blind Re-docking(结合体中拿出配体要求重新对接)。结合受体的配体被从结合口袋中抽取出来,放在随机位置,而EquiBind需要将其重新加入正确的构象。因此,该方法可以访问配体的基本真实结构,并且所有的预测都会具有正确的键长和角度。模型将配体视为完全刚性的物体,只预测一个平移和旋转。

通过对初始构象的扭转角度、键角和键长的实验,EquiBind的预测受到初始构象的影响较小。对于363个复合物,我们生成30个不同的RDKit构象。EQUIBIND使用每个构象预测一个结合结构,并获得30个L-RMSD值,其中我们计算标准偏差发现大多数小于0.5clash节点链接怎么用,。

可视化的结果。EquiBind的预测很少偏离真实的配体,但有时它很难找到准确的扭转角度,因此也就找不到正确的原子构象。此类情况其他模型表现更差,而EQUIBIND能够找到结合位置。

限制。缺点之一是它仅仅通过我们用于受体α碳图中的局部框架编码特征来间接地建模侧链的原子位置。显式表示这些原子可能会提高精确对接。我们尝试了表面原子和微调方法,它们使用受体的原子子图。然而,这只带来了很小或没有改进,同时增加了相当多的计算复杂度。我们将这一策略的进一步探索留给未来的工作。这些结果与先前的蛋白质建模技术如AlphaFold2是一致的,它成功地根据仅残基水平信息预测侧链。

EquiBind,一种依赖SE(3)-等变图神经网络来预测结合蛋白质配体构象的深度神经模型,又快又好需要信息又少,可以双盲预测。预计EquiBind和类似的模型将促进深度学习在药物发现中的应用clash节点链接怎么用

THE END
喜欢就支持一下吧
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称