Die Bindung von MOAD wird mit der letzten Datenaktualisierung und der Hinzufügung von 3D eingestellt

Nachricht

HeimHeim / Nachricht / Die Bindung von MOAD wird mit der letzten Datenaktualisierung und der Hinzufügung von 3D eingestellt

May 06, 2023

Die Bindung von MOAD wird mit der letzten Datenaktualisierung und der Hinzufügung von 3D eingestellt

Wissenschaftliche Berichte Band 13,

Wissenschaftliche Berichte Band 13, Artikelnummer: 3008 (2023) Diesen Artikel zitieren

664 Zugriffe

1 Altmetrisch

Details zu den Metriken

Binding MOAD ist eine Datenbank von Protein-Ligand-Komplexen und ihren Affinitäten mit vielen strukturierten Beziehungen im gesamten Datensatz. Das Projekt befindet sich seit über 20 Jahren in der Entwicklung, doch nun ist es an der Zeit, es zu einem Abschluss zu bringen. Derzeit enthält die Datenbank 41.409 Strukturen mit einer Affinitätsabdeckung für 15.223 (37 %) Komplexe. Die Website BindingMOAD.org bietet zahlreiche Tools zur Erforschung der Polypharmakologie. Aktuelle Beziehungen umfassen Links für Strukturen mit Sequenzähnlichkeit, 2D-Ligandenähnlichkeit und Bindungsstellenähnlichkeit. In diesem letzten Update haben wir die 3D-Ligandenähnlichkeit mithilfe von ROCS hinzugefügt, um Liganden zu identifizieren, die in zwei Dimensionen möglicherweise nicht unbedingt ähnlich sind, aber denselben dreidimensionalen Raum einnehmen können. Für die 20.387 verschiedenen Liganden in der Datenbank wurden insgesamt 1.320.511 3D-Formübereinstimmungen zwischen den Liganden hinzugefügt. Es werden Beispiele für den Nutzen des 3D-Shape-Matchings in der Polypharmakologie vorgestellt. Abschließend werden Pläne für den zukünftigen Zugriff auf die Projektdaten skizziert.

Datenbanken von Protein-Ligand-Komplexen sind für verschiedene Arzneimittelforschungs- und -designprojekte von zentraler Bedeutung. Sie sind besonders nützlich in Polypharmakologieprojekten, etwa zur Vorhersage von Aktivitäten außerhalb des Ziels von Arzneimitteln (Toxikologie) oder zur Suche nach neuen Anwendungen bekannter Arzneimittel (Umwidmung von Arzneimitteln). Es gibt mehrere Datenbanken, die Daten zu Protein-Ligand-Komplexen bereitstellen, darunter Binding MOAD (www.BindingMOAD.org)1,2,3, PDBbind (www.PDBbind.org.cn)4 und BindingDB (www.bindingdb.org)5 ,6,7,8,9, sc-PDB (http://bioinfo-pharma.u-strasbg.fr/scPDB/)10,11 und viele mehr. Diese Datenbanken zielen auf unterschiedliche Anwendungen ab und ihr Inhalt und ihre Größe variieren aufgrund ihrer unterschiedlichen Auswahlkriterien für die Aufnahme eines bestimmten Protein-Ligand-Komplexes.

MOAD wurde 2001 ins Leben gerufen, erstmals 20051 veröffentlicht und jährlich Anfang Januar jedes Jahres aktualisiert. Als wir mit MOAD begannen, umfassten die größten Datensätze für Docking und Scoring etwa 200 Komplexe12,13. Diese wurden in einem „Bottom-up“-Ansatz gesammelt, bei dem die Literatur zur medizinischen Chemie gelesen wurde, um Strukturen zu identifizieren. Wir entschieden uns für einen „Top-Down“-Ansatz, der mit der gesamten Proteindatenbank (PDB) begann, die alle möglichen Komplexe enthielt, und diesen maximalen Satz durch Literatursuche mit Affinitätsdaten zu erweitern. Um in die Datenbank aufgenommen zu werden, muss ein Protein-Ligand-Komplex eine Auflösung von mindestens 2,5 Å haben und mindestens einen biologisch relevanten Liganden in seiner PDB-Struktur enthalten. In unserer HiQ-Untergruppe makelloser Protein-Ligand-Komplexe aus MOAD14 erfordern zusätzliche Auswahlkriterien genauere Metriken von Rfree − Rwork ≤ 5 %, Real Space R ≤ 0,2 und RSCC ≥ 0,9.

Im Jahr 2014 wurden die Website und die Datenbank in ein LAMP-Format (Linux, Apache, MySQL und PHP) umstrukturiert3; Die verbesserte Benutzeroberfläche umfasst Plugins von Drittanbietern wie Jmol, MarvinView und JChemBase mit MarvinSketch für eine bessere Visualisierung von Proteinen und Liganden. Im selben Update wurden auch nützliche Funktionen wie gefilterte Downloads und feldbasierte Suche integriert. Im Jahr 2019 wurde der NGL-Viewer für eine verbesserte Visualisierung der Protein-Ligand-Komplexe hinzugefügt und MarvinView wurde durch MarvinJS für die Suche nach kleinen Molekülen in der Datenbank ersetzt15. Die Website wurde außerdem mit Tools zur Polypharmakologie ausgestattet, beispielsweise zur 3D-Bindungsstellenähnlichkeit und 2D-Ähnlichkeit von Liganden.

Unsere neueste Ergänzung zu MOAD sind 3D-Ähnlichkeiten zwischen den Liganden. Ähnliche Moleküle neigen dazu, ähnliche chemische und biologische Eigenschaften zu haben16. Die Bewertung struktureller Ähnlichkeiten zwischen kleinen Molekülen kann ein äußerst effektiver Ausgangspunkt für die Entdeckung und Optimierung verschiedener Leitmoleküle sein. Dies ist nützlich, um toxikologische Eigenschaften von Off-Target-Bindungen vorherzusagen und Medikamente als potenzielle Inhibitoren für andere interessierende Proteine ​​zu nutzen. Zweidimensionale molekulare Ähnlichkeitsansätze erfreuen sich aufgrund ihrer Einfachheit und Genauigkeit großer Beliebtheit17,18,19,20,21,22. Allerdings basieren 2D-Ähnlichkeitsberechnungen meist auf molekularen Fingerabdruck-Deskriptoren und enthalten keine Informationen über die 3D-Struktur eines Moleküls. Wir haben uns für die Hinzufügung der molekularen 3D-Ähnlichkeit entschieden, da diese für das virtuelle Screening von Molekülbibliotheken sowie für Scaffold-Hopping-Ansätze wichtig ist23,24,25.

Unsere konsequenten Bemühungen, MOAD zu aktualisieren, haben die Datenbank zu einer beliebten Wahl unter Wissenschaftlern gemacht. Die Artikel von MOAD wurden 600 Mal zitiert und die Website erhält etwa 1000 Zugriffe pro Woche. Viele neuere Studien zum maschinellen Lernen haben neuartige Bewertungsfunktionen für das molekulare Docking26,27 basierend auf MOAD als Benchmark-Satz eingeführt. In einer aktuellen Studie diente MOAD als Benchmark für RosENET (Rosetta Energy Neural Networks), eine auf dreidimensionalen Faltungs-Neuronalen Netzen basierende Studie, die molekularmechanische Energien und Deskriptoren zur Vorhersage der absoluten Bindungsaffinität von Protein-Ligand-Komplexen kombinierte28. Die hohe Qualität der Protein-Ligand-Strukturen in der Datenbank machte MOAD auch zu einer beliebten Wahl für einige andere Studien, die auf neuronalen Netzwerken basieren, wie KDEEP29, DEELIG30 und DeepAtom31. Diese Studien nutzten die dreidimensionale voxelisierte Darstellung von Protein-Ligand-Komplexen zur Extraktion molekularer Merkmale und bindungsbezogener Interaktionsmuster, um die Bindungsaffinitäten der Komplexe vorherzusagen. Eine hohe Qualität der Strukturen der Komplexe scheint entscheidend für den Erfolg der voxelisierten Darstellung komplexer Strukturen zu sein. In der Vergangenheit wurde MOAD zum Entwickeln und Testen molekularmechanischer Parameter sowie Docking- und Bewertungsmethoden verwendet32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47; um grundlegende Protein-Ligand-Wechselwirkungen zu untersuchen48,49,50,51,52,53,54,55,56,57,58; zur Vorhersage kleiner Molekülliganden, Proteinziele und Bindungsstellen59,60,61,62; und um das Proteindesign zu unterstützen63,64. Unsere eigenen Bemühungen mit MOAD konzentrierten sich darauf, biophysikalische Prinzipien hinter der Protein-Ligand-Bindung zu erlernen und diese Muster mit der Affinität in Beziehung zu setzen65,66,67,68. Darüber hinaus nutzten wir die Daten von MOAD, um die ersten Andock- und Wertungswettbewerbe vor Ort abzuhalten14,69.

Wie oben erwähnt, erfolgt die Datenerfassung in MOAD nach einem „Top-Down“-Ansatz, d. h. zunächst werden alle Protein-Ligand-Komplexstrukturen aus der RCSB-Proteindatenbank (https://www.rcsb.org/) importiert , dann werden die Strukturen, die die Einschlusskriterien von MOAD nicht erfüllen, verworfen, und schließlich werden die Bindungsdaten für die eingeschlossenen PDBs aus den primären Kristallographiereferenzen extrahiert. Die primäre Referenz ist die gemeldete Referenz für die PDB-Struktur in der RCSB Protein Data Bank (PDB)70.

Die RCSB-Datenbank enthielt am 02.01.2021 160.152 Protein-Ligand-Komplexstrukturen, die zur Überprüfung in unsere Datenpipeline importiert wurden. Zur Bewertung der im Vorjahr neu hinzugekommenen Strukturen wurden insgesamt 1078 Zeitschriftenartikel erfasst. Eine detaillierte Beschreibung des Verfahrens für die Datenpipeline wurde in früheren MOAD-Updates1,2,3,15 berichtet. Eine Kurzzusammenfassung der Pipeline lautet wie folgt:

Strukturen mit einer Auflösung von weniger als 2,5 Å werden verworfen. Die verbleibenden Strukturen werden auf mindestens eine Proteinkette und mindestens einen Liganden überprüft, der nicht kovalent an die Proteinkette gebunden ist.

Der/die Ligand(en) in jeder der Strukturen wird auf seine biologische Relevanz überprüft und mit „gültig“, „ungültig“ oder „Teil des Proteins“ versehen. Kristallographische Zusätze, Salze, Puffer, Metalle und Lösungsmittel gelten als ungültig. HEME-Gruppen und modifizierte Aminosäuren in den Proteinketten gelten als Teil des Proteins und nicht als gebundene Liganden.

Strukturen, die aus Schritt 2 mit mindestens einem gültigen Liganden hervorgehen, werden vor ihrem endgültigen Eingang in MOAD von Hand kuratiert. Keine Struktur wird in die Datenbank aufgenommen, ohne dass sie manuell überprüft wurde. Die Bindungsdaten werden, sofern verfügbar, aus den primären Referenzen für die Kristallstruktur extrahiert. Wenn mehrere Arten von Bindungsinformationen gemeldet werden, ist unsere bevorzugte Reihenfolge bei der Auswahl der Daten Kd > Ki > IC50 (Dissoziations- (oder Assoziations-Ka-)Konstanten gegenüber Inhibitionskonstanten gegenüber halbmaximalen Inhibitionskonzentrationen).

Die Protein-Ligand-Komplexe werden dann auf der Grundlage von Sequenzähnlichkeiten, die mit BLAST71 berechnet werden, in Familien gruppiert. Eine Familie enthält alle Komplexe in der Datenbank, deren Sequenzen zu ≥ 90 % identisch sind. Jeder der Familien wird ein Leader zugewiesen, bei dem es sich typischerweise um den Komplex mit dem am stärksten bindenden Liganden im Satz handelt. Wenn für kein Mitglied der Familie Bindungsdaten vorliegen, wird der Leader auf der Grundlage des Liganden ausgewählt, der die beste Auflösung und die größte biologische Relevanz aufweist. Proteine ​​werden auch nach 50 % und 70 % Sequenzähnlichkeit gruppiert, wenn Forscher es vorziehen, homologe Proteinsätze zu analysieren, obwohl für diese Gruppen kein Leader ausgewählt wird.

Ein einzigartiges Merkmal dieses letzten Updates ist, dass die Bindungsdaten in MOAD mit denen von PDBbind4 abgeglichen wurden. Jede der gesammelten Abweichungen wurde manuell auf den korrekten Wert der Bindungsdaten aus der primären Referenz des PDB-Eintrags überprüft. Wenn MOAD-Werte falsch waren, wurden die korrekten Werte zur Datenbank hinzugefügt und sind jetzt auf der Datenbank-Website verfügbar. Eine detaillierte Analyse finden Sie weiter unten unter „Ergebnisse und Diskussion“.

Berechnungen der 3D-Formähnlichkeit wurden mit ROCS23 und FastROCS23,24 von OpenEye durchgeführt, basierend auf allen gültigen Liganden der MOAD-Datenbank. Obwohl ROCS den Nutzen hat, auch eine Farb- (oder chemische Merkmals-)Ähnlichkeitssuche durchzuführen, wurde es in unserer Analyse zur Nachvollziehbarkeit nicht verwendet.

ROCS-Berechnungen basieren auf dem Konzept, dass zwei Objekte die gleiche Form haben, wenn ihre Volumina genau übereinstimmen. Daher ist die Volumenfehlanpassung für zwei beliebige übereinanderliegende Liganden ein Maß für die Unähnlichkeit. Das Umgekehrte gilt nicht, das heißt, zwei Objekte mit demselben Volumen müssen nicht unbedingt dieselbe Form haben. In der Formtheorie von ROCS wird die genaue Definition der Formähnlichkeit zwischen zwei Objekten durch das Integral gegeben

wobei \(f\left( {x,y,z} \right)\) und \(g\left( {x,y,z} \right)\) die charakteristischen Funktionen der Objekte sind. Das Molekülvolumen wird eher durch glatte Gauß-Kurven als durch harte Kugeln dargestellt. ROCS verwendet einen Festkörperoptimierungsprozess für Moleküle, der die Überlappung zwischen zwei Molekülen maximiert.

Als abstrakte Definition ist ein Tanimoto-Koeffizient das Verhältnis der Schnittmenge und der Vereinigung zweier Mengen. In ROCS wird der Tanimoto-Koeffizient des Objekts durch die Gleichung berechnet

wobei die \(I\)-Terme den Eigenvolumenüberlappungen entsprechen und der \(O\)-Term der Überlappung zwischen den beiden charakteristischen Funktionen entspricht.

In unserer Studie wurde jeder Ligand in MOAD als Abfrageligand verwendet und mit allen anderen Liganden der Datenbank verglichen. Die Vergleiche wurden basierend auf ihrer Volumenausrichtung zwischen dem Abfrageliganden und dem alternativen Liganden eingestuft. Für ein gegebenes Ligandenpaar wurden zunächst ausgehend von den Massenschwerpunkten der Liganden die Liganden überlagert und ein Tanimoto-Koeffizient berechnet. Ein zweiter Tanimoto-Koeffizient wurde ebenfalls berechnet, indem der maximale Tanimoto-Koeffizient über 8 verschiedene überlappende Überlagerungen ermittelt wurde. Die zusätzlichen überlappenden Strukturen wurden erzeugt, indem der Massenschwerpunkt des gesuchten Moleküls zufällig über dem zweiten Molekül platziert und auf maximale Volumenüberlappung optimiert wurde. Dies wurde durchgeführt, um die unterschiedlichen Größen der Liganden zu berücksichtigen. Bei allen Ähnlichkeitsberechnungen wurden alle Konformationen starr beibehalten.

FastROCS ist ein Tool von OpenEye, das 3D-Ähnlichkeitsberechnungen mithilfe von GPUs durchführt. Die Formtheorie hinter FastROCS ist dieselbe wie die von ROCS, obwohl FastROCS aufgrund einer modifizierten GPU-Version des Computercodes einen etwas anderen Algorithmus zur Berechnung molekularer Überlappungen verwendet. Das Maximum von drei Tanimoto-Koeffizienten (ROCS, bei dem die Massenschwerpunkte der Abfrage- und Datenbankmoleküle ausgerichtet waren, ROCS, bei dem 8 Konformationen erzeugt wurden, indem der Massenschwerpunkt des Abfragemoleküls zufällig über dem Datenbankmolekül platziert wurde, und FastROCS) wurde als endgültiger Tanimoto-Koeffizient für das Abfrage-Datenbank-Paar verwendet.

Die oben genannten Berechnungen wurden über die PDB-Konformationen der Liganden durchgeführt. Es ist jedoch möglich, dass ein Ligand einem Abfrageliganden in einer Konformation sehr ähnlich sein kann, die in seiner PDB-Struktur nicht angegeben ist, aber dennoch energetisch günstig ist. Daher ist es wichtig, Liganden zu finden, die eine hohe Formähnlichkeit mit einer PDB-Konformation eines Liganden aufweisen, wenn der Tanimoto-Koeffizient mit einer anderen Konformation des zweiten Liganden berechnet wird. Daher wurden mit OpenEye Omega 64 verschiedene Konformationen aller einzigartigen gültigen Liganden in MOAD generiert72,73. Vor der Konformationsgenerierung wurden die Liganden durch das Filter-Dienstprogramm von OpenEye geleitet, um unerwünschte Verbindungen zu eliminieren und Ausführungszeit zu sparen. Beim Filter-Screening der gültigen Liganden wurden Überprüfungen auf Lipinski-Verstöße entfernt, die Grenzwerte für die Einschränkung der physikalischen Eigenschaften wurden gelockert und das boolesche Flag für die Einschränkung von pH = 7,4 (-pkanorm) wurde auf „falsch“ gesetzt. Die Liganden wurden dann in makrozyklische und nicht-makrozyklische Moleküle getrennt, da Omega unterschiedliche Methoden verwendet, um Konformationen für die beiden zu erzeugen. Für Nicht-Makrocyclen-Moleküle wurden Konformationen mithilfe des „Fastrocs“-Modus von Omega erzeugt. Für jedes Makrocyclus- und Nicht-Makrocyclus-Molekül wurden, wann immer möglich, maximal 64 verschiedene Konformationen erzeugt.

Formähnlichkeitsberechnungen wurden zwischen allen generierten Konformationen (als Datenbankliganden) und den von der PDB gemeldeten Konformationen aller Liganden (als Abfrageliganden) durchgeführt. Die Gesamtzahl der für diese Berechnungen generierten einzigartigen Konformationen betrug etwa 950.000. In dieser Studie haben wir insgesamt 16 Milliarden ROCS- und 85 Milliarden FastROCS-Berechnungen durchgeführt.

Die aktuelle Aktualisierung von MOAD enthält insgesamt 41.409 gültige Protein-Ligand-Komplexstrukturen, was einem Anstieg von 26 % seit der letzten MOAD-Mitteilung im Jahr 2019 entspricht15. Die gültigen Protein-Ligand-Komplexe sind in 11.058 Proteinfamilien gruppiert und enthalten zusammen insgesamt 20.387 einzigartige Liganden. Für die 41.409 Komplexe werden insgesamt 15.223 verbindliche Dateneinträge gemeldet (37 % Abdeckung, was über die letzten Jahre konstant geblieben ist). Die verbindlichen Dateneinträge enthalten 5.509 Kd-Werte (einschließlich konvertierter Ka-Daten), 4.581 Ki-Werte und 5.131 IC50. Tabelle 1 zeigt die Bereiche für jeden Typ der gemeldeten Bindungsdaten. Viele Liganden in MOAD weisen arzneimittelähnliche Eigenschaften auf: 51 % haben Affinitäten von 440 nM oder besser, 69,9 % liegen im Bereich von 120–500 MW und 69,4 % haben 0 oder 1 Lipinski-Verletzung.

Der „verfeinerte Satz“ von PDBBind ist ein mit MOAD4 vergleichbarer Datensatz. Die Erfassung der Bindungsdaten für PDBbind erfolgt durch eine schlüsselwortbasierte Suche im vollständigen Text der Primärreferenz, die in jeder relevanten PDB-Struktur bereitgestellt wird, gefolgt von einer unabhängigen manuellen Prüfung des Textes durch zwei Wissenschaftler, die sich auf einen Wert einigen müssen. Bei MOAD erfolgt die Datenextraktion durch einfache Verarbeitung natürlicher Sprache (NLP) und eine manuelle Überprüfung der primären Referenz der PDB-Struktur durch eine Person2,74. Unser halbautomatisches Text-Mining-Tool ist BUDA (Binding Unstructured Data Analysis), das geführtes Lesen ermöglicht, um wichtige Sätze und Phrasen in Aufsätzen zu identifizieren; Es verfügt über einen gewichteten Bewertungsalgorithmus, um die Wahrscheinlichkeit einzustufen, dass Sätze und Phrasen bindende Daten enthalten. BUDA ist ein gemeinsam genutztes Dienstprogramm, das es Mitarbeitern ermöglicht, die Strukturen untereinander aufzuteilen und über die Fortschritte der anderen auf dem Laufenden zu bleiben. Die Kuratoren können die Artikel nach ihrer gewichteten Punktzahl sortieren, Texte mit Hervorhebungen unter Angabe wichtiger Phrasen oder Sätze überprüfen und die Daten in Binding MOAD aktualisieren. Der NLP-Teil von BUDA basiert auf dem General Architecture for Text Engineering (GATE)-Framework (gate.ac.uk). Unsere GATE-Pipeline besteht aus ANNIE-Plug-Ins, modifizierten Nachschlagelisten für den Gazetteer, mehreren JAPE-Grammatiken und Verarbeitungs-/Exporttools. Unsere Ergänzungen zu den Nachschlagelisten umfassen Schlüsselwörter wie „Dissoziationskonstante“, „Bindung“, „IC50“ usw. Die Wandler kommentieren große Phrasen und Sätze, z. Mit einem Wandler werden Zahlen und molare Einheiten (nM, mM, pM usw.) gruppiert. Ein zweiter Wandler identifiziert und hebt Muster hervor, bei denen ein konstanter Name sehr nahe an einem Zahl-Einheits-Paar liegt. Das BUDA-Dashboard zeigt jedes Papier mit hervorgehobenen Texten, Tabellen und Bildunterschriften an, die dem Kurator das Auffinden der benötigten Informationen erleichtern.

Da sowohl die MOAD- als auch die PDBbind-Datenbank viele gemeinsame Strukturen aufweist, haben wir einen Vergleich der Bindungsdaten aus den beiden Sätzen durchgeführt und Abweichungen erfasst. Die Abweichungen wurden erneut durch manuelle Überprüfung der primären Referenzen der PDB-Strukturen überprüft. Obwohl PDBbind im Laufe der Jahre viele der in Binding MOAD eingeführten Qualitätsprotokolle übernommen hat, ist dies das erste Mal, dass wir einen Vergleich mit PDBbind vorgenommen haben.

Der Vergleich zwischen MOAD und dem verfeinerten Satz von PDBbind ergab insgesamt 2.371 Meinungsverschiedenheiten. Die meisten Diskrepanzen waren einfach auf unterschiedliche Präferenzen für die Berichterstattung über Daten in der Literatur zurückzuführen. Beispielsweise legt MOAD Wert auf die Angabe von Dissoziations- (Kd) und Assoziationskonstanten (Ka) gegenüber Hemmkonstanten (Ki) oder halbmaximalen Hemmkonzentrationen (IC50). MOAD zielt außerdem darauf ab, Daten genau so zu melden, wie sie in der Literatur zu finden sind, dh ohne die Einheiten der Daten zu ändern. Insbesondere waren die Bindungsaffinitäten für zwei Drittel der Komplexe (1.589) tatsächlich Übereinstimmungen mit verschiedenen verwendeten Einheiten (z. B. gibt MOAD möglicherweise einen Literaturwert von 0,003 μM an, PDBbind meldet jedoch 3,0 nM). Von den 782 fehlerhaften Nichtübereinstimmungen enthielt MOAD 602 ​​Fehler (wodurch die Fehlerrate nur 4 % der über mehr als 20 Jahre gesammelten Affinitätseinträge betrug). PDBbind enthielt die verbleibenden 180 Unstimmigkeiten mit den Daten in den Kristallographie-Veröffentlichungen, es sollte jedoch beachtet werden, dass Unterschiede mit den Werten in PDBbind möglicherweise auf die Suche nach Affinitätsdaten außerhalb der Kristallographie-Literatur zurückzuführen sind. Die MOAD-Fehler können den folgenden Kategorien zugeordnet werden: 1) 98 mit falschem Bindungsmesstyp (z. B. MOAD meldete Kd, obwohl der Wert tatsächlich entweder als Ka, Ki oder IC50 aufgeführt war); 2) 44 mit falschem Ungleichheitstyp (z. B. MOAD meldete ein „=“, obwohl in der Literatur ein „~“ oder ein „<“ angegeben wurde); 3) 256 mit einer falschen Ligandenwechselwirkung (z. B. wurden Daten für das falsche Protein-Ligand-Paar gemeldet); 4) 204 Fälle von menschlichem Versagen aufgrund schlicht falscher Meldung der verbindlichen Daten. Wir sind dankbar für die hervorragende Arbeit bei der PDBbind-Kuration, die diese Fehlerprüfung ermöglicht hat.

Unsere neuesten Funktionen in MOAD haben Polypharmakologie-Tools hinzugefügt. Unter Polypharmakologie versteht man die Bindung eines kleinen Moleküls an mehrere Zielproteine. Typische Anwendungen der Polypharmakologie sind Off-Target-Aktivitäten kleiner Moleküle (Toxikologie) und die Suche nach neuen Anwendungen bekannter Arzneimittel (Drug Repurposing). Die Beziehung zwischen den Formen der Proteinbindungsstellen und den Formen der Liganden, die an sie binden, ist nicht eins zu eins oder eins zu viele, sondern viele zu viele. Eine kürzlich von Gao und Skolnick durchgeführte Studie zeigte, dass die Wechselwirkung zwischen Proteinbindungsstellen und Liganden aufgrund der promiskuitiven Natur der Proteinbindungsstellen sowie der Liganden ziemlich kompliziert ist75. Die Studie weist auch darauf hin, dass der Formraum von Proteinbindungsstellen endlich ist und durch etwa 1000 Taschenformen dargestellt werden kann76,77. Ein signifikanter Satz von Formmerkmalen in einer Bindungsstelle kann daher in einer anderen Bindungsstelle gefunden werden, die möglicherweise keine evolutionäre Verwandtschaft aufweist. Daher ist es wichtig, die polypharmakologischen Aussichten eines Liganden zu untersuchen, indem seine Form nicht nur mit anderen Liganden in derselben Proteinfamilie, sondern mit der gesamten Datenbank verglichen wird. Ligandenpromiskuität weist auch darauf hin, dass unterschiedliche Konformationen eines Liganden dazu führen können, dass er an unterschiedliche Bindungsstellen bindet78. Daher haben wir 3D-Ähnlichkeiten der Ligandenkonformationen mit den bekannten Posen eines proteingebundenen Liganden (in PDB-Strukturen angegeben) untersucht. Die für die Liganden von MOAD durchgeführten 3D-Ähnlichkeitsberechnungen haben die Identifizierung kleiner Moleküle mit potenziellen polypharmakologischen Eigenschaften verbessert. Die 3D-Ähnlichkeitspaare werden auf der Website für Tanimoto-Ähnlichkeit > 0,85 gemeldet. Aus den Ähnlichkeitsberechnungen, die für die ca. 950.000 Ligandenkonformationen (von der PDB gemeldete und von Omega generierte) durchgeführt wurden, wurden mehr als 26 Millionen individuelle Ähnlichkeiten über alle Konformationen hinweg identifiziert und insgesamt 1.320.511 neue 3D-Formübereinstimmungen zwischen den einzelnen Liganden hinzugefügt in die MOAD-Datenbank aufgenommen. Diese wurden zu einem neuen 3D-Ähnlichkeitsabschnitt für Liganden auf unseren BindingMOAD.org-Seiten für jeden Komplex hinzugefügt, siehe Abb. 1.

Beispiel für die 3D-Ähnlichkeit eines Eintrags auf BindingMOAD.org.

Die neuen 3D-Matches in MOAD können Off-Target-Aktivitäten kleiner Moleküle sowie potenzielle Anwendungen bekannter Medikamente identifizieren. Abbildung 2 zeigt ein solches Beispiel; Das Molekül N-Methyl-1(R)-Aminoindan (RM1) ist ein Rasagilin-Analogon, das eine inhibitorische Wirkung auf das Protein Monoaminoxidase (MAO, PDBid: 2C67)79 zeigt, während das Molekül Tranylcypromin (TPA) ein Inhibitor für die Serinprotease ist Trypsin (PDBid: 1TNL)80. Die beiden Moleküle sind im 2D-Vergleich nicht ähnlich und ihre Bindungsstellen stimmen laut APOC oder GLoSA nicht überein. Allerdings haben RM1 und TPA einen 3D-Tanimoto-Koeffizienten von 0,92, was eine sehr ähnliche Form erkennen lässt. Wir haben die Literatur durchsucht und tatsächlich herausgefunden, dass TPA gegen MAO, ein Ziel für klinische Depressionen, wirksam sein kann81.

TPA hat wenig 2D-Ähnlichkeit mit RM1 und seine Bindungsstelle in Trypsin weist keine Ähnlichkeit mit der Bindungsstelle von MAO auf. Ihre 3D-Ähnlichkeit zeigt jedoch den Zusammenhang von TPA als Inhibitor von MOA.

Ein weiteres Beispiel ist in Abb. 3 zu sehen. Das Molekül 1-Phenyl-1H-1,2,4-triazol-3,5-diamin (TT4) bindet an die Mitogen-aktivierte Proteinkinase 1 (auch bekannt als ERK2, PDBid: 4XNE) bei Ratten (Rattus Norvegicus)82. Das neuroaktive Medikament Gabapentin (GBN) ist ein Molekül, das nachweislich einen Komplex mit der menschlichen mitochondrialen verzweigtkettigen Aminotransferase (BCATm, PDBid: 2A1H) bildet83. Obwohl es bei 2D-Messungen keine Ähnlichkeit der Moleküle und keine Ähnlichkeit der Bindungsstellen gab, wurde festgestellt, dass GBN ERK2 bei Ratten hemmen kann84. Der 3D-Tanimoto-Koeffizient für die beiden Liganden betrug in unseren Berechnungen 0,90.

Die 3D-Ähnlichkeit von TT4 und GBN ist offensichtlich. Allerdings ist die 2D-Ähnlichkeit gering und ihre Bindungsstellen weisen ebenfalls keine Ähnlichkeit auf.

Hier berichten wir über die letzte Aktualisierung der Binding MOAD-Datenbank. Während die Hinzufügung von 3D-Ligandenähnlichkeitsberechnungen einen großen Vorteil darstellt, hat das Durchsuchen aller Ligandenvergleiche die Zeit zum Laden von Seiten auf der Website erheblich verlangsamt, was problematisch ist.

Zu den auf der Website verfügbaren Optionen gehören das Herunterladen des gesamten Datensatzes, gefilterte Downloads, ligandenbasierte Suchen (über MarvinSketch) und eine individuelle Webseite für jeden seiner Komplexe (identifiziert durch sein PDBid). Die Webseite jedes Komplexes ist mit der Anmerkung der Familie (90 %, 70 % und 50 % Sequenzähnlichkeiten) mit anderen Proteinen in der Datenbank ausgestattet. Ähnlichkeitsberechnungen (2D und 3D) für jeden seiner Liganden und die Ähnlichkeit der Bindungsstellen werden ebenfalls kommentiert.

Die Datenbank wird noch weitere anderthalb Jahre online auf BindingMOAD.org verfügbar sein (bis zum 31. Juni 2024, wenn das Betriebssystem des Servers nicht mehr unterstützt wird). Für den zukünftigen Zugriff werden die Bindungsdaten weiterhin über die RCSB PDB-Websiteseiten für jeden Komplex verfügbar sein. Das Backend der Website, einschließlich aller Affinitätsdaten und polypharmakologischen Beziehungen im gesamten Datensatz, wurde an Chemical Abstract Services lizenziert.

Die Daten in diesem Manuskript sind unter www.BindingMOAD.org und der RCSB Protein Data Bank (www.rcsb.org) verfügbar.

Hu, L., Benson, ML, Smith, RD, Lerner, MG & Carlson, HA Binding MOAD (Mutter aller Datenbanken). Proteine ​​60, 333–340 (2005).

Artikel CAS PubMed Google Scholar

Benson, ML et al. Bindung MOAD, eine hochwertige Protein-Ligand-Datenbank. Nukleinsäuren Res. 36, D674–D678 (2008).

Artikel CAS PubMed Google Scholar

Ahmed, A., Smith, RD, Clark, JJ, Dunbar, JB & Carlson, HA Aktuelle Verbesserungen an Binding MOAD: Eine Ressource für Protein-Ligand-Bindungsaffinitäten und -strukturen. Nukleinsäuren Res. 43, D465–D469 (2015).

Artikel CAS PubMed Google Scholar

Liu, Z. et al. PDB-weite Sammlung von Bindungsdaten: Aktueller Status der PDBbind-Datenbank. Bioinformatik 31, 405–412 (2015).

Artikel CAS PubMed Google Scholar

Chen, X., Lin, Y. & Gilson, MK Die Bindungsdatenbank: Übersicht und Benutzerhandbuch. Biopolymere 61, 127–141 (2001).

3.0.CO;2-N" data-track-action="article reference" href="https://doi.org/10.1002%2F1097-0282%282002%2961%3A2%3C127%3A%3AAID-BIP10076%3E3.0.CO%3B2-N" aria-label="Article reference 5" data-doi="10.1002/1097-0282(2002)61:23.0.CO;2-N">Artikel CAS PubMed Google Scholar

Chen, X., Lin, Y., Liu, M. & Gilson, MK Die Bindungsdatenbank: Datenmanagement und Schnittstellendesign. Bioinformatik 18, 130–139 (2002).

Artikel CAS PubMed Google Scholar

Liu, T., Lin, Y., Wen, X., Jorissen, RN & Gilson, MK BindingDB: Eine über das Internet zugängliche Datenbank experimentell bestimmter Protein-Ligand-Bindungsaffinitäten. Nucleic Acids Res 35, D198-201 (2007).

Artikel CAS PubMed Google Scholar

Gilson, MK et al. BindingDB im Jahr 2015: Eine öffentliche Datenbank für medizinische Chemie, Computerchemie und Systempharmakologie. Nucleic Acids Res 44, D1045–D1053 (2016).

Artikel CAS PubMed Google Scholar

Chen, X., Liu, M. & Gilson, MK BindingDB: Eine über das Internet zugängliche Datenbank zur molekularen Erkennung. Comb Chem High Throughput Screen 4, 719–725 (2001).

Artikel CAS PubMed Google Scholar

Desaphy, J. & Rognan, D. sc-PDB-Frag: Eine Datenbank mit Protein-Ligand-Interaktionsmustern für bioisosterische Ersetzungen. J Chem Inf Model 54, 1908–1918 (2014).

Artikel CAS PubMed Google Scholar

Desaphy, J., Bret, G., Rognan, D. & Kellenberger, E. sc-PDB: Eine 3D-Datenbank ligandierbarer Bindungsstellen – 10 Jahre später. Nucleic Acids Res 43, D399-404 (2015).

Artikel CAS PubMed Google Scholar

Roche, O., Kiyama, R. & Brooks, CL Ligand-Protein-Datenbank: Verknüpfung von Protein-Ligand-Komplexstrukturen mit Bindungsdaten. J. Med. Chem. 44, 3592–3598 (2001).

Artikel CAS PubMed Google Scholar

Muegge, I. Auswirkung der Ligandenvolumenkorrektur auf die PMF-Bewertung. J. Comput. Chem. 22, 418–425 (2001).

3.0.CO;2-3" data-track-action="article reference" href="https://doi.org/10.1002%2F1096-987X%28200103%2922%3A4%3C418%3A%3AAID-JCC1012%3E3.0.CO%3B2-3" aria-label="Article reference 13" data-doi="10.1002/1096-987X(200103)22:43.0.CO;2-3">Artikel CAS Google Scholar

Dunbar, JB Jr. et al. CSAR-Benchmark-Übung 2010: Auswahl der Protein-Ligand-Komplexe. J. Chem. Inf. Modell. 51, 2036–2046 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Smith, RD et al. Aktualisierungen der Bindung MOAD (Mother of All Databases): Polypharmakologie-Tools und ihr Nutzen bei der Wiederverwendung von Arzneimitteln. J Mol Biol 431, 2423–2433 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Martin, YC, Kofron, JL & Traphagen, LM Haben strukturell ähnliche Moleküle eine ähnliche biologische Aktivität? J. Med. Chem. 45, 4350–4358 (2002).

Artikel CAS PubMed Google Scholar

Keiser, MJ et al. Vorhersage neuer molekularer Ziele für bekannte Medikamente. Natur 462, 175–181 (2009).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Willett, P. Ähnlichkeitsbasiertes virtuelles Screening mit 2D-Fingerabdrücken. Drug Discov Today 11, 1046–1053 (2006).

Artikel CAS PubMed Google Scholar

Hassan, M., Brown, RD, Varma-O'brien, S. & Rogers, D. Cheminformatische Analyse und Lernen in einer Datenpipelining-Umgebung. Mol. Taucher. 10, 283–299 (2006).

Artikel CAS PubMed Google Scholar

Godden, JW, Xue, L. & Bajorath, J. Kombinatorische Präferenzen beeinflussen molekulare Ähnlichkeits-/Diversitätsberechnungen mithilfe binärer Fingerabdrücke und Tanimoto-Koeffizienten. J. Chem. Inf. Berechnen. Wissenschaft. 40, 163–166 (2000).

Artikel CAS PubMed Google Scholar

Anighoro, A. & Bajorath, J. Dreidimensionale Ähnlichkeit beim molekularen Andocken: Priorisierung von Ligandenpositionen auf der Grundlage experimenteller Bindungsmodi. J. Chem. Inf. Modell. 56, 580–587 (2016).

Artikel CAS PubMed Google Scholar

Shin, W.-H., Zhu, X., Bures, MG & Kihara, D. Dreidimensionale Verbindungsvergleichsmethoden und ihre Anwendung in der Arzneimittelentwicklung. Molecules 20, 12841–12862 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Hawkins, PC, Skillman, AG & Nicholls, A. Vergleich von Shape-Matching und Docking als virtuelle Screening-Tools. J. Med. Chem. 50, 74–82 (2007).

Artikel CAS PubMed Google Scholar

Rush, TS, Grant, JA, Mosyak, L. & Nicholls, A. Eine formbasierte 3D-Gerüst-Hopping-Methode und ihre Anwendung auf eine bakterielle Protein-Protein-Wechselwirkung. J. Med. Chem. 48, 1489–1495 (2005).

Artikel CAS PubMed Google Scholar

Zhang, Q. & Muegge, I. Gerüsthüpfen durch virtuelles Screening unter Verwendung von 2D- und 3D-Ähnlichkeitsdeskriptoren: Rangfolge, Abstimmung und Konsensbewertung. J. Med. Chem. 49, 1536–1548 (2006).

Artikel CAS PubMed Google Scholar

Hongjian, L., Kam-Heung, S., Gang, L. & Ballester, PJ Bewertungsfunktionen für maschinelles Lernen für die strukturbasierte Optimierung von Arzneimittelleitlinien. WIRES Comput. Mol. Wissenschaft. 10, e1465 (2020).

Google Scholar

Thafar, M., Raies, AB, Albaradei, S., Essack, M. & Bajic, VB Vergleichsstudie rechnerischer Vorhersagetools für Arzneimittel-Ziel-Bindungsaffinitäten. Vorderseite. Chem. 7, 782 (2019).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Hassan-Harrirou, H., Zhang, C. & Lemmin, T. RosENet: Verbesserung der Vorhersage der Bindungsaffinität durch Nutzung molekularmechanischer Energien mit einem Ensemble von 3D-Faltungs-Neuronalen Netzen. J. Chem. Inf. Modell. 60, 2791–2802 (2020).

Artikel CAS PubMed Google Scholar

Jiménez, J., Škalič, M., Martínez-Rosell, G. & De Fabritiis, G. KDEEP: Vorhersage der absoluten Protein-Ligand-Bindungsaffinität über 3D-Faltungs-Neuronale Netze. J. Chem. Inf. Modell. 58, 287–296 (2018).

Artikel PubMed Google Scholar

Ahmed, A., Mam, B. & Sowdhamini, R. DEELIG: Ein Deep-Learning-Ansatz zur Vorhersage der Protein-Ligand-Bindungsaffinität. Bioinform. Biol. Einblicke 15, 11779322211030364 (2021).

Artikel PubMed PubMed Central Google Scholar

Li, Y., Rezaei, MA, Li, C., Li, X. & Wu, D. DeepAtom: Ein Rahmen für die Vorhersage der Protein-Ligand-Bindungsaffinität. Vorabdruck unter https://doi.org/10.48550/arXiv.1912.00318 (2019).

Varela, R., Cleves, AE, Spitzer, R. & Jain, AN Ein strukturgesteuerter Ansatz für die Modellierung von Proteintaschen und die Affinitätsvorhersage. J Comput Aided Mol Des 27, 917–934 (2013).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Durrant, JD & McCammon, JA NNScore 2.0: Eine Rezeptor-Liganden-Bewertungsfunktion für neuronale Netzwerke. J. Chem. Inf. Modell. 51, 2897–2903 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Santos-Martins, D., Forli, S., Ramos, MJ & Olson, AJ AutoDock4Zn: Ein verbessertes AutoDock-Kraftfeld für das Andocken kleiner Moleküle an Zinkmetalloproteine. J. Chem. Inf. Modell. 54, 2371–2379 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Zheng, Z. & Merz, KM Jr. Bewertungsalgorithmus zur Ligandenidentifizierung (LISA). J. Chem. Inf. Modell. 51, 1296–1306 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Hill, AD & Reilly, PJ A Gibbs-Korrelation der freien Energie für das automatisierte Andocken von Kohlenhydraten. J. Comput. Chem. 29, 1131–1141 (2008).

Artikel CAS PubMed Google Scholar

Masso, M. Vierkörper-Atompotential zur Modellierung der Protein-Ligand-Bindungsaffinität: Anwendung zur Vorhersage der Enzym-Inhibitor-Bindungsenergie. BMC-Struktur. Biol. 13 Ergänzung 1, S1 (2013).

Artikel ADS PubMed Google Scholar

Masso, M. Wissensbasierte Bewertungsfunktion, abgeleitet aus der atomaren Tessellation makromolekularer Strukturen zur Vorhersage der Protein-Ligand-Bindungsaffinität. Im Jahr 2012 IEEE International Conference on Bioinformatics and Biomedicine Workshops 17–21 (2012). https://doi.org/10.1109/BIBMW.2012.6470315.

Strömbergsson, H. et al. Das auf lokalen Proteinunterstrukturen basierende Interaktionsmodell verallgemeinert sich auf den gesamten strukturellen Enzym-Ligand-Raum. J. Chem. Inf. Modell. 48, 2278–2288 (2008).

Artikel PubMed Google Scholar

Li, H., Leung, K.-S., Ballester, PJ & Wong, M.-H. istar: Eine Webplattform für das groß angelegte Protein-Ligand-Docking. PLoS ONE 9, e85678 (2014).

Artikel ADS PubMed PubMed Central Google Scholar

Corbeil, CR, Williams, CI & Labute, P. Variabilität der Docking-Erfolgsraten aufgrund der Datensatzvorbereitung. J. Comput. Unterstützt Mol. Des. 26, 775–786 (2012).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Lemmon, G. & Meiler, J. Auf dem Weg zum Ligandenandocken einschließlich expliziter Grenzflächenwassermoleküle. PLoS ONE 8, e67536 (2013).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Peng, S.-M., Zhou, Y. & Huang, N. Verbesserung der Genauigkeit der Posenvorhersage beim molekularen Andocken durch strukturelle Filterung und Konformationsclusterung. Kinn. Chem. Lette. 24, 1001–1004 (2013).

Artikel CAS Google Scholar

Hogues, H., Sulea, T. & Purisima, EO Erschöpfendes Andocken und Energiebewertung solvatisierter Wechselwirkungen: Lehren aus der SAMPL4-Herausforderung. J. Comput. Unterstützt Mol. Des. 28, 417–427 (2014).

Artikel ADS CAS PubMed Google Scholar

Ross, GA, Morris, GM & Biggin, PC Eine Einheitslösung passt nicht für alle: Die Grenzen strukturbasierter Modelle in der Arzneimittelentwicklung. J. Chem. Theorieberechnung. 9, 4266–4274 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Allison, B. et al. Computergestütztes Design von Protein-Kleinmolekül-Schnittstellen. J. Struktur. Biol. 185, 193–202 (2014).

Artikel CAS PubMed Google Scholar

Koes, DR & Camacho, CJ Indizieren volumetrischer Formen mit Anpassung und Packung. Wissen. Inf. Syst. 43, 157–180 (2015).

Artikel PubMed Google Scholar

Saranya, N. & Selvaraj, S. Variation des Proteinbindungshohlraumvolumens und des Ligandenvolumens in Protein-Ligand-Komplexen. Bioorg. Med. Chem. Lette. 19, 5769–5772 (2009).

Artikel CAS PubMed Google Scholar

Spitzer, R., Cleves, AE & Jain, AN Oberflächenbasierte Proteinbindungstaschenähnlichkeit. Proteine ​​79, 2746–2763 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Swapna, LS, Srikeerthana, K. & Srinivasan, N. Ausmaß der strukturellen Asymmetrie in homodimeren Proteinen: Prävalenz und Relevanz. PLoS ONE 7, e36688 (2012).

Artikel ADS PubMed PubMed Central Google Scholar

Meyer, T. & Knapp, E.-W. Datenbank von Proteinkomplexen mit multivalenter Bindungsfähigkeit: Bival-Bind. Proteine ​​82, 744–751 (2014).

Artikel CAS PubMed Google Scholar

Guo, X., He, D., Liu, L., Kuang, R. & Liu, L. Verwendung des QM/MM-Schemas zur Reproduktion der nichtkovalenten Bindungsenergie zwischen Makromolekülen und kleinen Molekülen. Berechnen. Theor. Chem. 991, 134–140 (2012).

Artikel CAS Google Scholar

Guo, X. et al. Spannungsenergie bei der Enzym-Substrat-Bindung: Ein energetischer Einblick in die Flexibilität versus Starrheit des aktiven Zentrums des Enzyms. Berechnen. Theor. Chem. 995, 17–23 (2012).

Artikel CAS Google Scholar

Koes, DR & Camacho, CJ Ausgangspunkte für kleinmolekulare Inhibitoren, die aus der Struktur des Inhibitors für Protein-Protein-Interaktionen gewonnen wurden. Bioinformatik 28, 784–791 (2012).

Artikel CAS PubMed Google Scholar

Mukherjee, G. & Jayaram, B. Eine schnelle Identifizierung von Treffermolekülen für Zielproteine ​​über physikalisch-chemische Deskriptoren. Physik. Chem. Chem. Physik. 15, 9107–9116 (2013).

Artikel CAS PubMed Google Scholar

Saranya, N., Jeyakanthan, J. & Selvaraj, S. Einfluss des Proteinbindungshohlraumvolumens (PCV) und des Ligandenvolumens (LV) auf das starre und flexible Andocken von Protein-Ligand-Komplexen. Bioorg. Med. Chem. Lette. 22, 7593–7597 (2012).

Artikel CAS PubMed Google Scholar

Sitzmann, M. et al. Quantenmechanisch berechnete Konformationsenergien des PDB-Liganden. J. Chem. Inf. Modell. 52, 739–756 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Sturm, N., Desaphy, J., Quinn, RJ, Rognan, D. & Kellenberger, E. Strukturelle Einblicke in die molekulare Basis der Ligandenpromiskuität. J Chem Inf Model 52, 2410–2421 (2012).

Artikel CAS PubMed Google Scholar

Kelley, LA, Shrimpton, PJ, Muggleton, SH & Sternberg, MJE Entdecken von Regeln für die Protein-Ligand-Spezifität mithilfe der Unterstützungsvektor-induktiven Logikprogrammierung. Protein Eng Des Sel 22, 561–567 (2009).

Artikel CAS PubMed Google Scholar

Mitternacht, S. & Berezovsky, IN Ein geometriebasierter generischer Prädiktor für katalytische und allosterische Stellen. Protein Eng. Des. Sel. PEDS 24, (2011).

Buhrow, L., Hiser, C., Van Voorst, JR, Ferguson-Miller, S. & Kuhn, LA Computergestützte Vorhersage und In-vitro-Analyse potenzieller physiologischer Liganden der Gallensäurebindungsstelle in der Cytochrom-C-Oxidase. Biochemistry 52, 6995–7006 (2013).

Artikel CAS PubMed Google Scholar

Flachner, B. et al. Ein chemozentrischer Ansatz zur Identifizierung von Krebszielen. PLoS ONE 7, e35582 (2012).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Nivón, LG, Bjelic, S., King, C. & Baker, D. Automatisierung der menschlichen Intuition für das Proteindesign. Proteine ​​82, 858–866 (2014).

Artikel PubMed Google Scholar

Topham, CM, Barbe, S. & André, I. Eine atomistische statistisch effektive Energiefunktion für rechnergestütztes Proteindesign. J. Chem. Theorieberechnung. 12, 4146–4168 (2016).

Artikel CAS PubMed Google Scholar

Smith, RD et al. Erforschung der Protein-Ligand-Erkennung mit Binding MOAD. J. Mol. Graph. Modell. 24, 414–425 (2006).

Artikel CAS PubMed Google Scholar

Carlson, HA et al. Unterschiede zwischen Komplexen von Enzymen und Nichtenzymen mit hoher und niedriger Affinität. J. Med. Chem. 51, 6432–6441 (2008).

Artikel CAS PubMed PubMed Central Google Scholar

Smith, RD, Engdahl, AL, Dunbar, JB Jr. & Carlson, HA Biophysikalische Grenzen der Protein-Ligand-Bindung. J. Chem. Inf. Modell. 52, 2098–2106 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Khazanov, NA & Carlson, HA Erforschung der Zusammensetzung von Protein-Ligand-Bindungsstellen im großen Maßstab. PLoS Comput. Biol. 9, e1003321 (2013).

Artikel ADS PubMed PubMed Central Google Scholar

Smith, RD et al. CSAR-Benchmark-Übung von 2010: Kombinierte Bewertung aller eingereichten Bewertungsfunktionen. J. Chem. Inf. Modell. 51, 2115–2131 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Burley, SK et al. RCSB-Proteindatenbank: Leistungsstarke neue Tools zur Erforschung von 3D-Strukturen biologischer Makromoleküle für Grundlagen- und angewandte Forschung und Ausbildung in Grundlagenbiologie, Biomedizin, Biotechnologie, Bioingenieurwesen und Energiewissenschaften. Nukleinsäuren Res. 49, D437–D451 (2021).

Artikel CAS PubMed Google Scholar

Altschul, SF, Gish, W., Miller, W., Myers, EW & Lipman, DJ Einfaches Suchwerkzeug für die lokale Ausrichtung. J. Mol. Biol. 215, 403–410 (1990).

Artikel CAS PubMed Google Scholar

Hawkins, PC, Skillman, AG, Warren, GL, Ellingson, BA & Stahl, MT Konformergenerierung mit OMEGA: Algorithmus und Validierung unter Verwendung hochwertiger Strukturen aus der Proteindatenbank und der Cambridge Structural Database. J. Chem. Inf. Modell. 50, 572–584 (2010).

Artikel CAS PubMed PubMed Central Google Scholar

Watts, KS, Dalal, P., Tebben, AJ, Cheney, DL & Shelley, JC Makrozyklische Konformationsprobenahme mit MacroModel. J. Chem. Inf. Modell. 54, 2680–2696 (2014).

Artikel CAS PubMed Google Scholar

Benson, ML et al. Aktualisierung der Bindungsmoad – Datenverwaltung und Informationsworkflow. Neue Mathematik. Nat. Berechnen. (NMNC) 06, 49–56 (2010).

Artikel Google Scholar

Gao, M. & Skolnick, J. Eine umfassende Übersicht über Bindungstaschen kleiner Moleküle in Proteinen. PLoS Comput. Biol. 9, e1003302 (2013).

Artikel ADS PubMed PubMed Central Google Scholar

Zhang, Y., Hubner, IA, Arakaki, AK, Shakhnovich, E. & Skolnick, J. Über den Ursprung und die höchstwahrscheinliche Vollständigkeit von Einzeldomänen-Proteinstrukturen. Proz. Natl. Acad. Wissenschaft. USA 103, 2605–2610 (2006).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Chothia, C. Proteine. Tausend Familien für den Molekularbiologen. Nature 357, 543–544 (1992).

Artikel ADS CAS PubMed Google Scholar

Kahraman, A., Morris, RJ, Laskowski, RA, Favia, AD & Thornton, JM Über die Vielfalt physikalisch-chemischer Umgebungen, denen identische Liganden in Bindungstaschen nicht verwandter Proteine ​​ausgesetzt sind. Proteine ​​78, 1120–1136 (2010).

Artikel CAS PubMed Google Scholar

Binda, C. et al. Bindung von Rasagilin-verwandten Inhibitoren an menschliche Monoaminoxidasen: Eine kinetische und kristallographische Analyse. J. Med. Chem. 48, 8148–8154 (2005).

Artikel CAS PubMed PubMed Central Google Scholar

Kurinov, IV & Harrison, RW Vorhersage neuer Serinproteinase-Inhibitoren. Nat. Struktur. Biol. 1, 735–743 (1994).

Artikel CAS PubMed Google Scholar

Kiani, C. Tranylcypromin: Seine Pharmakologie, Sicherheit und Wirksamkeit. Bin. J. Psychiatrie 15, 3–5 (2020).

Google Scholar

Gelin, M. et al. Kombination von „trockener“ Cokristallisation und In-situ-Beugung zur Erleichterung des Ligandenscreenings mittels Röntgenkristallographie. Acta Crystallogr. D Biol. Kristalllogr. 71, 1777–1787 (2015).

Artikel CAS PubMed Google Scholar

Goto, M. et al. Strukturelle Determinanten für die verzweigtkettige Aminotransferase-Isozym-spezifische Hemmung durch das Antikonvulsivum Gabapentin. J. Biol. Chem. 280, 37246–37256 (2005).

Artikel CAS PubMed Google Scholar

Zhang, YB et al. Auswirkungen von Gabapentin auf die PKC-ERK1/2-Signalübertragung im Rückenmark von Ratten mit Formalin-induzierten viszeralen Entzündungsschmerzen. PLoS ONE 10, e0141142 (2015).

Artikel PubMed PubMed Central Google Scholar

Referenzen herunterladen

Wir schätzen die Großzügigkeit von OpenEye für die Bereitstellung der für diese Studie wesentlichen Software: ROCS, FastROCS und Omega. Diese Arbeit wurde von den National Institutes of Health (R01 GM124283) unterstützt. Die Geldgeber hatten keinen Einfluss auf das Studiendesign, die Datenerhebung und -analyse, die Entscheidung zur Veröffentlichung oder die Erstellung des Manuskripts.

Abteilung für Medizinische Chemie, College of Pharmacy, University of Michigan, 428 Church St, Ann Arbor, MI, 48109-1065, USA

Swapnil Wagle, Richard D. Smith, Anthony J. Dominic III, Debarati DasGupta, Sunil Kumar Tripathi und Heather A. Carlson

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

SW, RDS und HAC haben das Manuskript geschrieben. SW und HAC haben Abbildungen und Tabellen erstellt. RDS, SW, AJD III, DD und SKT kuratierte Daten zur Aufnahme in die Datenbank. SW und RDS haben neue Tools auf der Website implementiert.

Korrespondenz mit Heather A. Carlson.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Wagle, S., Smith, RD, Dominic, AJ et al. Der Untergang von Binding MOAD mit der letzten Datenaktualisierung und der Hinzufügung von 3D-Liganden-Polypharmakologie-Tools. Sci Rep 13, 3008 (2023). https://doi.org/10.1038/s41598-023-29996-w

Zitat herunterladen

Eingegangen: 05. Dezember 2022

Angenommen: 14. Februar 2023

Veröffentlicht: 21. Februar 2023

DOI: https://doi.org/10.1038/s41598-023-29996-w

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.