Benutzung der Strukturen für Downstream-Projekte
Für In-silico-Strukturmodellierung, Ligand Fitting oder generell Bioinformatik an dreidimensionalen Molekülen sind gute Ausgangsdaten eine Grundvoraussetzung. Wie immer in der Wissenschaft gilt auch hier “garbage in, garbage out”. Da wir viele Anfragen nach den ‘besten’ Strukturen bekommen, möchten wir im Folgenden einige Richtlinien zur Auswahl geben.
Die makromolekularen Strukturen aus Coronaviren in unserer Datenbank wurden mit drei experimentellen Methoden bestimmt: Röntgenkristallographie, Elektronen-Kryomikroskopie (Kryo-EM) und NMR in Lösung. (Mehr Information zu diesen Methoden unter https://pdb101.rcsb.org/learn/guide-to-understanding-pdb-data/methods-for-determining-structure )
‘Repräsentative Struktur’ ist dabei ein schwieriger Ausdruck: Die Auswahl eines geeigneten Strukturmodells für eine gegebene Berechnung hängt von der Fragestellung ab. Für eine Dynamikstudie eines großen Komplexes reicht womöglich eine 3.5 Å Kryo-EM-Struktur, aber für Ligandenbindung wäre diese Struktur ungeeignet, da die Bindetasche und Aminosäureseitenketten nicht oder nicht genau genug bestimmt wären.
Anhand der folgenden Kriterien kann man auch als Anfänger Strukturen beurteilen:
Zusätzliche Tips
- Falls es mehrere Depositionen für das gleiche Makromolekül gibt, die für das Projekt in Frage kommen, können diese überlagert werden (zum Beispiel mit Coot, Pymol, Chimera or ChimeraX), um eine Vorstellung von Abweichung und innerer Flexibilität zu bekommen.
- Die Methoden, mit denen wir Strukturen lösen und modellieren, ändern sich jedes Jahr. Aus diesem Grund kann es vorteilhaft sein, ein neueres Modell statt eines älteren zu wählen. PDB-REDO verfeinert aus genau diesem Grund jede Woche alle PDB-Einträge neu; diese Neu-Verfeinerungen sind ebenfalls Teil der Datenbank. Des Weiteren werden SARS-CoV-2-Strukturen zurzeit häufig verbessert (PDB „re-versioning“), es lohnt sich also, immer mal wieder nachzusehen.
- Die PDBe Knowledgebase enthält eine Übersicht über die bekannten Ligandenbindungsstellen und Protein-Protein-Interaktionen für Coronavirus-Strukturen: https://www.ebi.ac.uk/pdbe/covid-19
Die Tabelle als Datei im JSON-Format:
https://github.com/thorn-lab/coronavirus_structural_task_force/blob/master/utils/stats.json
