Coronavirus
Structural Task Force

Wie messen wir makromolekulare Strukturen?

Proteine sind komplexe und empfindliche, große Moleküle (sogenannte Makromoleküle), deren Strukturanalyse uns sehr viel über ihre Funktion verraten kann. Doch die Messung ist komplizierter als man annehmen mag. Man kann nicht einfach einen Blick durch ein Mikroskop werfen, fokussieren und das Protein sehen. Man kann es sich wie das Röntgenbild eines Arms vorstellen, mit dem kleinen Unterschied, dass der Arm hierfür abgenommen, tausendfach vervielfältigt und kristallisiert werden müsste, bevor er mit Röntgenstrahlen beschossen wird. Nachdem man sich dann noch mit viel Mathematik herumgeschlagen hat, würde man so das fertige Bild eines Arms erhalten.

Unterschiedliche Methoden

Die experimentell ermittelten Molekülstrukturen aus dem Coronavirus können aus drei Quellen stammen: Röntgenkristallographie, Kryo-Elektronenmikroskopie (Kryo-EM) oder Kernspinresonanz in Lösung (NMR). Jede dieser Methoden bringt dabei ihre ganz eigenen Vor- und Nachteile mit sich. Kombiniert man diese Methoden miteinander und mit weiteren Techniken wie Massenspektrometrie, chemischer Quervernetzung, fluoreszentem Resonanzenergietransfer und einigen Berechnungen, können die genauen Details der Molekülstruktur Stück für Stück ans Licht gebracht werden.

Kryo-Elektronenmikroskopie (Kryo-EM)

Wenn es darum geht, eine „große“ (aber immer noch sehr kleine) Molekülstruktur aufzulösen, kann die Elektronenmikroskopie einem einen ausgezeichneten strukturellen Überblick bieten. Im Gegensatz zu den anderen Techniken wird das Molekül direkt abgebildet. Das geschieht mit Hilfe eines Elektronenstrahls und eines Systems von Linsen. Der schwierige Teil ist dann die Umwandlung dieser 2D-Abbildungen in dreidimensionale Strukturen. Dafür bildet man das Objekt tausende Male aus verschiedenen Perspektiven ab, um es dann dreidimensional rekonstruieren zu können. Auch wenn Elektronenmikroskopie lange Zeit als Methode mit niedriger Auflösung galt, ermöglicht moderne Technologie eine immer höhere Auflösung, die fast den Detailreichtum der Röntgenkristallographie erreichen kann. Es können sogar Aminosäure-Seitenketten, Wassermoleküle auf den Oberflächen der Makromoleküle und Liganden erkannt werden.

Entstehung einer Kryo-EM Struktur. Ein Bild von tausenden verschiedenen Ansichten der Makromoleküle (A) und die 16 am häufigsten auftretenden in (B). Die fertige 3.3 Angstöm Struktur-Karte in (C). 
Original Bilder von: Matthies, D., Bae, C., Toombes, G.E., Fox, T., Bartesaghi, A., Subramaniam, S., Swartz, K.J. (2018) Life 2018;7:e37558, bearbeitet von  Ferdinand Kirsten, Lizenz: CC BY-ND 2.0
Entstehung einer Kryo-EM Struktur. Ein Bild von tausenden verschiedenen Ansichten der Makromoleküle (A) und die 16 am häufigsten auftretenden Ansichten in (B). Die fertige 3.3 Ångstöm Struktur-Karte in (C).
Original Bilder aus: Matthies, D., Bae, C., Toombes, G.E., Fox, T., Bartesaghi, A., Subramaniam, S., Swartz, K.J. (2018) Life 2018;7:e37558, bearbeitet von Ferdinand Kirsten, Lizenz: CC BY-ND 2.0

NMR-Spektroskopie

Ein wichtiger Teil der NMR-Spektroskopie ist die sogenannte Isotopenanreicherung. Während beim altbekannten MRT beim Arzt lediglich die Position der Atomkerne eines bestimmten Gewebes bestimmt werden kann, gestattet diese Methode eine genauere Analyse der Verteilung der Kohlenstoffatome. Dazu müssen sich die Kohlenstoffatome jedoch voneinander unterscheiden: Deshalb werden im Laufe des Aufarbeitungsprozesses verschiedene Isotope mit unterschiedlicher Neutronenzahl im Kern in das Proteinrückgrat eingebaut. Nach dieser Aufarbeitung wird das Protein einem starken Magnetfeld ausgesetzt und mit Radiowellen gemessen. Die entstehenden spezifischen Resonanzen jeder Substanz werden dann analysiert und man erhält Informationen über die Position jedes Kohlenstoff-Atomkerns im Verhältnis zu den anderen. Durch diese Positionsbestimmung kann man auf Distanzen oder mögliche chemische Bindungen schließen. Jetzt gilt es, das sudokuartige Rätsel richtig zu lösen, um ein atomares Modell des Moleküls erstellen zu können. Diese Methode eignet sich nur für kleine oder mittelgroße Moleküle, da größere Strukturen zu viel Überlappung in den Resonanzspektren verursachen. Die NMR-Spektroskopie kann jedoch damit punkten, dass die Messung flexibler Proteine in Lösung möglich ist. Sie ist an kein festes Stadium gebunden, das molekulare Bewegungen einschränken würde.

Darstellung eines Daten-Sets, dass aus NMR-Spektroskopie gewonnen wurde. Einige der Einschränkungen, die hier bei der Strukturlösung von Hemoglobin sind hier in gelb dargetsellt, das Protein in grün. (PDB: 1vre und 1vrf). Bild von PDB101.rcsb.org.
Darstellung eines Datensets, dass aus NMR-Spektroskopie gewonnen wurde. Das Protein ist in Grün dargestellt, die bekannten Abstände zwischen Kohlenstoffen sind gelb (PDB: 1vre und 1vrf). Bild von PDB101.rcsb.org.

Röntgenkristallographie

Die Röntgenkristallographie ist, von den hier behandelten Methoden, die am häufigsten genutzte. Insgesamt sind 145252 der Strukturen in der Protein-Datenbank mittels Röntgen-Kristallographie gemessen worden. Die NMR-Spektroskopie (12965 Strukturen) und die Kryo-Elektronenmikroskope (4926 Strukturen) sind weitaus seltener vertreten. Das große Manko der Röntgenkristallographie ist die Notwendigkeit eines Proteinkristalls, aber sie liefert enormen Detailreichtum. Mit ihr kann man die Atome jeder Aminosäure und sogar von Liganden, Inhibitoren, Ionen oder anderen Molekülen bestimmen. Gleichzeitig schränkt aber der aufwändige Prozess der Kristallisation die Möglichkeiten ein, welche Proteine gemessen werden können. Die Aufarbeitung der Proteine für die Kristallisation bleibt eine anspruchsvolle Aufgabe. Nach der Aufarbeitung kann die Produktion eines messbaren Proteinkristalls einige Zeit, mitunter Jahre, in Anspruch nehmen. Ein besonderes Problem stellen dabei sehr flexible Proteine dar. Als Enzyme oder Rezeptoren besitzen Proteine häufig bewegbare Teile oder liegen in verschiedenen Konformationen vor, um vollständig funktionsfähig zu sein. Genau diese flexiblen Proteine sind leider oft die Interessantesten.
Ist der Kristall einmal hergestellt, wird er mit flüssigem Stickstoff gekühlt und mit einem intensiven Röntgenstrahl beschossen. Dieser Prozess ist vergleichbar mit einem Kristall, der ins Licht gehalten wird. Er wirft Reflektionen an eine Wand und diese werden dann angesehen. Die Röntgenstrahlen treffen den Kristall und werden in einem spezifischen Muster reflektiert. Diese Reflektionen sind kein direktes Bild des Kristalles, sondern müssen erst richtig interpretiert werden, um daraus auf die Kristallstruktur, also die molekulare Struktur im Kristall, schließen zu können. Die Verteilung der Elektronen kann aus den Reflektionen errechnet werden und liefert eine Elektronen-Dichtekarte, mit der die Position jedes einzelnen Atoms abgeschätzt werden kann.

Schematische Vorgehensweise bei der Röntgenkristallographie. Das kristallisierte Protein streut den Röntgenstrahl in einem spezifischen Muster. Dieses Muster wird über spezielle Algorithmen in eine Elektronen-Dichtekarte mit der Aufenthaltswahrscheinlichkeit jedes Atomes umgerechnet. Daraus kann dann ein Modell der Struktur gebaut werden.
Kristalle von Andrea Thorn, Diffraktionsmuster von Sabrina Stäb, Grafik von Ferdinand Kirsten.

Und dann...?

Die molekularen Modelle, die aus diesen Methoden gewonnen werden, eröffnen zahlreiche Möglichkeiten: Struktur-basiertes-Wirkstoffdesign, computerbasierte, dynamische Simulationen und natürlich Antworten auf wichtige biologische Fragen. Aber wie interpretieren wir diese Strukturen richtig, um alle biologischen Informationen zu bekommen? Das wird das Thema des nächsten Blog-Eintrags!

Zum Nachlesen (Englisch):

SARS-CoV-2: Nicht neu, aber anders

Das neuartige Coronavirus (SARS-CoV-2 oder 2019-nCoV) ist ein großes Einzelstrang-RNA Virus mit positiver Polarität. Es ist der Familie der Betacoronaviren zugeordnet und zeigt große genetische Ähnlichkeit zu SARS-CoV und MERS-CoV und ist besonders nah verwandt mit dem Bat-SARS-like-CoV (Fledermaus-Coronavirus), von dem es wahrscheinlich auch abstammt. Trotz vieler Gemeinsamkeiten erkennt man, wenn man den Infektionsmechanismus und die Struktur seiner Proteine genau analysiert, eindeutige Unterschiede zu SARS-CoV und anderen Coronaviren.

Ein wertvoller Inhalt

Wie fast alle RNA-Viren besitzt das Virus eine Lipid-Hülle, in die diverse Proteine integriert sind. Diese Hülle ist zuständig für die Interaktion mit der Wirtszelle und dient dem Schutz des Erbgutes, der viralen RNA. Diese RNA dient unter Anderem als direkte Vorlage für die Herstellung der beiden Polyproteine pp1a und pp1ab, die für 16 nicht-strukturelle-Proteine (nsp) kodieren. Diese 16 nsps, kodiert von etwa zwei Dritteln der gesamten Genom-Länge, werden von der Chymotrypsin-artigen-Protease (=Hauptprotease) und ein oder zwei Papain-artigen-Proteasen aus der langen Polypeptidkette herausgeschnitten und so in funktionelle Proteine umgewandelt. Infolgedessen kann sich der Replikations-Transkriptions-Komplex (RTC) bilden und eine Vielzahl sogenannter subgenomischer RNAs (sgRNAs) bilden, die wiederum als Grundlage für die Produktion subgenomischer mRNA und neuer viraler Proteine dienen. Andere Bereiche des Genoms kodieren für mindestens vier Strukturproteine, die Teil der Virushülle sind und als Nucleokapsid die RNA stabilisieren (bezeichnet als S-, M-, E- und N-Protein für Spike, Membran, Hülle und Nukleokapsid)

3D-Darstellung der SARS-CoV-2 Struktur. Die Hüllen (E)-, Spike (S)- und Membran (M)-Proteine sind an die Lipidmembran gebunden, die einzelsträngige RNA und das Nukleokapsid (N)-Protein liegen im inneren vor. Grafik von Thomas Splettstoesser; www.scistyle.com.
3D-Darstellung der SARS-CoV-2 Struktur. Die Hüllen (E)-, Spike (S)- und Membran (M)-Proteine sind an die Lipidmembran gebunden, die einzelsträngige RNA und das Nukleokapsid (N)-Protein liegen im inneren vor. Grafik von Thomas Splettstoesser; www.scistyle.com.

Der erste Kontakt

Das Virus befällt hauptsächlich Zellen, die den Oberflächenrezeptor ACE2 (Angiotensin-konvertierendes Enzym 2) tragen. Dieser Zelltyp findet sich häufig im Gewebe der Atemwege und bei Kontakt der Viren mit der Zelle und ihren Oberflächenproteinen kann die virale RNA eingeschleust werden. Aber wie geschieht dieses Einschleusen? Das Spike-Protein, welches die "Korona" um das Virus bildet, tritt mit einem dafür spezialisierten Teil des Proteins, der Rezeptor-bindenden-Domäne in Kontakt mit der Wirtszelle. Anschließend können die Viren über den komplexen Prozess der Endozytose mit der Zelle verschmelzen und ihre Erbinformation so einschleusen. Sobald eine Zelle infiziert ist, fungiert sie als kleine Fabrik zur Herstellung hunderter neuer Virus-Moleküle, was eine starke Reaktion des Immunsystems hervorruft. Die bekanntesten Symptome umfassen Husten, Fieber, Atemnot, Müdigkeit, Geschmacksverlust, Kopfschmerzen, Diarrhö, Lymphopenie, oder Lungenentzündung, die in schweren Fällen sogar den Tod des Patienten verursachen können.

Crystal structure of spike protein receptor-binding domain from SARS coronavirus epidemic strain complexed with human-civet chimeric receptor ACE2, picture by Ferdinand Kirsten
Kristallstruktur der Rezeptor-bindenden-Domäne des Spike-Proteins aus einem Stamm des SARS-Coronavirus (2002-2003) (magenta) komplexiert mit dem humanen Rezeptor ACE2 (grün).
PDB: 3SCL, Bild von Ferdinand Kirsten

Die Struktur und der Infektionsmechanismus des Virus bieten viele Möglichkeiten, um spezifische Medikamente oder Impfungen zu entwickeln. Eine Hemmung der Hauptprotease, die Störung der Virus-Zusammensetzung, des Spike-Proteins oder des RTCs sind nur einige von zahlreichen möglichen Angriffspunkten der Wissenschaft, um antivirale Methoden zu entwickeln und eine Ausbreitung zu verlangsamen oder zu stoppen. Bis zum jetzigen Zeitpunkt konnte jedoch noch kein Wirkstoff entwickelt werden, der in klinischen Studien zum gewünschten Ergebnis führt.

Zum Nachlesen (auf Englisch):

Form folgt Funktion

Proteine sind große Moleküle, die aus 400 bis 20.000 Atomen bestehen können. Sie sind die Arbeitstiere der lebendigen Welt – Proteine verarbeiten Nahrung, bauen Muskeln, organisieren Zellteilung und Zellunterteilung und sie bilden Haut und Haare. Ihre Grundbausteine sind Aminosäuren, die eine lange Kette bilden. Diese Kette wird durch komplexe Faltung und Verknüpfung zum funktionellen Molekül. Die Sequenz der Aminosäuren - von denen es 20 verschiedene gibt – entscheidet hierbei über die Faltung des fertigen Moleküls, die man nicht immer vorhersagen kann. Aufgrund der (noch) zu hohen Komplexität müssen die Formen der Moleküle experimentell ermittelt werden.

Modell und Elektronendichte von Penicillin
Molekulares Modell von Penicillin mit Elektronendichte von Dorothy Hodgkin, ca. 1945. Bild von https://proteopedia.org/wiki/index.php/Molecular_sculpture

Eine Proteinstruktur verstehen heißt, zu verstehen wie sie funktioniert und was sie tut. Das Coronavirus trägt den genetischen Code für seine eigenen Proteine in sich, welche dann von der infizierten Wirtszelle produziert werden. Diese Proteine interagieren mit den eigentlichen menschlichen Proteinen. Es ist also wichtig, dass wir diese Proteine verstehen: Die Beeinflussung viraler Proteine oder die Beeinflussung der Interaktion mit der Wirtszelle kann eine Infektion stoppen und uns einen entscheidenden Vorteil im Kampf gegen den unsichtbaren Feind verschaffen - denn er ist jetzt sichtbar.

Aber wie misst und visualisiert man überhaupt etwas so Kleines wie ein Molekül, selbst ein großes? Gute Frage!
Nach der schwierigen Aufgabe, einen Kristall aus so einem großen (und irgendwie labberigem) Molekül zu formen, es wie ein(e) Irre(r) mit Röntgenstrahlen zu beschießen und die Streuung zu messen, werden die Daten mit einem Modell der Struktur interpretiert.

Datenstatistik der PDB
Wachstum der Komplexität und Anzahl makromolekularer Strukturen in der PDB (Proteindatenbank; Bild von RCSB PDB: http://www.pdb.org/pdb/home)

Aber auch mit einem Modell ist es oft kaum möglich, irgendetwas zu erkennen. Es gibt zu viele Atome. Das stete Wachstum der bekannten Strukturen erfordert eine bessere Darstellung zur Analyse und zum Vergleich. Einen großen Teil zur Lösung dieses Problems konnte Jane Richardson von der Duke Universität beitragen, als sie 1980 das Ribbon-Diagramm, oder Bändermodell, entwickelte.

Das Bändermodell

"Ich kann nicht sehen, wie man eine Proteinstruktur mit 1000 Wörtern beschreiben könnte, aber mit einem Bild kann man der Sache ziemlich nahekommen."

- Jane Richardson

Das Bändermodell, eine dreidimensionale, schematische Darstellung, ist heutzutage die meistgenutzte Darstellungsform makromolekularer Strukturen. Das „Band“ zeigt das Rückgrat (= Aminosäurekette) des Proteins. Abhängig von Faltung, die durch sogenannte Wasserstoffbrückenbindungen erreicht wird, kann die Aminosäurekette in drei Kategorien, die Sekundärstrukturen, unterteilt werden: α-Helices, β-Faltblätter und Schleifen.
Diese werden dann als Band-Helices oder Pfeile dargestellt. Wenn es sich um um parallele Pfeile handelt, zeigen beide in die gleiche Richtung. Bei anti-parallelen, zeigen sie in die entgegengesetzte Richtung.
Schleifen werden als einfacher Schlauch, mit geringerem Durchmesser als Helices oder Faltblätter gezeigt. Diverse Merkmale können noch zusätzlich zum Bild hinzugefügt werden.

alpha-Helix-Darstellungen
Verschiedene Darstellungen einer alpha-Helix: Die Hauptkette als Stabmodell, nur die Hauptkette und als Bändermodell. Bild von Ferdinand Kirsten.
Verschiedene Darstellungen eines Faltblattes
Verschiedene Darstellungen eines anti-parallelen beta-Faltblatts mit einer Schlaufe. Die Hauptkette als Stabmodell, nur die Hauptkette und als Bändermodell. Bild von Ferdinand Kirsten.

Strukturen mithilfe von Visualierungsmethoden wie dem Bändermodell zu untersuchen kann einen ausgezeichneten Überblick über die Faltung, Symmetrie und mögliche Interaktions- und Bindestellen im Protein verschaffen. Und strukturelle Eigenschaften bewirken verschiedene Funktionen in Proteinen.
Eine einheitliche Repräsentation der gewonnenen Daten ist der Schlüssel, um diese kleinen, fleißigen Maschinen Stück für Stück besser verstehen und miteinander vergleichen zu können.

ADP-Ribose-Phosphatase aus NSP3, einem SARS CoV-2 Protein als Bändermodell in verschiedenen Ansichten (Proteindatenbank-Eintrag 6vxs). Bild von Ferdinand Kirsten.

Zum aktuellen Problemkind: Das SARS-Coronavirus-2 (oder hCoV2019).
Hier können Bändermodelle viraler Proteine zahlreiche Einblicke in virale Strukturen, ihre Funktion und ihre Rolle bei den Infektionen von Wirtszellen ermöglichen.
Es ist eine Kunst für sich, ein atomares Modell anhand von experimentellen Daten zu bauen. Diese Kunst und die Ideen von Jane Richardson und die anderer Strukturbiologinnen und -biologen beeinflussen tagtäglich das Denken von jungen Wissenschaftlern und unsere Sicht auf das Leben im molekularen Maßstab.

Mehr Informationen:

https://iubmb.onlinelibrary.wiley.com/doi/full/10.1002/bmb.2002.494030010005

https://research.duke.edu/ribbon-diagrams

https://blogs.sciencemag.org/pipeline/archives/2018/11/05/hail-to-the-ribbon

https://stories.duke.edu/sciences-mother-of-ribbon-diagrams-celebrates-50-years-at-duke

Logo Coronavirus Structural Taskforce