Warum ist dieses Wissen wichtig?

Die Kenntnis der Protein-2D-Struktur ist wichtig, um z.B. Proteine klassifizieren zu können.

Wir verwenden im Folgenden mehrere unterschiedliche Sekundärstrukturvorhersageverfahren. Zunächst wird PHD benutzt; dies ist einer der ersten Ansätze, in dem anstelle einer einzigen Sequenz ein multiples Sequenzalignment ausgewertet wurde. In vielen Fällen hat es sich gezeigt, dass dieser Ansatz die Qualität von Vorhersagen erheblich verbessert. In multiplen Sequenzalignments werden die Ansprüche an ein Residuum präziser definiert als in einer einzelnen Sequenz. Genau der gleiche Ansatz wird ja z. B. auch in PSI-BLAST verfolgt. Folgerichtig fällt die Vorhersagequalität der 2D-Struktur, wenn zu einer Eingabesequenz nur ganz wenige oder keine homologen Proteinsequenzen gefunden werden.

In Übung zwei und drei wird der Server JPRED eingesetzt. Er stößt intern mehrere 2D-Vorhersage-Algorithmen an und generiert aus deren Ergebnissen eine Consensus-Antwort. Auf diese Weise wird versucht, die Qualität der Vorhersage noch weiter zu verbessern.

Bezug Diese Übungen ergänzen die Konzepte, die im Kapitel 18 "Vorhersage der Sekundärstruktur" vorgestellt werden.  

Lernziel

Nach dem Bearbeiten der Übung sollten Sie
  • die Ausgabe von Sekundärstrukturvorhersageprogrammen interpretieren,
  • die Verlässlichkeit der Vorhersagen einschätzen

können.

 
   
    
Übung 2D_PROT_1, PHD
Dies ist die Sequenz des L7/L12 50 S Ribosomal Protein (C-Terminal Domain) .
>1CTF:_L7(SLASH)*L12 50 S RIBOSOMAL PROTEIN (C-TERMINAL DOMAIN) 
AAEEKTEFDVILKAAGANKVAVIKAVRGATGLGLKEAKDLVESAPAALKEGVSKDDAEAL
KKALEEAGAEVEVK

 

Hier finden Sie den SWISS_PROT-Eintrag und hier Informationen zur 3D-Struktur. Aus dieser ist die folgende Sekundärstruktur angeleitet.
1 AAEEKTEFDVILKAAGANKV AVIKAVRGAT GLGLKEAKDL VESAPAALKE 
B E EE B GGGHH HHHHHHHHHH HHHHHHH HHT SEE B
51 GVSKDDAEAL KKALEEAGAE VEVK 
SB HHHHHHH HHHHHHHT E EEE
  Hier finden Sie das Ergebnis einer Sekundärstrukturvorhersage durch PHD/PROF. Sie können natürlich auch selbst eine Vorhersage anstoßen. Das Ergebnis wird per Email zugestellt oder nach Bearbeitung Ihres Auftrages online dargestellt.

Stellen Sie bitte sicher, dass die Information aus PDB-Dateien für diese Übungen NICHT ausgewertet werden
. Setzen Sie das entsprechende Häkchen auf der Submission-Seite.
 
Hinweise Möglicherweise reagiert PHD träge.

Falls Sie selbst eine Analyse anstoßen wollen, können Sie auch auf einen alternativen Server ausweichen.

Eine Alternative ist Jpred.
Analysieren Sie zunächst die Ausgabe. Machen Sie sich klar, welche Teilaspekte in den jeweiligen Abschnitten der Ausgabe berücksichtigt werden.

Die Vorhersage von PHD wird aus einem multiplen Sequenzalignment (MSA) abgeleitet. Die Qualität der Vorhersage hängt wesentlich von der Zusammensetzung des MSAs ab. Deswegen sollte man sich über die Zusammensetzung des MSAs Klarheit verschaffen.

Wie viele Sequenzen wurden für die Vorhersage ausgewertet?

In vorliegendem Fall ist die 3D-Struktur des Proteins bekannt, deswegen kann die Vorhersage mit der tatsächlichen 2D-Struktur verglichen werden. Die aus der Kristallstruktur abgeleitete 3D-Struktur ist oben angegeben. Vergleichen Sie beide miteinander.

 
Stimmt die von PDH vorhergesagte Sekundärstruktur mit der überein, die Sie aus der 3D-Darstellung ableiten können?
 
     
Übung 2D_PROT_2
     
  Hier finden Sie das Ergebnis einer Sekundärstrukturvorhersage durch PHD/PROF für das VSR-Protein von E. coli.
  Wie gewohnt, gilt der erste Blick dem MSA:  
 
Wie viele Sequenzen wurden in das multiple Sequenzalignment aufgenommen ?
 
  Wir wollen für diesen Fall die Vorhersagequalität etwas genauer analysieren.  
     
  In der folgenden Tabelle finden Sie die Sekundärstruktur, so wie sie im PDB-Datensatz eingetragen ist.  
 
Sequence and secondary structure

1 DTAIEKRLAS LLTGQGLAFR VQDASLPGRP DFVVDEYRCV IFTHGCFWHH
HHHHH HHHHTT E ESBTTTTT B SEEEGGGTEE EEEE TTTTT

51 HHCYLFKVPA TRTEFWLEKI GKNVERDRRD ISRLQELGWR VLIVWECALR
SSTT S SSHHHHHHHH HHHHHHHHHH HHHHHHTT E EEEEEHHHHS

101 GREKLTDEAL TERLEEWICG EGASAQIDTQ GIHLLA
STT HHHH HHHHHHHHHT T SEEEETT EEEE

Sequenz und Sekundärstruktur von VSR aus E. coli

Die Daten sind dem Datensatz 1VSR entnommen.

Vorgehen

Vergleichen Sie die beiden Datensätze. Kopieren Sie die jeweiligen Textzeilen in eine gemeinsame Datei und alignieren Sie diese. Falls Sie Word benutzen, verwenden Sie bitte als Schriftart Courier (New), da in dieser Schriftart alle Zeichen die gleiche Breite haben. Markieren Sie alle Residuen, die in 2D-Strukturen (Helices, ß-Strängen) liegen, die zu mindestens 75 % korrekt erkannt werden. Sie können diese Residuen beispielsweise fett darstellen.

 
 
Welchen Reliabilityindex haben diejenigen Sekundärstrukturelemente, die nicht korrekt vorhergesagt wurden?
 
  Häufig können in Protein-Kristallstrukturen bestimmte Sequenzbereiche nicht aufgelöst werden. Vergleichen Sie die Sequenz, die aus der Kristallstruktur folgt mit der, die  in SWISS-PROT deponiert ist.  
 
Stimmen die beiden Sequenzen überein?
  Falls dies nicht der Fall sein sollte: Welcher Bereich fehlt? Überlegen Sie sich mögliche Ursachen.
 
Übung 2D_PROT_3
  Hier folgt eine Sequenz, für die im Rahmen eines Genomprojektes ein TIM-Barrel-Fold vorhergesagt wurde.
Hypothetisches Protein  
>putative_tim_barrel
maatktfgvd aikeaiscgi taigenrvqe lmekyphlkg qvdfhfighl qtnkvkyiid
kvklvhsldr eklaeeidkr akqkgiimdc lievnigged tkfgispeem hnlvkkleky
dnikikglmt iapylppeev rpyfkrmrel fedlkrinqr nveaqylsmg msndywvave
eganivrigt aifgerr
 
  Lassen Sie von PHD die Sekundärstruktur vorhersagen. (Ergebnis)

 

Finden Sie in der Vorhersage die für TIM-Barrels übliche Folge von Supersekundärstrukturelementen?

   
Übung 2D_PROT_4  
     
  Zur Verbesserung der Vorhersagequalität werden inzwischen Meta-Server implementiert, die parallel mehrere Algorithmen zur Sekundärstrukturvorhersage anstoßen und die Ergebnisse zusammenfassen. In dieser Übung lernen Sie einen der bekanntesten dieser Meta-Server kennen.

Hier finden Sie die 3D-Struktur (1ERP) eines Pheromons und hier die Sequenz

 
 
>Pheromone ER-10 
DLCEQSALQCNEQGCHNFCSPEDKPGCLGMVWNPELCP
 
     
 
Wie lautet die vorhergesagte Sekundärstruktur?
 
Hinweis Übergeben Sie Jpred jeweils nur die reine Sequenz (d.h. ohne die Titelzeile >Pheromone ER-10 ).

Legen Sie eine Tabelle an, tragen Sie Anzahl und Länge der Sekundärstrukturen für die Sequenz ein und vergleichen Sie mit den Einträgen in der PDB.

Was zeichnet die Struktur dieses Pheromons aus? Hat diese Eigenschaft Einfluss auf die 2D-Struktur?

 
     

Was Sie jetzt verstanden haben sollten

Zu den 2D-Vorhersageprogrammen mit höchster Performanz gehören diejenigen, die auf neuronalen Netzen basieren. In PredictProtein ist mit PHD/PROF ein derartiges Verfahren umgesetzt. Die Methoden sind auf ein MSA angewiesen, ansonsten sinkt die Vorhersagequalität beträchtlich.
Die Anordnung von Sekundärstrukturelementen dient dazu, Proteine zu klassifizieren. Eine Datenbank mit diesem Konzept ist SCOP.