| Warum ist dieses Wissen wichtig? |
Multiple Sequenz Alignments (MSAs) enthalten mehr Information als eine
einzelne Sequenz oder ein paarweises Alignment. In dieser Einheit
beschäftigen wir uns mit Methoden, diese Information zu nutzen. Die Idee
ist jeweils, die Verteilung der Symbole spaltenweise zu bewerten. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Bezug | Die theoretischen Grundlagen finden Sie im Kapitel 10 "Sequenz-Motive". | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Lernziel |
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Profile | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Übung | Profile_1 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Gegen sei das folgende MSA von Erkennungssequenzen und die daraus abgeleitete, unvollständige Scoring-Matrix. Die Scores wurde mithilfe der log10-Funktion errechnet. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Hinweise | Bestimmen Sie zunächst
die fehlenden Scores für die Spalte 4. Berechnen Sie anschliessend den
Score für die Sequenz ATTG. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Lösung | Hier finden Sie eine Lösung. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Übung | Profile_2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Gegeben Sei dieses
multiple Sequenzalignment von TrpF-Sequenzen. Uns interessiert die
Verteilung der Aminosäuren an den einzelnen Positionen. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Hinweise |
Benutzen Sie diesen Server und übergeben Sie per
copy and paste das MSA. Es empfiehlt sich, folgende Parameter einzustellen: Image format: PDF, Sequence Type amino acid Interpretieren Sie anschließend das Ergebnis: An welchen Positionen sind die Aminosäuren strikt konserviert? An welchen Positionen sind welche Variationen erlaubt?
Gibt es größere Bereiche mit hoher Konservierung der Sequenz? Überlegen Sie sich nochmals den Unterschied zwischen Konsensus-Sequenz und dieser Darstellung. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Hinweise | Die erste Sequenz aus dem MSA ist die des
Proteins TRPF_THEMA, d. h. des TrpF -Proteins aus Thermotoga maritima.
Dessen Struktur ist bekannt und
hier finden Sie eine Darstellung der Sekundärstruktur. Welche Elemente
der Struktur sind hier besonders konserviert? | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Übung | Profile_3 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Im Folgenden beschäftigen wir uns mit dem Alignment zwischen einer Sequenz und einem Profil. Die Sequenz lautet ATCC. Sie ist bereits neben der Matrix eingetragen, diese ist bereits für die Berechnung des Alignments vorbereitet. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Hinweise | In der mit Gap markierten Zeile sind positionsspezifisch Scores für das Einführen vom Lücken angegeben. Mit s(ai , j) ist der Eintrag gemeint, der in
der Spalte j und der Zeile zu finden ist, die mit dem Symbol ai
bezeichnet ist. Das Alignment ist in diesem Fall nicht relevant. Um ein Alignieren des ersten Symbols zu erzwingen, ist die nullte Spalte hier mit -∞ initialisiert. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Verwenden Sie wiederum dynamische Programmierung. Die Bedingung für das Füllen der Matrix lautet nun: Sij = max { Si-1, j + Gap(j) , Si-1, j-1 + s(ai , j) , Si, j-1 + Gap(j) }
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Wie unterscheidet sich generell die Berechnung eines Alignments zwischen zwei Sequenzen und zwischen einer Sequenz und einem Profil? | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Signaturen |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Übung | Signatur_1 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Die Protein-Struktur 2gat.pdb enthält einen Zink-Finger. Studieren Sie diesen Eintrag auf der PDB-Sum Seite des EBI. Dies ist die in Prosite dazu hinterlegte Signatur: |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Wo ist in der Struktur das Zink-Finger-Motiv zu finden? |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Hinweise |
Versuchen Sie sich einen Überblick über die Sequenzvariation innerhalb des Fingers zu verschaffen. Beispielsweise durch BLASTEN mit Alignment view "query anchored with dots for identities". Diese Option können Sie auf der Tafel "Reformat these Results" im Feld "Alignment view" einstellen. Nach Drücken der Taste View Report wird eine neue Ausgabe generiert. Suchen Sie via SRS den Prosite- und Interpro-Eintrag, der den Zink-Finger beschreibt. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Was Sie jetzt verstanden haben sollten |
Es gibt mehrere Möglichkeiten, um eine Menge von Sequenzen zu beschreiben. Der Vergleich einer Sequenz mit einem Profil führt zu Verfahren wie PSI-BLAST oder den Hidden-Markov-Modellen. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||