| Warum ist dieses Wissen wichtig? | Scoring-Matrizen sind neben den Parametern für das Behandeln von Lücken die wichtigsten Eingaben, die das Verhalten der Algorithmen für den Sequenzvergleich massiv beeinflussen. Via Scoring-Schema wird aus der Anwendungsdomäne Wissen über die Bedeutung und die Ähnlichkeit zwischen den Objekten importiert, die durch die Symbole repräsentiert werden. Halten Sie sich vor Augen, dass die Algorithmen rein schematisch mit Symbolen umgehen! Deswegen muss die Scoring-Matrix mit Bedacht gewählt werden. | ||
| Bezug | Die Theorie zu den Scoring-Schemata finden Sie im Kapitel 11 "Scoring-Schemata". | ||
Lernziel |
|
||
| Hier finden Sie ein Venn-Diagramm, welches von physikalisch-chemischen Eigenschaften abgeleitet ist. | |||
| Übung | Scores_1, PAM250-Matrix | ||
| Hier finden Sie die PAM250-Matrix. | |||
| Offensichtlich wurden die Werte in der PAM250-Matrix derart arrangiert, dass Aminosäuren mit ähnlichen Eigenschaften geclustert liegen. | |||
|
|||
| Übung | Scores_2, BLOSUM62 | ||
| Hier finden Sie die BLOSUM62-Matrix. | |||
|
|||
| Hinweise |
|
||
|
Das Vorkommen von Aminosäuren ist im Kapitel 1, Tabelle 1.3 gelistet. In dieser Darstellung sind alle Einträge > 0 rot markiert. Weshalb ist die Diagonale der Scoring-Matrix nicht mit "0en" besetzt? |
|||
| Übung | Scores_3 | ||
|
|||
| Übung | Scores_4 | ||
| Verwendet man BLAST, um sehr kurze Sequenzen in der Datenbank zu suchen, wird per Default auf die PAM 30-Matrix umgestellt. | |||
|
|||
| Hinweise |
Berechnen Sie den Score für den Vergleich der Sequenz S = AVIL
mit sich selbst! Benutzen Sie alternativ die PAM 30- und die BLOSUM 64-Matrix. Welcher Score ist größer? Überlegen Sie sich, in welchem Schritt des BLAST-Algorithmus der Score für kurze Sequenzfragmente eine Rolle für die weitere Berechnung spielt. Was folgt hieraus allgemein für den Zusammenhang zwischen Seqeunzähnlichkeit und Score-Wert bei Verwendung unterschiedlicher Scoring-Matrizen? |
||
| Übung | Scores_5 | ||
| Die Einträge in Substitutionsmatrizen werden aus Substitutionshäufigkeiten f(asi , asj) berechnet. Wir wollen diesen Ansatz hier nachvollziehen. | |||
|
|||
|
|||
Was Sie jetzt verstanden haben sollten |
Es besteht ein Zusammenhang zwischen den Eigenschaften der Aminosäuren und den Werten, die in den Scoring-Matrizen zu finden sind. Die beim Alignment erreichten Score-Werte hängen von der Wahl der Substitutions-Matrix ab. Diese Korrelation wird auch durch den Wert der Matrix-Entropie hergestellt, die im Abschnitt 11.8 beschrieben wird. | ||