| Warum ist dieses Wissen wichtig? | Die wissenschaftliche Literatur und die akkumulierte Menge von biologischem Faktenwissen ist ohne die Unterstützung durch Datenbanksysteme nicht mehr überschaubar. Daher ist es ganz essenziell, die wichtigsten Datenbanken zu kennen und mit ihnen umgehen zu können. | ||
| Bezug | Diese Übungen ergänzen das Kapitel 3 "Datenbanken". | ||
Lernziel |
|
||
| Übung | DB_1, Recherche in PubMed | ||
|
Unterzieht man Bakterien einem Hitzestress (heat shock), so wird mit der raschen Synthese spezieller Proteine reagiert. Ähnliches gilt für den Kälteschock. Wir wollen uns Literatur zu diesem Phänomen besorgen.
|
|||
| Hinweise | Verwenden Sie hierzu die Literaturdatenbank
PubMed via Entrez. Benutzen Sie cold shock response bacteria and "cold shock" response bacteria zum Suchen. Wie erklären Sie sich die unterschiedlichen Treffer? Weshalb kann nicht mit deutschen Begriffen gesucht werden? Sortieren Sie die Treffer, in dem Sie in der Zeile Display bei Sort By Pub Date auswählen und analysieren Sie dann die letzte Seite mit Treffern. |
||
| Lösung | Sie sollten diese Publikation gefunden haben. Falls Sie in der Zeile oberhalb des Titels einen Verweis auf einen freien Zugang zu diesem Artikel finden, können Sie auf die PDF-Datei zugreifen. | ||
| Übung | DB_2, Recherche in PubMed | ||
|
Bei der Mutation, welche die Sichelzellenanämie (sickle cell anemia) verursacht, handelt sich es um den Austausch einer einzelnen Base in einem Human-Protein.
|
|||
| Hinweise | Verwenden Sie hierzu wiederum die Literaturdatenbank
PubMed. Sie werden sehr schnell feststellen, dass zu diesem Thema enorm viel publiziert wurde. Benutzen Sie nach ersten eigenen Versuchen als Suchbegriff: sickle cell disease diagnosis epidemiology genetics beta hemoglobin. Sie können diese Begriffe durch copy and paste übernehmen. Am einfachsten lässt sich ein erster Überblick zu einem Forschungsgebiet gewinnen, wenn man Übersichtsartikel (reviews) liest. Pubmed führt reviews in einer separaten Liste auf, die über den Reiter Review auf der Ausgabeseite erreichbar ist. Wie viele Übersichtsartikel wurden bisher geschrieben? In welchem Jahr erschien der erste? In welchem Review wird auf das Gen HbS genauer eingegangen? |
||
| Lösung | Es ist
dieser Artikel. |
||
| Übung | DB_3, Recherchen mit Autorennamen | ||
| Die Literaturdatenbank PubMed ist relational organisiert. Das Anwenden von Suchbegriffen kann auf bestimmte Felder eingeschränkt werden. Die folgende Übung soll Ihnen einige Möglichkeiten aufzeigen. Informieren Sie sich zunächst zu den verwendeten Feldern auf dieser Seite. Ein wichtiges Suchkriterium sind Autorennamen. |
|||
| Fragestellung |
|
||
| Hinweise | Stellen Sie
für die Suche zunächst sicher, dass Sie in der Datenbank PubMed suchen. Dazu im Feld Search Pubmed wählen. |
||
| Fragestellung |
|
||
| Hinweise | Was verbirgt sich
hinter dem Reiter Limits auf
der Einstiegsseite zu Pubmed? Können Sie diese Funktionalität für die Suche nutzbringend einsetzen? Sie sollten 17 Artikel finden. Die Suchanweisung, die tatsächlich benutzt wird, finden Sie, wenn Sie den Reiter Details anklicken. Die Abkürzungen zu den Feldern sollten Ihnen nun vertraut sein. |
||
| Übung | DB_4, Sequenzbeschaffung | ||
| Das trpA-Gen codiert für eine Untereinheit der Tryptophansynthase. Wir wollen uns die Gen- und Proteinsequenz des Gens aus dem Stamm E. coli K-12 MG1655 verschaffen. |
|||
|
|||
| Hinweise | Suchen Sie in wiederum in Entrez/PubMed, wählen Sie jedoch als Datenbank Gene (im Feld Search einstellen) und benutzen Sie als Suchbegriff trpA Escherichia coli K-12 mg1655. | ||
| Der erste Treffer ist mit trpA beschriftet und trägt die
GeneID 946204. Folgen Sie diesem Link und betrachten Sie zunächst den Eintrag. Unter der Überschrift mRNA and Protein(s) ist ein Eintrag angegeben. Folgen Sie diesem Link. Sie sehen einen klassischen Genbank-Eintrag mit der Aufteilung in den Annotationsteil und die Sequenz. Unter den Features ist auch die CDS (codierende Sequenz) verlinkt. Ein Klick auf diesen Link liefert die Gensequenz. Wenn Sie nun auf der betrachteten Seite als Format FASTA auswählen, wird Ihnen die Gensequenz im FASTA-Format angeboten. Diese können Sie dann sehr einfach unterlegen und mit copy and paste ausschneiden und übernehmen. Unter den Features wird bei /translate die Proteinsequenz gezeigt, die aber auch durch Klicken des Eintrages bei protein_id=NP_415776.1 gewählt werden kann. Wird auf dieser Seite nun als Format FASTA gewählt, kann wiederum sehr leicht die Proteinsequenz übernommen werden. Wir haben uns nun die Gen- und die Proteinsequenz zu einem Gen aus den Datenbanken gezogen. |
|||
| Übung | DB_5, Domänenstruktur | ||
| Aus einer früheren Übung wissen wir bereits um die Domänenkomposition des menschlichen Koagulationsfaktors XII. Wir wollen in dieser Übung die SMART-Datenbank verwenden, um diese Struktur zu überprüfen. |
|||
|
|||
| Hinweise | Zunächst laden wir die Proteinsequenz, diesmal aus der
SwissProt-Datenbank. Folgen Sie diesem
Link und
durchsuchen sie die Swissport/TrEMBL Datenbank nach: Coagulation
factor XIIa heavy chain. Der erste Treffer hat die Accession-Number P00748. Dies ist ein eindeutiger Schlüssel für diese Sequenz. Folgen Sie diesem Link und studeren Sie die Informationen, die Ihnen die Datenbank liefert. Relativ weit unten auf dieser Seite wird die Sequenz gelistet. Stellen Sie wiederum aufdas Format FASTA um (eine derartig beschriftete Taste ist auf der Seite eingetragen) und sichern Sie die Sequenz lokal ab. Sie sollten gefunden haben: |
||
|
|
||
| Hinweise | Verwenden Sie nun SMART, um die Domänenstruktur zu bestimmen. | ||
| Folgen Sie dem Link und übergeben Sie in das Fenster
Sequence die Sequenz. Durch Klicken auf die Taste Sequence SMART wird die Analyse angestoßen. Vergleichen Sie anschließend das Ergebnis mit diesem hier, dass Sie bereits kennen. |
|||
| Übung | DB_5, Beschaffen einer Protein-3D-Struktur | ||
| Die PDB-Datenbank hält die Datensätze von Proteinen und Proteinkomplexen vor. |
|||
|
|||
| Hinweise | Geben Sie die drei Schlagworte Azurin Baker
1987 in die Suchmaske ein. Es sollte der Datensatz 2AZA angezeigt werden. Unterhalb des Kürzels verweisen mehrere Icons auf weitere Möglichkeiten mit dem der Datensatz zusätzlich prozessiert werden kann. Mit View PDB File können Sie den Inhalt darstellen lassen. Machen Sie sich mit dem Inhalt der Datei und ihrem Aufbau vertraut. Mit Download PDB File können Sie den Datensatz auf Ihren Rechner laden, um ihn z. B. mit Jmol oder einem anderen Viewer weiter auszuwerten. |
||
Was Sie jetzt können sollten |
Sie können mit den wichtigsten Datenbanken zur Verwaltung von Literatur, DNA- und
Proteinsequenzen umgehen und erste Analysen mit Sequenzen ausführen. |
||