Articles

Gene Ontology Term Enrichment

The Gene OntologyEdit

Hauptartikel: Gene Ontology

Die Gene Ontology (GO) bietet ein System zur hierarchischen Klassifizierung von Genen oder Genprodukten in Begriffe, die in einer Graphenstruktur (oder einer Ontologie) organisiert sind. Die Begriffe sind in drei Kategorien unterteilt: molekulare Funktion (Beschreibung der molekularen Aktivität eines Gens), biologischer Prozess (Beschreibung der größeren zellulären oder physiologischen Rolle des Gens, koordiniert mit anderen Genen) und zelluläre Komponente (Beschreibung der Stelle in der Zelle, an der das Genprodukt seine Funktion ausführt). Jedes Gen kann mit mehreren Begriffen beschrieben (kommentiert) werden. Das GO wird aktiv zur Klassifizierung von Genen von Menschen, Modellorganismen und einer Vielzahl anderer Arten eingesetzt.

Mit dem GO ist es möglich, den Satz von Begriffen abzurufen, die zur Beschreibung eines Gens verwendet werden, oder umgekehrt, wenn ein Begriff angegeben ist, den Satz von Genen zurückzugeben, die zu diesem Begriff annotiert sind. Für die letztere Abfrage wird das hierarchische System des GO verwendet, um vollständige Ergebnisse zu liefern. Beispielsweise sollte eine Abfrage nach dem GO-Begriff für den Kern Gene zurückgeben, die mit dem Begriff „Kernmembran“ annotiert sind.

Interpretieren von Hochdurchsatzdaten

Bestimmte Arten von Hochdurchsatzexperimenten (z. B. RNA-seq) geben Sätze von Genen zurück, die über- oder unterexprimiert sind. Das GO kann verwendet werden, um diesen Satz von Genen funktionell zu profilieren, um zu bestimmen, welche GO-Terme häufiger erscheinen, als es zufällig erwartet würde, wenn der Satz von Termen untersucht wird, die zu den Eingangsgenen annotiert sind. Zum Beispiel kann ein Experiment die Genexpression in gesunden Zellen mit Krebszellen vergleichen. Functional Profiling kann verwendet werden, um die zugrunde liegenden zellulären Mechanismen im Zusammenhang mit der Krebserkrankung aufzuklären. Dies wird auch als Termanreicherung oder Term-Überrepräsentation bezeichnet, da wir testen, ob ein GO-Term für den gegebenen Satz von Genen statistisch angereichert ist.