Identifizierung von für Krebserkrankungen bedeutsamen Genen durch Analyse von Sequenzdatenbanken und Veröffentlichungen
2020
Johns Hopkins University, Baltimore, USA
Die Sequenzierung ist so kostengünstig und schnell, dass den Forschern Tausende von Tumorgeweben mit RNA-Seq-Daten zur Verfügung stehen, die einen noch nie dagewesenen Einblick in die Transkriptionslandschaft von Krebs ermöglichen. Die schiere Menge an Daten hat sich jedoch als Herausforderung erwiesen, wenn es darum geht, eine biologische Bedeutung abzuleiten. Viele Analysemethoden beruhen bis zu einem gewissen Grad auf einem Vorwissen über die Signalwege, die biologische Rolle oder die molekulare Funktion von Genen. In der vorliegenden Studie wollten die Forscher die Aufmerksamkeit auf die Tatsache lenken, dass für einen beträchtlichen Teil der Gene, die statistisch mit der Krebsbiologie in Verbindung gebracht werden, keine angemessenen Beschreibungen vorliegen, um ihre Rolle in der Krebspathologie zu verstehen. Die Forscher untersuchten Datenbanken nach Genen, die mit einem ungünstigen Ausgang bei Krebs assoziiert sind, und nutzten dazu den Human Protein Pathology Atlas, der eine Korrelation von mRNA und klinischem Ausgang für fast 8.000 Krebspatienten enthält. Die Studie zeigte, dass eine Reihe biologisch relevanter Gene nicht mit den bekannten veröffentlichten Pfaden in Verbindung stehen. Auch sind sie in der Regel nicht mit bekannten dominanten Mutationen verbunden. Darüber hinaus haben die Forscher Gennetzwerkkarten gezeichnet, die auf biologische Bereiche hinweisen, die im Allgemeinen nicht ausreichend erforscht sind. Insgesamt kommt die Studie zu dem Schluss, dass zwischen der relativen biologischen Bedeutung von Genen und der Literatur, die bestimmten Genen gewidmet ist, nur ein geringer Zusammenhang besteht, was darauf hindeutet, dass die meisten Gene nach ihrer ersten Entdeckung nur begrenzte Aufmerksamkeit auf sich ziehen, während andere Gene zumindest teilweise aufgrund gesellschaftlicher Trends und der Tendenz der wissenschaftlichen Gemeinschaft, eine "kleine Welt" zu sein, unverhältnismäßig viel Aufmerksamkeit erhalten. Die datengestützte Analyse sollte in Zukunft dazu beitragen, biologische "Terra incognita" aufzuzeigen, die als Herausforderungen betrachtet werden sollten.
Functionally enigmatic genes in cancer: using TCGA data to map the limitations of annotations
Channing J. Paller
Eingestellt am: 22.12.2021
[1] https://www.nature.com/articles/s41598-020-60456-x