Analyse von Genom-Daten

Big Data in der Medizin

Das Deutsche Krebsforschungszentrum (DKFZ) in Heidelberg setzt für die Untersuchung des menschlichen Erbguts (Genoms) von Patienten Fujitsus Integrated System Primeflex for Hadoop ein.

Labor

Bei wenigen Tausend Patienten kommen schnell mehrere Petabyte an Daten zusammen.

Die skalierbare Plattform ermöglicht die Analyse großer Datenmengen mit hoher Geschwindigkeit, heißt es. Das DKFZ nutze die Plattform dazu, um das Tumorerbgut von Patienten zu untersuchen. Obwohl das menschliche Genom aus „nur“ 3 Milliarden Basen-Paaren besteht, kommen dabei selbst bei wenigen Tausend Patienten schnell mehrere Petabyte an Daten zusammen. Dafür verantwortlich sind Oversampling-Faktoren und die Tatsache, dass pro Patient mehrere Gewebeproben untersucht werden können.

Normalerweise werden diese Daten mit speziellen Verfahren analysiert, um schrittweise die relevanten Informationen aufzuspüren. Kommen dabei die in der Forschung gebräuchlichen Rechner-Cluster zum Einsatz, kann es mehrere Monate dauern, bis Resultate vorliegen und die nächsten Forschungsfragen formuliert werden können. Daher lohnt es sich, die Rohdaten für eine schnelle, parallele Bearbeitung aufzubereiten.

Das erfolgt beim DKFZ mithilfe der Hochleistungs-Big-Data-Infrastruktur von Fujitsu. Integrated System Primeflex for Hadoop kombiniert die Vorteile vorkonfigurierter und vorab getesteter Hardware, die auf Industriestandardkomponenten basiert, mit Open-Source-Software von Cloudera und der Big-Data-Analyse-Software von Datameer. Anwendern wie dem DKFZ steht somit eine schlüsselfertige Big-Data-Plattform zur Verfügung, die sich nach Bedarf erweitern lässt.

Bildquelle: Thinkstock/iStock

©2019Alle Rechte bei MEDIENHAUS Verlag GmbH

Unsere Website verwendet Cookies, um Ihnen den bestmöglichen Service zu bieten. Durch die weitere Nutzung der Seite stimmen Sie der Verwendung zu. Weitere Infos finden Sie in unserer Datenschutzerklärung.

ok