21.03.2016 Big-Data-Analyse für Enterprise Search

Big-Data-Suche in Studiendaten

Der internationale Pharmaspezialist UCB mit Deutschlandsitz in Monheim filtert mit einer Plattform für Big-Data-Suche und -Analyse relevante Informationen aus strukturierten und unstrukturierten Daten von jahrelangen klinischen Versuchen.

Pharmaspezialist UCB

Der Pharmaspezialist UCB filtert mit einer Plattform für Big-Data-Suche und -Analyse relevante Informationen.

Mit Sinequa hat die auf Biopharmazie spezialisierte UCB kürzlich eine neue Big-Data-Suche- und -Analysetechnologie für die schnelle Gewinnung von Informationen aus klinischen Studiendaten ausgewählt. Die Plattform soll die Suche nach relevanten Datensätzen verkürzen und so die Beantwortung von Fragen beschleunigen, die im Verlaufe des Lebenszyklus der Entwicklung von Medikamenten entstehen, um den Bedarf von Patienten nach neuen Arzneimitteln und Therapien zu erfüllen.

Das biopharmazeutische Unternehmen mit Hauptsitz in Brüssel und über 8.600 Beschäftigten weltweit erforscht und entwickelt Behandlungsmöglichkeiten in den Bereichen zentrales Nervensystem und Immunkrankheiten wie Morbus Crohn, Psoriasis-Arthritis, rheumatoider Arthritis, Epilepsie und Parkinson. In Deutschland ist UCB über die Landesgesellschaft UCB Pharma GmbH mit Sitz in Monheim vertreten.

Im Rahmen der Entwicklung medikamentöser Therapien führt das Unternehmen umfangreiche klinische Studien durch. Auf die dabei entstehenden Big-Data-Inhalte muss UCB bei der Medikamentenentwicklung permanent zugreifen, um Einsichten zu gewinnen und relevante Daten für weiterführende statistische Analysen zu finden. Rund zehn Millionen Files haben sich dabei in den letzten 15 Jahren angesammelt – ein Datenberg von 20 Terabyte, der jährlich um derzeit 30 Prozent wächst. Darunter sind mehr als eine Million SAS-Datensätze mit Milliarden von Datenzeilen, SAS-Programmcode, ASCII-, Microsoft Office- und PDF-Dateien. Mit wachsender Anzahl an Dateitypen und Inhaltsvolumina wird das Auffinden benötigter Informationen zusehends schwieriger. Um hierbei Zeit und Kosten einzusparen, suchte man eine Enterprise-Search-Lösung, mit der Analysten und Programmierer schnell relevante klinische Datensätze finden.
Der Pharmaspezialist hat sich für Sinequa entschieden, um diese Ziele zu erreichen. Die neue Plattform soll es UCB ermöglichen, Suchabfragen effizienter zu gestalten. Über eine einfache Abfrage können Statistiker und Datenmanager relevante Daten für ihre aktuellen Studien und Analysen finden, ebenso wie Hintergrundinformationen zu den ursprünglichen Studien, heißt es. Forscher könnten darüber hinaus Informationen zu ihrer Studie finden, von deren Existenz sie bisher nichts wussten. Dadurch werde die Zeit für Informationssuche und eventuelle neue Analysen um Größenordnungen reduziert und das Pharmaunternehmen kann Fragen von Aufsichtsbehörden schnell beantworten ebenso wie neu aufkommende Fragen zur Anwendung eines Medikaments in spezifischen Populationen.

Big-Data-Analyse reduziert Suchzeiten

„SAS-Datensätze bilden bis zu 70 Prozent unserer klinischen Dateninhalte. Keine andere Technologie konnte mit diesen Datensätzen so umgehen wie Sinequa“, erklärt Todd Culverwell, Direktor Trial Master File und Clinical Repositories bei UCB. „Wir können nach Schlüsselbegriffen suchen und werden sofort auf die richtige Zeile im SAS-Datensatz geführt. Wir können auch eine beliebige Anzahl aus 900 Datensatz-Variablen verwenden und nach Ergebnissen in einem bestimmten Wertebereich für jede dieser Variablen suchen. Was in manchen Fällen früher bis zu zwei Wochen dauern konnte, erledigen wir heute in ein oder zwei Tagen.“

Generell stehen Biostatistiker vor großen Herausforderungen bei der Ermittlung der richtigen Datensätze zur Durchführung ihrer Analysen. „Die richtigen Datensätze dazu bereitzustellen, wie Patientenlisten mit bestimmten Krankheiten oder Nebenwirkungen bei der Einnahme bestimmter Arzneimittel, kann viel Zeit und umfangreiche Ressourcen in Anspruch nehmen. Hierfür soll Sinequa große Mengen strukturierter und unstrukturierter Daten analysieren und in verwertbare Informationen verwandeln.

Bildquelle: Thinkstock/Ingram Publishing

©2017 Alle Rechte bei MEDIENHAUS Verlag GmbH