Forschungseinrichtung DESY setzt bei Big Data auf IBM

Institut für Teilchenbeschleunigung installiert Big-Data-Lösung von IBM, um Forschungsergebnisse zu sichern, analysieren und zu verteilen.

Dieser Artikel behandelt

Sichere Datenspeicherung

Das Forschungsinstitut DESY hat sich für eine Big-Data-Lösung von IBM entschieden, um Forschungsergebnisse schnell zu analysieren, ablegen und speichern zu können. IBM stellt dafür sein auf GPFS-basierendes Speichersystem Elastic Storage zur Verfügung. Das Projekt soll bis März 2015 abgeschlossen werden und dann tausenden Forschern zugute kommen.

Die DESY nutzt Elastic Storage für seine Forschungslichtquelle PETRA III. Das hochbrillante Röntgenlicht liefert Wissenschaftlern Einblicke in den Nanokosmos - von neuartigen Halbleitern über Katalysatormaterialien bis hin zu lebenden Zellen. PETRA III ist ein 2,3 Kilometer langer Ringbeschleuniger, der elektrisch geladene Teilchen nahezu mit Lichtgeschwindigkeit durch spezielle magnetische Slalomstrecken schickt, um auf diese Weise intensive Röntgenstrahlung zu erzeugen.

Mehr als 2000 Forscher pro Jahr erkunden mit diesem Licht atomgenau die innere Struktur ihrer Proben, wobei enorme Datenmengen entstehen. "Ein typischer Detektor liefert heute einen Datenstrom von etwa fünf Gigabit pro Sekunde", erläutert der Leiter der DESY-IT, Dr. Volker Gülzow. Das entspricht knapp einer CD-ROM pro Sekunde. "An PETRA III steht aber nicht nur ein Detektor, sondern es gibt 14 Messstationen, die zurzeit auf 24 erweitert werden. Alle diese Daten müssen zuverlässig gespeichert und verarbeitet werden."

„Durch neue Kameragenerationen, die hier Informationen erfassen, ist nicht nur die Geschwindigkeit der Datenerzeugung, sondern auch die Datenmenge gewachsen“, erklärt Steve Aplin, IT-Spezialist bei DESY. „Die Kamera erfasst vier Megapixel in einer Kilohertz-Rate, was zu diesem enormen Anstieg führt. Zu Spitzenzeiten fallen 20 GByte pro Sekunde an Daten an, die verarbeitet und zugänglich gemacht werden müssen. Da muss das Netzwerk sowie der Speicher und die Analyse-Tools mithalten können. So muss zum Beispiel Zugriff auf die Informationen gewährleistet sein, noch während sie ins System geschrieben werden.“

Bevor sich das Institut für eine konkrete Lösung entschied, besuchte es andere Forschungseinrichtungen und erkundigte sich, wie diese mit solch hohen Anforderungen heterogener Umgebungen umgehen. Dabei kristallisierte sich heraus, dass gerade GPFS-Lösungen eine etablierte Alternative darstellen. Elastic Storage ist eine Software-definierte Lösung, die Files und Objekte für Big-Data- und Cloud-Projekte verarbeiten kann. Diese nach oben skalierbare Lösung soll die bis zu 20 Gigabyte Daten, die pro Sekunde an den PETRA-III-Messstationen erzeugt werden, speichern und für die Analyse vorhalten. So sollen Forscher schnelleren Zugang zu ihren Messdaten bekommen. DESY kann auf diese Weise Analysis-as-a-Service und Cloud-Dienste für die Nutzer seiner Anlagen aus aller Welt anbieten.

Die Skalierbarkeit des Systems soll auch bei künftigen Herausforderungen bei der Verarbeitung von Forschungsdaten helfen. Mit dem europäischen Röntgenlaser European XFEL bauen DESY und internationale Partner derzeit eine Forschungslichtquelle, die noch sehr viel mehr Daten produzieren wird als PETRA III. "Wir erwarten vom European XFEL etwa 100 Petabyte pro Jahr, also 100 Millionen Gigabyte", erläutert Gülzow. Das ist vergleichbar mit dem Datenvolumen des weltgrößten Teilchenbeschleunigers LHC (Large Hadron Collider) am europäischen Teilchenforschungszentrum CERN bei Genf.

Gerade die Möglichkeit, Daten global teilen zu können, war eine wichtige Voraussetzung für das Projekt. „Normalerweise würden Forscher, die an unserer Einrichtung Experimente durchführen, ihre Resultate auf externen Speichermedien ablegen und mitnehmen“, erläutert Aplin. „Die Datenmenge ist aber so angewachsen, dass hier USB-Medien nicht mehr groß genug sind, um die Ergebnisse einfach so mit ins eigene Institut zu verbringen. Deswegen ist hier die Option, Cloud-Dienste zur Verfügung zu stellen, ein entscheidender Faktor, um die Forschungsarbeiten auf hohem Niveau zu garantieren.“

„Die verteilten Detektoren des DESY-Beschleunigers erzeugen sehr große Datenmengen, die in Echtzeit erfasst und zentral schnell ausgewertet werden müssen. Forscher aus aller Welt greifen dann auf Ergebnisse sowie Rohdaten zu. DESY braucht dazu eine flexible, skalierbare und kosteneffektive Compute- und Speicherarchitektur für die Aufnahme und Analyse riesiger Datenmengen. Wir sehen ähnliche Anforderungen und Verarbeitungsschritte auch in anderen datenintensiven Wissenschaften und glauben deshalb, dass die hier erarbeitete Architektur auf andere Bereiche übertragbar ist“, ergänzt Ulf Troppens, IBM Consulting IT-Spezialist.

IBM Research in Zürich und das IBM Storage Development Team in Mainz werden die nötige technische Expertise aufbieten und ein breites Spektrum von Funktionen auswerten, die Teil der Elastic Storage Roadmap sind.

DESY zählt zu den weltweit führenden Beschleunigerzentren und ist Mitglied der Helmholtz-Gemeinschaft. DESY entwickelt und baut große Teilchenbeschleuniger, um die Struktur der Materie zu erforschen. An seinen Standorten in Hamburg und Zeuthen bei Berlin beherbergt DESY jährlich mehr als 3000 Gastforscher aus über 40 Nationen.

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Sichere Datenspeicherung

0 Kommentare

Älteste Beiträge 

Passwort vergessen?

Kein Problem! Tragen Sie Ihre E-Mail-Adresse unten ein. Wir werden Ihnen eine E-Mail mit Ihrem Passwort schicken.

Ihr Passwort wurde an die folgende E-Mail-Adresse gesendet::

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close