Datenfluss in CERN- Experimenten really big data
Gliederung Das CERN Allgemeines Wichtige Errungenschaften Der Weg der Daten Das CMS-Experiment Aufbau Anfallende Daten Trigger Das Grid Die Ebenen des Grid Vorteile des Grid-Computing
Das CERN Bildquelle: http://www.lhc-facts.ch/img/tunnel/karte6.jpg, Entnahmedatum: 10.05.2014
Geschichte des CERN Conseil Européen pour la Recherche Nucléaire
Wichtige Errungenschaften 1954 Gründung 1957 Synchro-Zyklotron fertiggestellt 1959 Proton-Synchrotron (PS) geht in Betrieb 1976 Super-Proton-Synchrotron (SPS) geht in Betrieb 1968 Vieldraht-Proportionalkammer wird erfunden 1983 Entdeckung der W- und Z-Bosonen 1989 Erste Kollisionen im LEP-Beschleuniger 2008 LHC geht in Betrieb 2000 LEP wird abgeschaltet 1999 Bauarbeiten für den LHC beginnen
Der Weg der Daten
Das CMS-Experiment Compact Muon Solenoid Einer der vier Detektoren am LHC Aufgaben: Suche nach dem Higgs-Boson Suche nach supersymmetrischen Teilchen Suche nach neuer Physik Genauere Vermessung bekannter Teilchen
Aufbau Bildquelle: https://cms-docdb.cern.ch/cgi-bin/publicdocdb/retrievefile?docid=11514&version=1&filename=cms_120918_03.png, Entnahmedatum 21.05.2014
Anfallende Daten Welche Datenmengen fallen an? Kollisionsrate: 40MHz 22 pp-events pro Kollision Daten einer pp-kollision: 1-2 MB 0,88-1,76 PB pro Sekunde!
Trigger Zweck: Aus der Datenflut die interessanten Daten herausfiltern Reduktion der Datenmenge auf einige 100 Events pro Sekunde
Trigger Level 1 Trigger Hardwaretrigger Reduktion auf 100.000 Events pro Sekunde High Level Trigger Softwaretrigger Reduktion auf einige 100 Events die gespeichert werden Aus handelsüblichen Prozessoren aufgebaut Bildquelle: http://www.hep.ph.ic.ac.uk/~tapper/talks/cms-trigger.pdf, Entnahmedatum: 26.05.2014
Das Grid Die am CERN vorhandene Rechenleistung ist viel zu gering um die riesigen Datenmengen auswerten zu können Datenanalyse im Worldwide LHC Computing Grid (WLCG)
Das Grid Weltweit größtes Computing Grid Aufgebaut in 4 Ebenen genannt Tiers 260.000 Prozessorkerne (2013) 180 PB Speicherplatz (2013) Bildquelle: https://espace2013.cern.ch/wlcg-document-repository/images1/wlcg/ccapr13-tiers0-1-2_png-file.png, Entnahmedatum: 02.06.2014
Das Grid Tier 0 CERN Data Centre 1450m² große Serverfarm am CERN 10.000 Server mit 90.000 Prozessorkernen 30 PB Festplattenplatz, 70 PB Magnetbandspeicher 3,5 MW Leistung Wigner Data Centre (Budapest) Über zwei 100 Gbit/s Leitungen mit dem CERN Data Centre verbunden 500 Server mit 20.000 Prozessorkernen 5,5 PB Festplattenplatz 2,5 MW Leistung
Das Grid Tier 0 Zentraler Punkt des Grid Aufgaben Erste Rekonstruktion der Events aus den Rohdaten Speicherung von Rohdaten und rekonstruierten Events Bildquelle: http://home.web.cern.ch/sites/home.web.cern.ch/files/styles/medium/public/image/about_section_page/2013/01/cern-servers.jpg?itok=rskttlqv Entnahmedatum: 02.06.2014
Das Grid Tier 1 13 Rechenzentren weltweit Zentrale Knotenpunkte des Grid Über Glasfaserleitungen direkt mit dem CERN verbunden (10Gbit/s) Deutsches Tier 1 Rechenzentrum: GridKa 8600 Prozessorkerne (2010) 20 PB Speicher (2012)
Das Grid Tier 1 Aufgaben: Sicherung von Rohdaten und rekonstruierten Events Erneute Verarbeitung der Daten unter Berücksichtigung neuer Kalibrierungen Verteilung der Daten an Tier-2 Rechenzentren Archivierung von simulierten Daten aus Tier-2 Rechenzentren
Das Grid Tier 1 Bildquelle: http://gstat2.grid.sinica.edu.tw/gstat/gstat/geo/openlayers#/wlcg_tier/1 Entnahmedatum: 02.06.2014
Das Grid Tiers 2 & 3 o Tier 2 Ca. 150 Forschungseinrichtungen und Universitäten in ca. 40 Ländern Aufgaben: Simulationen Rechenkapazität für Datenanalysen der Endbenutzer o Tier 3 Zugriffspunkt Zur Eingabe von Analyseaufgaben
Vorteile des Grid-computing Hohe Datensicherheit Wissenschaftler weltweit können fast verzögerungsfrei auf LHC-Daten zugreifen Ausfallsicherheit
Das Grid - Datenfluss Bildquelle: http://wlcg-public.web.cern.ch/structure Entnahmedatum02.06.2014