Grid Computing

Grid Computing definiert viele miteinander lose über Netzwerke verbundene Rechner, die ihre ungenutzten Kapazitäten zur Verfügung stellen. Da die Gesamtheit der Rechner einen virtuellen Supercomputer bildet, ist es damit möglich, sehr rechenintensive Probleme zu lösen.

Seit den 60er Jahren gibt es bereits entsprechende Konzepte, rechenintensive Aufgaben zu verteilen. Anfänglich entstand die Grundidee, das Verbinden von Rechnern möglichst einfach zu gestalten. Es sollte so einfach sein wie Strom aus einer Steckdose zu ziehen. Infolgedessen wurde auch der Name für die Technologie gewählt. Er leitet sich vom englischen Wort für Stromnetz, Power Grid, ab.

Einsatz im Big Data Umfeld

Dass die einzelnen Rechner nur lose über das Netzwerk miteinander verbunden sind, unterscheidet Grid Computing von ähnlichen Methoden wie beispielsweise Clustering. Beim Grid-Konzept installiert man auf den einzelnen Rechnern eine Software, die erlaubt diese zentral zu verwalten. Im Gegensatz zu einem physischen Hochleistungsrechner kann die Technologie mit deutlich geringeren Investitionen verwendet werden. Im Big Data Umfeld kommt sie vor allem bei rechenintensiven Datenanalysen oder als Alternative für Data Warehousing zum Einsatz.

Grid Computing Klassen

Entsprechend dem Einsatzgebiet unterscheidet man verschiedene Klassen:

  • Rechengrids (Computing Grids): Zugriff auf verteilte Rechenressourcen
  • Datengrids (Data Grids): Zugriff auf verteilte Datenbanken#
  • Ressource Grids
  • Service Grids
  • Application Grids

Rechengrids stellen dem Benutzer verteilte Rechenleistung zur Verfügung, genau wie bei einem Stromnetz. Datengrids ermöglichen die gemeinsame Nutzung von großen verteilten Datenmengen, also in einem Distributed File System. Ferner werden bei Applikations-, Ressourcen- und Service Grids Anwendungen die notwendigen Ressourcen für rechenintensive Anwendungen oder Komplettservices angeboten.