Cascading

Cascading ist eine API Schnittstelle, welche zum Ziel hat, den Einstieg in die Big Data Entwicklung zu vereinfachen. Sie wurde 2007 von Software-Architekt Chris Wensel eingeführt. Dieser verfolgte die Anfänge von Hadoop und erkannte sehr früh, dass es sehr schwierig werden würde, Programmierer zu finden, die in dieser komplexen Umgebung arbeiten. Vereinfacht ausgedrückt ermöglicht Cascading, dass der Programmierer den Code in einer ihm bekannten Sprache schreibt. Anschließend macht man ihn für Hadoop verständlich.

Die grundsätzliche Idee hinter Cascading im Gegensatz zu anderen Lösungen ist: „Spezifiziere was du brauchst – nicht, wie du es erhalten kannst“. Dabei ist es für Entwickler sehr leicht zugänglich, weil es als Grundlage das Java Framework verwendet. Als Pattern Language, zu Deutsch Mustersprache, folgt es klaren Prinzipien betreffend Design. Dadurch stellt man sicher, dass die als beste etablierte Lösung für ein Problem wiederverwendbar ist.

Vorteile von Cascading

Weiter Vorteile sind:

  • Einfach zu bauen
  • Einfach zu testen
  • Robust in der Ausführung

Zudem hat die Schnittstelle zahlreiche Partnerschaften mit Microsoft Azure, Amazon AWS und weiteren Lösungen im Big Data Bereich, welche alle nicht mehr auf die Vorteile dieses Frameworks verzichten wollen.