Cassandra

Bei Cassandra handelt es sich um ein einfaches, verteiltes Datenbankverwaltungssystem, dass auf den Umgang mit sehr großen Datenmengen spezialisiert ist.

Ursprung und Entwicklung

Ursprünglich entwickelte man Cassandra für Facebook, da es dort ein Problem mit der Suchfunktion im Posteingang gab. Im Juli 2008 wurde sie dann freigegeben. Wenig später nahm man sie bei der Apache Software Foundation als Unterprojekt in den Apache Incubator auf und eklärte sie später zum “Top-Level” Projekt. Drei Jahre nach der Freigabe des Systems erschien dann die neue Version 0.8. Mit ihr führte man die Cassandra Query Language (CQL) ein. Dabei handelt es sich um eine SQL-ähnliche Abfragesprache.

Konzept und Merkmale

Cassandra ist ein sogenanntes “NoSQL” (= Not only SQL) Datenbanksystem, also eine Datenbank, die einen nicht-relationalen Ansatz verfolgt. Solche Datenbanken verwendet man immer dann, wenn SQL Datenbanken auf Grund ihrer Architektur an ihre Grenzen stoßen würden. In NoSQL Systemen kann man nämlich viel größere Datenmengen speichern.

Sie speichert ihre Daten nicht in Zeilen, sondern spaltenweise, und zeichnet sich durch eine hohe Skalierbarkeit aus. Es handelt  sich außerdem um ein besonders ausfallsicheres System, denn die Daten verteilt sie automatisch auf vielen unterschiedlichen Servern. Außerdem ist sie in Java geschrieben und steht unter Apache Lizenz 2.

 

Verwendung von Cassandra

Verwendet wird sie unter anderem bei Netflix, Reddit, Apple, Twitter etc.