Datenintegration und -architektur

Bereit für die Zukunft – mit einer modernisierten Datenlandschaft

Freeletics ist ein auf Sport und Lifestyle spezialisiertes Internetunternehmen. Gegründet im Juni 2013, hat das Startup seine Nutzerbasis in über 160 Ländern auf weltweit mehr als 42 Millionen Menschen ausgeweitet. Das rasante Wachstum und die damit verbundenen Datenströme (Events) brachten das bestehende Data Warehouse an seine Grenzen. Eine neue Architektur war erforderlich geworden: ausgerichtet auf die Zukunft und bereit für weiteres Wachstum.

In Abstimmung mit dem Team von FELD M entschied der Kunde, dass das neue System mehr als 100 Events pro Sekunde verarbeiten können soll. Die Architektur musste im Hinblick auf das Datenvolumen skalierbar sein und auch eine Weiterentwicklung in der Breite (neue Funktionen) ermöglichen. Zudem sollte eine stabile Infrastruktur geschaffen werden, die den IT-Mitarbeiter*innen ein einfaches Ermitteln und Beheben von Fehlern ohne Datenverlust erlaubt.

Abgestimmt auf diese Anforderungen haben wir eine Reihe moderner Technologien empfohlen, darunter AWS EC2, DynamoDB, API Gateway, Severless, Lambda, SQS, S3, Linux, Python und Spark.

Die neue Dateninfrastruktur sollte die folgenden Hauptanforderungen erfüllen:

  • Datenverarbeitung nahezu in Echtzeit
  • Ausgelegt für mehr als 100 Events pro Sekunde
  • Skalierbar, zuverlässig und leicht zu warten

“Das Team von FELD M hat sich als ausgezeichneter Partner erwiesen: immer bereit, den einen Schritt mehr zu gehen. Die Expert*-innen haben ihre technischen Fähigkeiten effektiv eingebracht und sich nahtlos in unser Team integriert. Wir würden uns definitiv erneut für eine Zusammenarbeit entscheiden.”

THOMAS YOPES
Teamleiter Data Engineering und Analytics bei Freeletics

Near-Realtime-Analysen für bessere Geschäftsentscheidungen

Dank der neu entwickelten Architektur lassen sich Analysen nun nahezu in Echtzeit durchführen. Der Erfolg von Kampagnen kann so wesentlich schneller ermittelt werden. Hinzu kommen flexiblere Steuerungsmöglichkeiten und eine zukunftsorientierte Infrastruktur, die offen für das Anbinden und Verarbeiten weiterer Datenquellen ist. Entsprechende Anpassungen hat der Kunde bereits mehrfach umgesetzt.

Der S3 Data Lake bietet dem internen Data Analytics Team neue Möglichkeiten zur Auswertung von Rohdaten, die mit dem Analyse-Tool Amplitude nicht erfasst werden können. Bei den ersten Analysen in PySpark haben wir das Team von Freeletics begleitet und unterstützt. Mit Amplitude haben Teams aus der Produktentwicklung, dem Finanzressort und weiteren Abteilungen die Möglichkeit, generische, aber komplexe Analysen und einfache Visualisierungen selbstständig zu erstellen. Genutzt werden diese Analysen heute für Planung, Controlling und Produktentwicklung.