Werde Teil eines agilen 9-köpfigen AppOps-Teams und gestalte mit uns die Next Generation unserer Wertpapierabwicklungsplattform: Wir entwickeln eine zukunftsfähige Event-Driven Microservices-Architektur auf Basis von Spring Boot und Kafka, die Millionen von Wertpapiertransaktionen für Banken in Deutschland stabil und performant verarbeitet.
Unser Team ist Vorreiter der agilen Transformation in Richtung SAFe. Wir probieren neue Arbeitsweisen aus, entwickeln unsere Prozesse kontinuierlich weiter und suchen Menschen, die Lust haben, diesen Weg aktiv mitzugestalten. Neben klassischen Betriebsaufgaben betreuen wir auch moderne Cloud- und KI-Lösungen, wie etwa auf Basis von AWS-Bedrock, und sorgen dafür, dass unsere Plattform zuverlässig und effizient läuft.
In deiner Rolle agierst du als zentrale Schnittstelle zwischen unserem Plattform-Team und dem AppOps-Team und übernimmst dabei Verantwortung für folgende Themen:
- AI & Cloud Operations: Du betreibst und überwachst unsere KI-basierten Lösungen im AWS-Umfeld – insbesondere Services rund um AWS Bedrock. Dabei stellst du sicher, dass diese stabil laufen und greifst ein, wenn es zu Störungen oder Auffälligkeiten kommt.
- Serverbetrieb sicherstellen: Du verantwortest den Betrieb unserer Serverlandschaft im AWS-Umfeld auf Betriebssystemebene – von Updates über Konfigurationen bis hin zur Stabilisierung der Systeme.
- Automatisierung vorantreiben: Um Effizienz zu steigern und Fehlerquellen zu reduzieren, automatisierst du Betriebs- und Deploymentprozesse und entwickelst unsere Betriebsabläufe kontinuierlich weiter. Dabei bringst du deine DevOps-Erfahrung ein und unterstützt das Team bei Platt-form- und Betriebsfragen insbesondere mit AWS Cloud Services.
- Monitoring & Incident Handling: Mit unserem Monitoring- und Alerting-Setup (u.a. Prometheus Stack) behältst du unsere Systeme im Blick, analysierst Auffälligkeiten und unterstützt das Team bei der schnellen Behebung von Incidents.
- Zusammenarbeit im Betrieb: Du arbeitest eng mit dem Plattform-Team, Providern und weiteren Schnittstellen zusammen, koordinierst Betriebsaktivitäten und begleitest Releases unserer Anwendungen.
- 24/7-Betrieb sicherstellen: Gemeinsam mit deinem Team übernimmst du im Wechsel einmal pro Monat eine Woche eine bezahlte Rufbereitschaft (remote), um den stabilen Betrieb unserer Produktionssysteme rund um die Uhr sicherzustellen.