Das Webinar von Heise
Machine Learning in Production
Die Herausforderungen in Produktivumgebungen meistern
7. Dezember 2021, 9-13 Uhr
MEHR INFOSMachine-Learning-Modelle in
die Produktion bringen
Die Entwicklung von Machine-Learning-Modellen ist eine spannende und herausfordernde Aufgabe. Doch nach der Modellentwicklung kommt der nächste komplexe Schritt: Das Ganze soll in Produktion gehen. In diesem Webinar lernen Sie mit Matthias Niehoff, wie Sie den Weg Ihrer Modelle in die Produktion meistern können.
Gemeinsam diskutieren Sie verschiedene Herausforderungen wie die Versionierung und das Re-Training der Modelle und erarbeiten mit Werkzeugen wie dvc, mlflow und Airflow mögliche Lösungsansätze.
DAS LERNEN SIE
Teil 1: Einführung
Erfolgreiche Daten-Projekte benötigen zum Gelingen neben weiteren Faktoren auch Engineering-Know-how. Diese Erkenntnis reift inzwischen in vielen (deutschen) Unternehmen. Aber was sind die Herausforderungen die begegnet werden müssen? Wie viel Engineering-Wissen ist nötig? Können es nicht auch die Data-Scientists machen?
In der Einführung des Webinars gibt es einen Überblick über die Thematik bevor wir dann in den nächsten drei Teilen tiefer in mögliche Lösungsansätze einsteigen.
Teil 2: Daten- und Experimentmanagement
Die Entwicklung von ML-Modellen ist eine herausfordernde Aufgabe. Verschiedene Datenstände werden als Grundlage genommen, die Architektur und Art der Modelle variiert und Hyperparameter getunt. Hier verliert man schnell den Überblick über bisherige Experimente.
Also fängt man an, Dateinamen für die Versionierung zu benutzen oder Excel-Tabellen zu pflegen. Moment: Hier geht es um Versionierung, nicht nur von Code, sondern auch von Daten, Parametern und binären Dateien.
Hier kommt DVC ins Spiel, ein Tool, das auf Basis des Industriestandards Git Versionierung für ML Use Cases bietet. Außerdem schauen wir uns mlflow an, eine Bibliothek, dessen Fokus vor allem auf der Versionierung der Modelle liegt und es zudem bei Deployment der Modelle unterstützt.
Teil 3: Workflow-Orchestrierung
Nach der Modellentwicklung kommt dann der nächste Schritt: Das Ganze soll in Produktion gehen. Neben dem Deployment gibt hier noch eine weitere Herausforderung: Das Modell wird nicht einmal deployt und anschließend nicht mehr verändert. Ganz im Gegenteil: Re-Trainings sind ein Muss, um eine schlechte Modellperformance zu verhindern. Das Training ist allerdings nicht der einzige Task in diesen Prozess: (Neue) Daten müssen geladen und aufbereitet werden, Daten- und Modellqualität muss geprüft werden und gegebenenfalls werden auch Vorhersagen neu generiert. Um bei diesen Aufgaben den Überblick zu behalten, hilft Apache Airflow, ein Tool, um komplexe Machine-Learning-Abläufe zu modellieren und auszuführen.
Teil 4: Ein vollständiger ML-Deployment-Prozess
Nachdem Daten und Modell verwaltet werden und wir Komponenten zur Orchestrierung kennen, stellt sich die Frage: Wie fügen wir das alles zusammen? Wie bekommen wir nun das Modell tatsächlich in Produktion, betreiben es dort und können es auch automatisiert austauschen?
Auch eine Abgrenzung zwischen Airflow zur Orchestrierung von Workflows und klassischen CI/CD Prozessen wird hier nochmal deutlich gemacht. Am Ende gibt es ein klares Bild, was "ML in Produktion" bedeutet und mit welchen Werkzeugen man einen vollständigen Data-Science-Lebenszyklus abbilden kann.
Teil 5: Fragen und Antworten
Fragen und Antworten, die im Laufe des Webinars offen geblieben sind. Gerne auch Fragen zur Einordnung weiterer Werkzeuge oder Methoden im Vergleich zu den im Webinar genannten Ansätzen.
Notwendige Vorkenntnisse
- Python-Kenntnisse sind hilfreich, aber nicht unbedingt notwendig. Der Fokus liegt auf Nutzung und Nutzungsmöglichkeiten der Tools, weniger auf Programmierung
- Docker in aktueller Version, optimalerweise mit Admin-Rechten auf dem Rechner. Docker-Images für den Workshop sowie eine Anleitung zur (kurzen) Einrichtung werden rechtzeitig vor dem Workshop bereitgestellt. Die Einrichtung sollte vor dem Workshop durchgeführt werden.
IHR EXPERTE
Matthias Niehoff
Matthias Niehoff ist als Data Architect sowie Head of Data & AI für codecentric unterwegs und unterstützt Kunden bei Design und Umsetzung von Datenarchitekturen. Dabei liegt sein Fokus weniger auf dem Modell, sondern viel mehr auf der notwendigen Infrastruktur und Organisation, um Daten- und KI-Projekten zum Erfolg zu verhelfen.
TICKET BUCHEN
- Das umfassende Webinar zu Machine Learning in Production
- Vier praxisnahe Stunden mit einem langjährigen Experten
- Teilnahme über das Internet – vom eigenen Schreibtisch aus
- Stellen Sie dem Experten Fragen über den Online-Chat
- Tauschen Sie sich mit anderen Teilnehmern aus
- Nachträglicher Zugang zu den Videos und Materialien
Einzelpreis: 139 €*
TICKET BUCHENKOMBI-TICKET
429 €*
Buchen Sie gleich Ihr Ticket für alle fünf Machine-Learning-Webinare und sparen Sie über 250 € im Vergleich zum Einzelkauf!
*Alle Preise verstehen sich inkl. gesetzl. MwSt (kann je nach Bestimmungsland im Bestellverlauf variieren).