Zum Hauptinhalt

Das Webinar von Heise

Natural Language Processing mit Python

spaCy und Huggingface-Transformers im Einsatz

31. März 2021, 9-13 Uhr

MEHR INFOS

NLP-Projekte aufsetzen und umsetzen

Der Ausgangspunkt für Natural Language Processing ist roher Text, der aus den unterschiedlichsten Quellen stammen kann. Doch wie können Sie dafür sorgen, dass ein Computer ihn auch algorithmisch verarbeiten kann?

In diesem Webinar erklärt Ihnen Thomas Timmermann die Grundlagen von Natural Language Processing praxisnah. Er zeigt Ihnen, wie sie die Werkzeuge spaCy und Huggingface Transformers einsetzen können, um Ihre NLP-Projekte in die Realität umzusetzen und bringt Ihnen die Best Practices für zeitgemäße Textverarbeitung Schritt für Schritt bei.

DAS LERNEN SIE

  • Teil 1: Text-Klassifikation mit Faltungsnetzen (CNN)

    Wir starten in das Thema NLP mit dem Problem, Texte in vorgegebene Kategorien zu klassifizieren, und schaffen in Theorie und Praxis eine gemeinsame Ausgangsbasis für den Tag. Dabei behandeln wir folgende Themen:

    • Wie füttert man ein neuronales Netz mit Text?
    • Wie werden aus Wörtern Vektoren (Stichwort Word Bmbeddings)?
    • Wie arbeiten Faltungsnetze (CNN) und rekurrente Netze (RNN)?
    • Wie bauen wir ein Netz mit Keras?
    • Praxis-Teil: Text-Klassifikation mit Keras (Vorverarbeitung, Training, Auswertung und Tuning)
  • Teil 2: Extraktion von Informationen aus Text mit spaCy

    Im zweiten Schritt katapultieren wir uns von den Grundlagen zum State-of-the-Art mit der NLP-Bibliothek spaCy. Diese ermöglicht die Lösung vielfältiger NLP-Probleme in zahlreichen Sprachen mit neuesten Modelle, und dass oft ganz einfach mit wenigen Kommandozeilen-Befehlen.

    Nach einem kurzen Streifzug durch spaCy wagen wir uns an die Extraktion von Informationen aus Text mit Named Entity Recognition (NER). Mit nur vier Befehlen auf Kommandozeile trainieren wir ein spaCy-Modell darauf, in juristischen Texten alle Verweise auf Literatur, Gesetze und Urteile zu erkennen.

  • Teil 3: State-of-the-Art NLP mit Huggingface Transformers

    Zum krönenden Abschluss des Webinars behandeln wir die wichtigsten Ideen von State-of-the-Art-NLP und lernen, wie man mit der Bibliothek Huggingface-Transformers die neuesten Transformer-Modelle auf eigene NLP-Aufgaben „abrichten“ kann:

    • Was sind Transformer (GPT-2, BERT, GPT-3)?
    • Was sind Sprachmodelle (language models) und wie revolutionierten Transformer-Sprachmodelle NLP?
    • Wie verhindert man out-of-vocabulary-Probleme mit subword-Tokenisierung?
    • Praxis-Teil: NER mit huggingface transformers und einem feinjustierten BERT-Transformer
  • Teil 4: Fragen und Antworten

    Im letzten Teil sammeln wir Fragen, die im Verlauf des Webinars aufgetreten sind und versuchen diese möglichst gleich zu beantworten. Auch eigene Projektideen sind sehr willkommen und können dann gleich diskutiert werden.

IHR EXPERTE

  • Thomas Timmermann

    Thomas Timmermann

    Data Scientist, codecentric

    Thomas arbeitet als Data Scientist für codecentric. Er hat in Mathematik promoviert, Erfahrung in der Forschung und Weiterbildung gesammelt und verstärkt seit Oktober 2018 das Unternehmen im Bereich Data Science/Machine Learning. Besonders interessieren ihn alle Themen rund um KI und Deep Learning.

TICKET BUCHEN

  • Das umfassende Webinar zu Machine Learning mit Python
  • Vier praxisnahe Stunden mit einem renommierten Experten
  • Teilnahme über das Internet – vom eigenen Schreibtisch aus
  • Stellen Sie dem Experten Fragen über den Online-Chat
  • Tauschen Sie sich mit anderen Teilnehmern aus
  • Nachträglicher Zugang zu den Videos und Materialien

Einzelpreis: 139 €*

TICKET BUCHEN

KOMBI-TICKET

429 €*

Buchen Sie gleich Ihr Ticket für alle fünf Machine-Learning-Webinare und sparen Sie über 250 € im Vergleich zum Einzelkauf!

RABATT SICHERN

*Alle Preise verstehen sich inkl. gesetzl. MwSt (kann je nach Bestimmungsland im Bestellverlauf variieren).