Schulungsübersicht

Einführung in multimodales Lernen

  • Überblick über multimodale KI
  • Herausforderungen bei der multimodalen Datenverarbeitung
  • Vorteile von multimodalen LLMs

Verständnis von großen Sprachmodellen

  • Architektur von modernen LLMs
  • Training von LLMs mit multimodalen Daten
  • Fallstudien: Erfolgreiche multimodale LLM-Anwendungen

Verarbeitung multimodaler Daten

  • Datenvorverarbeitungstechniken für Text, Bild und Audio
  • Merkmalsextraktion und Repräsentationslernen
  • Integration von multimodalen Daten in LLMs

Entwicklung von multimodalen LLM-Anwendungen

  • Entwurf von Benutzerschnittstellen für multimodale Interaktion
  • LLMs in virtuellen Assistenten und Chatbots
  • Schaffung immersiver Erfahrungen mit LLMs

Evaluierung und Optimierung multimodaler Systeme

  • Leistungsmetriken für multimodale LLMs
  • Optimierungsstrategien für bessere Genauigkeit und Effizienz
  • Umgang mit Verzerrungen und Fairness in multimodalen Systemen

Praktisches Labor: Aufbau eines multimodalen LLM-Projekts

  • Einrichten eines multimodalen Datensatzes
  • Implementierung eines multimodalen LLMs für einen spezifischen Anwendungsfall
  • Testen und Verfeinern des Systems

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Verständnis von maschinellem Lernen und neuronalen Netzen
  • Erfahrung mit Python-Programmierung
  • Vertrautheit mit der Datenvorverarbeitung für verschiedene Datentypen (Text, Bild, Audio)

Zielgruppe

  • Datenwissenschaftler
  • Ingenieure für maschinelles Lernen
  • Software-Entwickler
  • Forscher, die sich mit KI und der Verarbeitung natürlicher Sprache beschäftigen
 14 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Kommende Kurse

Verwandte Kategorien