Überwachtes und unüberwachtes Lernen
Maschinelles Lernen – das Herzstück moderner KI – basiert auf verschiedenen Lernmethoden. Die beiden wichtigsten Ansätze sind das überwachte (supervised) und das unüberwachte (unsupervised) Lernen. Sie unterscheiden sich grundlegend darin, wie mit Daten gearbeitet wird – insbesondere im Hinblick auf die Verfügbarkeit von Zielinformationen.
Definition:
Überwachtes Lernen (Supervised Learning) bezeichnet Verfahren, bei denen das Modell mit Eingabedaten und den dazugehörigen erwarteten Ausgaben (Labels) trainiert wird. Ziel ist es, eine Funktion zu erlernen, die neue, unbekannte Eingaben korrekt klassifiziert oder vorhersagt.
Unüberwachtes Lernen (Unsupervised Learning) nutzt hingegen nur Eingabedaten ohne zugehörige Labels. Das Modell versucht, selbstständig Strukturen, Muster oder Gruppierungen innerhalb der Daten zu erkennen, z. B. durch Clustering oder Dimensionsreduktion.
Erklärung:
Beim überwachten Lernen gibt man dem Algorithmus Beispiele mit klarer Aufgabenstellung – etwa: „Das ist ein Bild einer Katze“ (Label = „Katze“). Das System lernt, neue Bilder richtig einzuordnen. Typische Anwendungen: Klassifikation (Spam/Nicht-Spam), Vorhersage (z. B. Umsatzentwicklung), Objekterkennung.
Beim unüberwachten Lernen hingegen kennt das System keine Zielwerte. Es „sieht“ z. B. tausende Kundendaten und erkennt eigenständig Gruppen mit ähnlichem Verhalten – ohne zu wissen, was diese Gruppen bedeuten. Typische Anwendungen: Kundensegmentierung, Mustererkennung, Anomalie-Erkennung.
Praxisbeispiele:
Überwachtes Lernen:
Amazon prognostiziert mit Hilfe überwachten Lernens, welche Produkte ein Kunde als Nächstes kaufen könnte.
Finanzunternehmen nutzen überwachte Modelle zur Bonitätsprüfung (z. B. Vorhersage von Kreditausfall).
Medizinische Bildanalyse: KI-Systeme lernen, Tumoren in MRT-Bildern zu erkennen, indem sie mit annotierten Bilddaten trainiert wurden.
Unüberwachtes Lernen:
Netflix oder Spotify analysieren unüberwacht Hör- und Sehverhalten, um Nutzer:innen in Verhaltenscluster einzuteilen.
Cybersicherheitsunternehmen verwenden unüberwachtes Lernen zur Erkennung ungewöhnlicher Muster im Netzwerkverkehr (potenzielle Angriffe).
Marketingteams nutzen Clusteranalysen zur Bildung von Zielgruppensegmenten.
Für wen relevant?
Grundkenntnisse über diese Lernmethoden sind für Data Scientists, KI-Entwickler:innen, Analyst:innen und alle, die mit datengetriebenen Prozessen arbeiten, essenziell. Auch für Entscheidungsträger:innen wichtig, um KI-Systeme besser einschätzen und verantwortungsvoll einsetzen zu können.