Articles

Einfache Anleitung für Ensemble-Lernmethoden

Was, warum, wie und Bagging-Boosting entmystifiziert, eher unkonventionell erklärt, lesen Sie weiter:)

Vor diesem Beitrag habe ich einen „Holy grail for Bias variance trade-off, Overfitting and Underfitting“ veröffentlicht. Dieser umfassende Artikel dient als wichtiges Prequel zu diesem Beitrag, wenn Sie ein Neuling sind oder einfach nur die Konzepte von Bias und Varianz auffrischen möchten, bevor Sie mit voller Kraft in das Meer der Ensemble-Modellierung eintauchen. Alle anderen im Publikum können leicht weitermachen, um mehr über Ensemblemodellierung aus meiner Feder zu erfahren. Ich werde auf einige Beispiele aus der Praxis zurückgreifen, um die Konzepte von was, Warum und Wie der Ensemblemodelle mit Schwerpunkt auf Absackungs- und Boosting-Techniken zu vereinfachen.

Szenario 1: Sie benötigen einen neuen Kopfhörer. Ist es wahrscheinlich, dass Sie einfach in ein Geschäft gehen und die Kopfhörer kaufen, die Ihnen die Verkäufer zeigen? In der heutigen Zeit bin ich sicher, dass die Antwort NEIN ist, weil wir uns stark auf unsere „Forschung“ verlassen, bevor wir heutzutage etwas kaufen. Sie würden ein paar Web-Technologie-Portale durchsuchen und die Benutzerbewertungen überprüfen und dann verschiedene Modelle vergleichen, die Sie interessieren, während Sie nach ihren Funktionen und Preisen suchen. Sie werden wahrscheinlich auch Ihre Freunde und Kollegen nach ihrer Meinung fragen. Kurz gesagt, Sie würden nicht direkt zu einer Schlussfolgerung gelangen, sondern nach gründlicher Recherche eine fundierte Entscheidung treffen.

Nun können Sie einen Blick auf die technische Definition von Ensemble-Lernmethoden werfen.

Ensemble-Modelle im maschinellen Lernen kombinieren die Entscheidungen mehrerer Modelle, um die Gesamtleistung. Sie arbeiten nach der gleichen Idee wie beim Kauf von Kopfhörern.

Die Hauptursachen für Fehler in Lernmodellen sind Rauschen, Bias und Varianz.

Ensemble-Methoden helfen, diese Faktoren zu minimieren. Diese Methoden sollen die Stabilität und Genauigkeit von Algorithmen für maschinelles Lernen verbessern.Szenario 2: Nehmen wir an, Sie haben eine Gesundheits- und Fitness-App entwickelt. Bevor Sie es veröffentlichen, möchten Sie kritisches Feedback erhalten, um die potenziellen Lücken zu schließen, falls vorhanden. Sie können auf eine der folgenden Methoden zurückgreifen, lesen und entscheiden, welche Methode die beste ist:

  1. Sie können die Meinung Ihres Ehepartners oder Ihrer engsten Freunde einholen.
  2. Sie können ein paar Ihrer Freunde und Bürokollegen fragen.
  3. Sie können eine Beta-Version der App starten und Feedback von der Webentwicklungs-Community und nicht voreingenommenen Benutzern erhalten.

Keine Brownie-Punkte zum Erraten der Antwort 😀 Ja, natürlich werden wir mit der dritten Option rollen.

Machen Sie jetzt eine Pause und denken Sie darüber nach, was Sie gerade getan haben. Sie haben mehrere Meinungen von einer ausreichend großen Gruppe von Menschen aufgenommen und dann eine fundierte Entscheidung getroffen. Dies ist, was Ensemble-Methoden auch tun.

Ensemble-Modelle im maschinellen Lernen kombinieren die Entscheidungen mehrerer Modelle, um die Gesamtleistung zu verbessern.

Szenario 3: Schauen Sie sich das folgende Bild an; Wir können eine Gruppe von Kindern mit verbundenen Augen sehen, die das Spiel „Berühren und erzählen“ spielen, während sie einen Elefanten untersuchen, den keiner von ihnen jemals zuvor gesehen hatte. Jeder von ihnen wird eine andere Version haben, wie ein Elefant aussieht, weil jeder von ihnen einem anderen Teil des Elefanten ausgesetzt ist. Wenn wir ihnen nun die Aufgabe geben, einen Bericht über die Beschreibung von Elefanten einzureichen, können ihre individuellen Berichte nur einen Teil ihrer Erfahrung genau beschreiben, aber gemeinsam können sie ihre Beobachtungen kombinieren, um einen sehr genauen Bericht über die Beschreibung eines Elefanten zu erhalten.In ähnlicher Weise verwenden Ensemble-Lernmethoden eine Gruppe von Modellen, bei denen das kombinierte Ergebnis in Bezug auf die Vorhersagegenauigkeit im Vergleich zur Verwendung eines einzelnen Modells fast immer besser ist.

Ensembles sind ein Divide and Conquer-Ansatz zur Verbesserung der Leistung.