Articles

Jednoduchý průvodce pro ensemble metody učení

Co, proč, jak a Pytlování-Posílení mýtů zbavená, vysvětlil poněkud netradičně, čtěte dál:)

dříve, Než tento příspěvek, který jsem publikoval jako „Svatý grál pro Bias variance trade-off, Overfitting a Underfitting“. Tento komplexní článek slouží jako důležitý prequel k tomuto příspěvku, pokud jste nováček, nebo bych jen oprášit pojmy bias a rozptyl, než potápění s plnou silou v moři Ensemble modelování. Všichni ostatní v publiku se mohou snadno dozvědět více o modelování souborů z mého pera. Uchýlím se k citování některých příkladů skutečného života, abych zjednodušil koncepty toho, co, proč a jak modelů souborů se zaměřením na techniky pytlování a posilování.

Scénář 1: Potřebujete nový pár sluchátek. Nyní, je pravděpodobné, že budete jen chodit do obchodu a koupit sluchátka, která vám prodejci ukazují? V okamžiku dnešní doby jsem si jist, že odpověď zní ne, protože se v dnešní době silně spoléháme na náš „výzkum“, než si něco koupíme. Ty by procházet několik webových technologií portály a podívejte se na uživatelské recenze a pak porovnat různé modely, které vás zajímají při kontrole jejich vlastnosti a ceny. Pravděpodobně také požádáte své přátele a kolegy o jejich názor. Ve zkratce, nebudete přímo dosáhnout závěru, ale místo toho učiní informované rozhodnutí po důkladném prozkoumání vaší cesty.

nyní se můžete podívat na technickou definici metod učení souborů.

Ensemble modely ve strojovém učení kombinovat rozhodnutí z více modelů s cílem zlepšit celkový výkon. Pracují na podobném nápadu jako při nákupu sluchátek.

hlavní příčiny chyb v učebních modelech jsou způsobeny šumem, zaujatostí a rozptylem.

Ensemble metody pomáhají minimalizovat tyto faktory. Tyto metody jsou navrženy tak, aby zlepšily stabilitu a přesnost algoritmů strojového učení.

scénář 2: Předpokládejme, že jste vyvinuli aplikaci pro zdraví a fitness. Před zveřejněním, chcete získat kritickou zpětnou vazbu, abyste odstranili potenciální mezery, pokud existují. Můžete se uchýlit k jedné z následujících metod, přečíst si a rozhodnout, která metoda je nejlepší:

  1. můžete si vzít názor svého manžela nebo nejbližších přátel.
  2. můžete požádat spoustu svých přátel a kolegů v kanceláři.
  3. můžete spustit beta verzi aplikace a získat zpětnou vazbu od komunity pro vývoj webu a neobjektivních uživatelů.

žádné brownie body pro hádání odpovědi: D Ano, samozřejmě se hodíme s třetí možností.

nyní pozastavte a přemýšlejte, co jste právě udělali. Vzali jste několik názorů od dostatečně velké skupiny lidí a poté jste na jejich základě učinili informované rozhodnutí. To také dělají metody souboru.

Ensemble modely ve strojovém učení kombinují rozhodnutí z více modelů za účelem zlepšení celkového výkonu.

Scénář 3: podívejte se na následující obrázek, můžeme vidět skupinu se zavázanýma očima děti hrát hru „Dotkni se a řekni“ při zkoumání slona, který nikdo z nich nikdy předtím neviděl. Každý z nich bude mít jinou verzi, jak vypadá slon, protože každý z nich je vystaven jiné části slona. Teď, když jsme se dát jim úkol předložit zprávu o slona, popis, jejich jednotlivé zprávy budou schopni popsat pouze jeden díl přesně dle svých zkušeností, ale společně mohou kombinovat své připomínky dát velmi přesnou zprávu o popisu slona.

Podobně, ensemble metody učení zaměstnat skupinu modelů, kde kombinované výsledek z nich je téměř vždy lepší, pokud jde o přesnost predikce ve srovnání s použitím jednoho modelu.

soubory jsou přístup rozděl a panuj používaný ke zlepšení výkonu.