Articles

Guía sencilla para métodos de aprendizaje en conjunto

Qué, por qué, cómo y cómo, desmitificado, explicado de forma poco convencional, siga leyendo:)

Antes de este post, he publicado un «Santo grial para el equilibrio de varianza de Sesgo, Sobreajuste y Subajuste». Este artículo completo sirve como una precuela importante para este artículo si es un novato o simplemente desea repasar los conceptos de sesgo y varianza antes de sumergirse con toda su fuerza en el mar del modelado de conjuntos. Todos los demás en el público pueden pasar fácilmente a saber más sobre el modelado de conjuntos de mi pluma. Recurriré a citar algunos ejemplos de la vida real para simplificar los conceptos de qué, por qué y cómo de los modelos de ensamble con enfoque en las técnicas de embolsado y refuerzo.

el Escenario 1: Necesitas un par de auriculares nuevos. Ahora, ¿es probable que entres en una tienda y compres los auriculares que te muestran los vendedores? En la coyuntura de hoy en día, estoy seguro de que la respuesta es NO porque dependemos en gran medida de nuestra «investigación» antes de comprar nada hoy en día. Navegaría por algunos portales de tecnología web y revisaría las reseñas de los usuarios y luego compararía los diferentes modelos que le interesan mientras verificaba sus características y precios. También es probable que pida su opinión a sus amigos y colegas. En resumen, no llegarías directamente a una conclusión, sino que tomarás una decisión informada después de investigar a fondo tu camino.

Ahora, puede echar un vistazo a la definición técnica de los métodos de aprendizaje en conjunto.

Conjunto de modelos en el aprendizaje de máquina combinar las decisiones de múltiples modelos para mejorar el rendimiento en general. Operan con la idea similar a la empleada al comprar auriculares.

Las principales causas de error en los modelos de aprendizaje se deben al ruido, el sesgo y la varianza.

Los métodos de ensamble ayudan a minimizar estos factores. Estos métodos están diseñados para mejorar la estabilidad y la precisión de los algoritmos de aprendizaje automático.

Escenario 2: Supongamos que ha desarrollado una aplicación de salud y fitness. Antes de hacerlo público, desea recibir comentarios críticos para cerrar las posibles lagunas, si las hay. Puede recurrir a uno de los siguientes métodos, leer y decidir qué método es el mejor:

  1. Puede tomar la opinión de su cónyuge o de sus amigos más cercanos.
  2. Puedes preguntarle a un grupo de amigos y colegas de oficina.
  3. Puede lanzar una versión beta de la aplicación y recibir comentarios de la comunidad de desarrollo web y usuarios no sesgados.

No hay puntos para adivinar la respuesta: D Sí, por supuesto, optaremos por la tercera opción.

Ahora, haz una pausa y piensa en lo que acabas de hacer. Tomaste múltiples opiniones de un grupo suficientemente grande de personas y luego tomaste una decisión informada basada en ellas. Esto es lo que también hacen los métodos de ensamble.

Los modelos conjuntos en aprendizaje automático combinan las decisiones de varios modelos para mejorar el rendimiento general.

Escenario 3: Eche un vistazo a la siguiente imagen; podemos ver a un grupo de niños con los ojos vendados jugando el juego de «Tocar y contar» mientras examinan un elefante que ninguno de ellos había visto antes. Cada uno de ellos tendrá una versión diferente de cómo se ve un elefante porque cada uno de ellos está expuesto a una parte diferente del elefante. Ahora, si les asignamos la tarea de presentar un informe sobre la descripción de un elefante, sus informes individuales solo podrán describir una parte con precisión según su experiencia, pero colectivamente pueden combinar sus observaciones para dar un informe muy preciso sobre la descripción de un elefante.

De manera similar, los métodos de aprendizaje conjuntos emplean un grupo de modelos donde el resultado combinado de ellos es casi siempre mejor en términos de precisión de predicción en comparación con el uso de un solo modelo.

Los conjuntos son un enfoque de divide y vencerás utilizado para mejorar el rendimiento.