Como una persona que a menudo explica el aprendizaje automático a los no profesionales, he recopilado los siguientes diez puntos como algunas explicaciones sobre el aprendizaje automático:
El aprendizaje automático no es lo que se promueve de manera tan extravagante: con el suministro de datos de entrenamiento adecuados a los algoritmos de aprendizaje adecuados, puede resolver un sinnúmero de problemas. Llámelo IA si eso ayuda a vender tu sistema de IA. Pero debes saber que la IA es solo una palabra de moda, que solo representa las expectativas de la gente sobre ella.
Los avances en los algoritmos de aprendizaje automático, especialmente en el aprendizaje profundo, tienen muchas cosas emocionantes. Pero los datos son el factor clave que hace posible el aprendizaje automático. El aprendizaje automático puede hacerse sin algoritmos complejos, pero no sin buenos datos.
El aprendizaje automático entrena a los modelos en función de los patrones de los datos, explorando el espacio de los modelos posibles definidos por los parámetros. Si el espacio de los parámetros es demasiado grande, se adapta demasiado a los datos de entrenamiento y se entrena un modelo que no puede generalizarse a sí mismo. Si se trata de una explicación detallada, se requieren más cálculos matemáticos, y debe tomar esto como una regla para que su modelo sea lo más simple posible.
El refrán dice que si entras a una computadora con un montón de basura, la salida será una pila de datos de basura, aunque esta frase es anterior a la aparición del aprendizaje automático, pero esta es la limitación clave de la existencia del aprendizaje automático. El aprendizaje automático solo puede encontrar patrones que existen en los datos de entrenamiento.
Como advierte el prospecto del fondo, el rendimiento pasado no garantiza los resultados futuros. El aprendizaje automático debería emitir una declaración de advertencia similar: solo puede trabajar con datos distribuidos de la misma manera que los datos de entrenamiento. Por lo tanto, debe estar atento a la desviación entre los datos de entrenamiento y los datos de producción, y repetir el modelo de entrenamiento con frecuencia para garantizar que no se vuelva obsoleto.
Con toda la publicidad de la tecnología de aprendizaje automático, es posible que pienses que lo que hace la máquina es seleccionar y ajustar algoritmos. Pero la realidad no es tan extraña: la mayor parte de tu tiempo y energía se gastará en la limpieza de datos y en la ingeniería de características, es decir, en la conversión de las características originales en características que representan mejor las señales de los datos.
Debido a que el aprendizaje en profundidad se ha aplicado y desarrollado en muchos campos, también se ha promocionado. Además, el aprendizaje profundo ha impulsado la automatización de algunos trabajos tradicionalmente realizados a través de la ingeniería de características, especialmente con datos de imágenes y videos. Pero el aprendizaje profundo no es una panacea.
Disculpas a la NRA, los algoritmos de aprendizaje automático no matan, los humanos matan. Cuando un sistema de aprendizaje automático falla, es muy raro que haya un problema con el algoritmo de aprendizaje automático. Lo más probable es que se introduzcan errores artificiales en los datos de entrenamiento, lo que genera desviaciones u otros errores del sistema.
En muchas aplicaciones de aprendizaje automático, las decisiones que tomes hoy afectan a los datos de entrenamiento que se recopilarán mañana. Una vez que el sistema de aprendizaje automático integra la desviación en el modelo, puede continuar generando nuevos datos de entrenamiento potenciados por la desviación. Además, algunas desviaciones pueden arruinar la vida de las personas.
Muchas personas parecen haber sacado la idea de la inteligencia artificial de las películas de ciencia ficción. Deberíamos inspirarnos en la ciencia ficción, pero no podemos ser tan tontos y confundir la ficción con la realidad. Desde los humanos malvados conscientes hasta los modelos de aprendizaje de máquinas con desviaciones inconscientes, hay demasiada realidad y peligros de los que preocuparse.
El aprendizaje automático implica mucho más que las diez instrucciones que mencioné anteriormente. Espero que estas instrucciones sean útiles para los no profesionales.
La inteligencia artificial global, el espacio de los grandes datos