¿Qué es el aprendizaje automático?
El aprendizaje automático es un subconjunto de Inteligencia artificial (AI) que se centra en la creación y evolución de sistemas, que tienen la capacidad de aprovechar los datos y patrones históricos, para tomar decisiones lógicas y realizar predicciones precisas con una participación humana mínima o nula.
En la década de 1950, el pionero de la AI Arthur Samuel definió el aprendizaje automático como "el campo de estudio que le da a las computadoras la capacidad de aprender sin ser programadas explícitamente".
Los algoritmos de aprendizaje automático, que se rigen e impulsan por modelos de aprendizaje automático, están diseñados para mejorar de forma adaptativa a medida que aumenta el volumen de datos (es decir, muestras). Sin embargo, la existencia de un sesgo subyacente de aprendizaje automático (también conocido como sesgo de AI) ha llevado a predicciones erróneas, que a su vez han respaldado decisiones defectuosas y dañinas.
Utilizado actualmente por dos tercios de todas las empresas para recomendar productos y servicios, Los expertos dicen que el aprendizaje automático ya ha cambiado, o pronto cambiará, todas las industrias del mundo a medida que la tecnología continúe avanzando.
Aprendizaje automático vs. AI
Mientras que la AI permite que las máquinas o los sistemas piensen como un cerebro humano mediante el uso de datos para razonar, actuar, adaptarse y llegar a conclusiones, el aprendizaje automático es una aplicación de la AI que permite a las máquinas o sistemas convertir los datos sin procesar en inteligencia empresarial (conocimiento) y aprender de ellos de forma autónoma. El aprendizaje automático entrena a la AI para saber qué hacer.
Esencialmente, el aprendizaje automático es el motor que permite que un sistema desarrolle su inteligencia. El aprendizaje automático no es AI, sino más bien un camino hacia la AI.
Aprendizaje automático vs. aprendizaje profundo
El aprendizaje profundo es un subconjunto (o forma especializada) del aprendizaje automático. Utiliza capas de algoritmos para construir redes neuronales artificiales capaces de aprender y tomar decisiones de forma autónoma.
Si el sistema comienza a generar predicciones cuestionables o inexactas, entonces un científico de datos debe involucrarse y hacer ajustes. Sin embargo, el algoritmo en un modelo de aprendizaje profundo tiene la capacidad de determinar, por sí solo, si las predicciones son inexactas y puede hacer correcciones sin intervención humana.
Aprendizaje automático vs. procesamiento del lenguaje natural
Otro campo del aprendizaje automático es el procesamiento del lenguaje natural, que se enfoca en permitir que las máquinas y los sistemas reconozcan, comprendan y respondan correctamente a cómo escriben y hablan los seres humanos, que en el mundo de la tecnología es mucho más diverso y dinámico que confiar en los números y datos que utilizan convencionalmente los programadores.
Los chatbots como Siri de Apple y Alexa de Amazon son ejemplos de aprendizaje automático que aprovechan el procesamiento del lenguaje natural para comprender lo que dice la gente, así como para crear texto nuevo y realizar traducciones de idiomas.
¿Cómo funciona el aprendizaje automático?
Hasta ahora, hemos analizado una definición básica de aprendizaje automático y hemos destacado algunas diferencias clave entre el aprendizaje automático y las tecnologías y técnicas estrechamente asociadas. Con esta base en su lugar, podemos centrar nuestra atención en Cómo funciona el aprendizaje automático.
Generalmente, hay Seis pasos básicos para crear un modelo de aprendizaje automático para entrenar AI:
- Analice y aclare el problema comercial y defina cómo se ve el éxito.
Es de vital importancia asegurarse de que los objetivos del modelo se dirijan a los requisitos comerciales, y no solo a los requisitos de aprendizaje automático (por ejemplo, precisión, exactitud, etc.). El propósito fundamental del modelo es resolver objetivos comerciales significativos, prácticos y relevantes, ya sea que eso signifique Mejorar las experiencias de viaje, haciéndolo Más fácil y rápido para que las personas encuentren trabajoo habilitando Automatización de procesos de negocio a escala.
- Identifique los requisitos de datos y determine si hay suficientes datos disponibles para crear el modelo de aprendizaje automático.
El acrónimo GIGO ("basura entra, basura sale") se aplica aquí. Sin acceso a un volumen suficiente de datos buenos, el modelo de aprendizaje automático será inherentemente incapaz de generar predicciones precisas y confiables. Garantizar tanto la cantidad como la calidad de los datos permite que el modelo cumpla su propósito de entrenar AI.
- Recopilar y preparar datos
A continuación, hay una variedad de actividades de preparación de datos estructuradas (por ejemplo, números de ingresos), no estructuradas (por ejemplo, encuestas a clientes) y semiestructuradas (por ejemplo, correos electrónicos) para cubrir, como recopilación, limpieza, agregación, aumento, etiquetado, normalización y transformación.
Es necesario invertir tiempo, esfuerzo y recursos de calidad aquí. De hecho, muchos modelos de aprendizaje automático elegantes e impresionantes se ven socavados por brechas en el proceso de preparación de datos.
- Entrenamiento del modelo
Los datos de entrenamiento son el conjunto de datos utilizado para entrenar el modelo de aprendizaje automático y esto le enseña al algoritmo cómo tomar decisiones.
- Evaluar y medir el rendimiento
Piense en este paso del proceso como un esfuerzo de control de calidad que incluye tareas como:- Evaluación de métricas del modelo: medidas cuantitativas para evaluar el rendimiento y la eficacia del modelo de aprendizaje automático.
- Cálculos de matrices de confusión: Técnica para resumir el rendimiento de un algoritmo de clasificación.
- Métricas de rendimiento del modelo: las relacionadas con las tareas de regresión (p. ej., error cuadrático medio, error cuadrático medio y R cuadrado), así como las relacionadas con las tareas de clasificación (p. ej., exactitud, precisión y recuperación, puntuación F1 y AU-R (MSE), error cuadrático medio (RMSE) y R² (R cuadrado). Por el contrario, las tareas de clasificación utilizan métricas como precisión, matriz de confusión, precisión y recuperación, puntuación F1 y curva AUC-ROC).
- Mediciones de calidad del modelo: Estas comparan qué tan bien el modelo de aprendizaje automático se generaliza a datos no vistos en la población objetivo.
- Operacionalizar e iterar el modelo
La puesta en marcha del modelo de aprendizaje automático puede ser un proceso relativamente simple (por ejemplo, generar un informe) o un esfuerzo más complejo (por ejemplo, la implementación de múltiples puntos finales). Sin embargo, incluso si el modelo está funcionando a toda máquina, no hay garantía, y no debería haber expectativas, de que permanecerá optimizado con el tiempo.
Tipos de técnicas algorítmicas
Hay cuatro tipos de técnicas de aprendizaje automático, que dan forma y gobiernan las funciones básicas del modelo, como la clasificación de información, el reconocimiento de patrones, la predicción de resultados y la toma de decisiones confiables.
Aprendizaje supervisado
El aprendizaje automático supervisado es un proceso de aprendizaje en el que los algoritmos aprenden continuamente de los datos etiquetados y, como tales, se vuelven más inteligentes y precisos con el tiempo. Las etiquetas pueden ser orgánicas (es decir, disponibles en los propios datos) o agregadas externamente. Los ejemplos de algoritmos de aprendizaje supervisado incluyen árboles de decisión, máquinas de vectores de soporte, bosques aleatorios y Naive Bayes.
Aprendizaje supervisado algorithms are found in applications such as image and speech recognition, recommendation systems, and fraud detection.
Con acceso a datos relevantes, el aprendizaje supervisado puede generar predicciones precisas y aplicables, que es el propósito principal del modelo de aprendizaje automático. Sin embargo, el aprendizaje supervisado requiere una gran cantidad de conocimiento del dominio y esfuerzo humano para etiquetar los datos.
Aprendizaje no supervisado
El aprendizaje automático no supervisado es un método de aprendizaje en el que el modelo analiza datos no etiquetados para encontrar patrones o tendencias ocultos y agrupa los puntos de datos en clústeres en función de similitudes o anomalías. Por ejemplo, algunos minoristas aprovechan el aprendizaje no supervisado para predecir cuándo es probable que ciertos tipos de clientes salgan del embudo de ventas. Se confía en esta información para ajustar y orientar campañas y mensajes de marketing.
La agrupación en clústeres K-means es el algoritmo de aprendizaje automático no supervisado más rápido para dividir los puntos de datos en grupos, incluso cuando hay muy poca información disponible.
Sin embargo, como el aprendizaje no supervisado es autónomo y no implica intervención humana, la falta de respuestas predefinidas durante el entrenamiento puede dificultar la medición de la precisión y la confiabilidad.
Aprendizaje semisupervisado
Entre el aprendizaje supervisado y el aprendizaje no supervisado se denomina acertadamente aprendizaje semisupervisado. Con este enfoque, el modelo se entrena inicialmente utilizando un pequeño número de muestras etiquetadas, que luego se aplican iterativamente a un mayor volumen de datos no etiquetados (este proceso se conoce como pseudoetiquetado). En última instancia, el modelo se entrena utilizando una combinación de datos etiquetados e iterativamente.
Uno de los principales beneficios del aprendizaje semisupervisado es que el tiempo y los costos necesarios para la preparación de datos son significativamente menores en comparación con el aprendizaje supervisado. Además, a diferencia del aprendizaje no supervisado, el aprendizaje semisupervisado puede aplicarse a una amplia gama de problemas (por ejemplo, clasificación, regresión, agrupación, asociación, etc.). Sin embargo, la principal desventaja es que el proceso de iteración es muy complejo y, por lo tanto, no es adecuado para problemas más elaborados.
Aprendizaje por refuerzo
Aprendizaje por refuerzo uses a trial-and-error approach to learn which actions and decisions are the most favorable over time. At the core of reinforcement learning is a reward system engine that tells the model when it has made a correct decision (and earned a reward) or made an incorrect decision (and is subjected to a penalty).
Aprendizaje por refuerzo can be extremely effective at solving complex problems. As the model learns from its mistakes and experiences, the reward and punishment engine reduces the likelihood of repeat errors. However, reinforcement learning requires a large volume of data, and maintenance costs can be high.
El aprendizaje por refuerzo excesivo también puede conducir a una sobrecarga de estados, lo que reduce la confiabilidad de los resultados. Los estados son observaciones que el agente (es decir, la entidad o programa independiente que percibe a través de sensores y actúa a través de actuadores o efectores) recibe del entorno.
Ejemplos de aplicaciones de aprendizaje automático
Se prevé que el mercado global de aprendizaje automático crezca a $ 225.91 mil millones para 2030 y ya está transformando y avanzando en varias industrias. Los siguientes son algunos ejemplos y aplicaciones del mundo real del aprendizaje automático.
- Finanzas: El aprendizaje automático se utiliza para detectar fraudes en tiempo real, automatizar las tareas comerciales y habilitar "robo-advisors" que brindan a los clientes asesoramiento financiero automatizado en función de los detalles únicos de su cartera y perfil de riesgo.
- Negocios: Las empresas utilizan el aprendizaje automático para diseñar chatbots y aplicaciones que impulsan la participación del cliente, aumentan las ventas y mejoran el servicio. Las organizaciones también utilizan el aprendizaje automático para tomar decisiones basadas en datos en áreas como el reclutamiento y la asignación de recursos.
- Seguro: El aprendizaje automático se está utilizando para optimizar los procesos de suscripción, acelerar la incorporación de clientes y reducir los costos operativos.
- Genética y genómica: El aprendizaje automático se está utilizando en el análisis de datos dentro de la investigación genética y genómica para comprender mejor varios rasgos genéticos, como los que contribuyen a trastornos como la hemofilia y la diabetes.
- Atención sanitaria: El aprendizaje automático se está utilizando para ayudar a los hospitales y las redes de salud a optimizar los procesos administrativos y los flujos de trabajo, mientras que el reconocimiento de imágenes permite a los patólogos realizar diagnósticos mejores y más rápidos.
- Venta al por menor: Los minoristas están utilizando el aprendizaje automático para identificar, organizar, analizar y aprovechar un inmenso volumen de datos de clientes estructurados, no estructurados y semiestructurados, desde comunicaciones orgánicas en redes sociales hasta historial de transacciones de compra, con el fin de mejorar las ventas, las ganancias, el reconocimiento de marca y compromiso del cliente.
- Educación: El aprendizaje automático se está utilizando para evaluar los niveles de habilidad de los estudiantes y desarrollar una experiencia de instrucción guiada y un plan de estudios que los ayude a ser más competentes.
- Entretenimiento: Los servicios de transmisión (por ejemplo, Netflix, Amazon Prime Video, Disney+, Hulu, etc.) utilizan el aprendizaje automático dentro de sus motores de recomendación para ofrecer a los suscriptores contenido relevante basado en opciones de visualización anteriores, así como contenido al que acceden otras personas que comparten ciertas preferencias o características.
- Vehículos autónomos: El aprendizaje automático se está utilizando en el desarrollo de robótica avanzada y automóviles autónomos. Los vehículos autónomos aprovechan la visión por computadora (un tipo de AI), el aprendizaje automático y los datos en tiempo real de los sensores para ayudar con la navegación y la toma de decisiones para garantizar la seguridad de los pasajeros.
Estos son solo una muestra de los casos de uso existentes para el aprendizaje automático. También hay muchos desarrollos emocionantes de aprendizaje automático en el horizonte, como el crecimiento de ecosistemas de datos en la nube, al potencial de uso Computación cuántica para optimizar algoritmos para big data.
La última palabra
Mientras el mundo está entusiasmado con la AI (y por muchas razones válidas), entre bastidores y lejos de los focos, el aprendizaje automático se utiliza todos los días en nuevas iniciativas de ciencia de datos para transformar inmensas cantidades de datos en información confiable que resuelva problemas importantes y logre objetivos valiosos: todo, desde Mejorar el entretenimientoPara mejorar la educaciónPara salvando vidas.
Obtenga más información sobre el aprendizaje automático en Artículos y perspectivas.