Machine Learning

Crear sistemas que aprenden de su propia experiencia es el objetivo del machine learning. Esta disciplina explora la construcción de algoritmos que, a partir de unos datos, son capaces de detectar patrones complejos y realizar predicciones.

El aprendizaje automático está cambiando el mundo. Su impacto abarca desde los filtros anti-spam hasta la lucha contra el cáncer. Ha permitido grandes progresos científicos, como el conocimiento profundo del genoma humano, y es también responsable de las mejoras muchos sistemas tecnológicos cotidianos, tales como la recomendación de productos o los motores de búsqueda.

Ante grandes volúmenes de datos, resulta ineficiente, y la mayoría de las veces directamente imposible, programar las reglas que rigen las infinitas combinaciones de los datos de entrada y sus posibles outputs. Los sistemas de machine learning no necesitan estas instrucciones explícitas. Utilizan información suministrada como ejemplos para generalizar comportamientos. Se trata de un proceso iterativo en el que el sistema continuamente comprueba sus resultados y realiza las correspondientes adaptaciones. Dicho de otra forma, el sistema está constantemente aprendiendo.

Ante grandes volúmenes de datos, resulta ineficiente, y la mayoría de las veces directamente imposible, programar las reglas que rigen las infinitas combinaciones de los datos de entrada y sus posibles outputs. Los sistemas de machine learning no necesitan estas instrucciones explícitas. Utilizan información suministrada como ejemplos para generalizar comportamientos.

Beneficios del aprendizaje automático

Finanzas, sanidad, marketing, investigación científica o energía son algunas de las áreas en las que se están aprovechando las ventajas competitivas del machine learning. En 3.14 apostamos por sistemas diseñados a medida de cada proyecto que maximicen los beneficios del aprendizaje automático. Entre esos beneficios, destacamos:

Ahorro de tiempo y dinero: El machine learning permite automatizar la creación de modelos, lo que supone una drástica reducción de tiempo y costes. Un sistema de aprendizaje automático es capaz de crear miles de modelos en el mismo plazo de tiempo en el que un experto en datos tarda en crear uno solo.
Capacidad para manejar grandes sets de datos: El volumen y la complejidad del Big Data convierten en cada vez más necesarias las soluciones de aprendizaje automático. Estas soluciones permiten también trabajar con datos que están modificándose en tiempo real.
Descubrimiento de oportunidades: El descubrimiento de patrones ocultos en los datos saca a la luz nuevas oportunidades que no habían sido detectadas.
Capacidad de anticipación: Gracias a las capacidades predictivas de las soluciones de aprendizaje automático, es posible sustituir las actitudes reactivas por las proactivas.
Limitación del riesgo: Los modelos predictivos suponen también una gran ventaja competitiva a la hora de gestionar los riesgos. El machine learning permite reducir la incertidumbre mediante la toma de decisiones informadas.

Machine learning a medida

Nuestros sistemas se construyen para resolver las necesidades específicas de cada cliente. Dependiendo de los objetivos del proyecto, apostamos por distintos tipos de machine learning:

Aprendizaje supervisado: El sistema recibe como datos de entrenamiento ejemplos etiquetados de entradas y salidas y establece la correspondencia entre ellos. El objetivo es producir una función que sea capaz de predecir el output para cualquier input.
Aprendizaje no supervisado: El sistema recibe las entradas del sistema sin etiquetar y encuentra por sí mismo la estructura del input. El objetivo en este caso es el de encontrar patrones desconocidos en los datos.
Aprendizaje por refuerzo: El sistema interactúa con su entorno, recibe feedback en forma de castigo o recompensa y aprende por ensayo-error.

Podemos también clasificar el tipo de aprendizaje en función del output deseado del sistema:

Clasificación: A partir de un conjunto de datos de entrenamiento divididos en categorías, el sistema crea un modelo capaz de determinar a qué categoría pertenece cada nuevo input.
Regresión: Se usa en el aprendizaje supervisado para predecir valores continuos.
Clustering: Se usa en el aprendizaje no supervisado para dividir el input en grupos que compartan las mismas características.
Reducción de la dimensión: Su objetivo es simplificar los inputs y reducir el número de variables aleatorias bajo consideración.

El enfoque de las soluciones de aprendizaje automático debe adaptarse a las características de cada proyecto. Dependiendo de esas características, apostamos por distintos tipos de algoritmos:

Máquinas de vectores de soporte (Support Vector Machines o SVMs): Este conjunto de algoritmos de aprendizaje supervisado se usa para clasificación y regresión. A partir de unos datos de entrenamiento etiquetados en dos categorías, construyen un modelo capaz de predecir a cuál de esas categorías pertenece un nuevo input.
Redes bayesanas: Este modelo representa variables aleatorias y sus dependencias condicionales.
Árboles de decisiones: Esta aproximación consiste en mapear observaciones sobre un objeto para predecir su valor final.
Reglas de asociación: Este método se centra en descubrir relaciones relevantes entre las variables de un conjunto de datos.
Redes de neuronas artificiales: Este paradigma, inspirado en el funcionamiento del sistema nervioso de los organismos vivos, se utiliza normalmente para modelar relaciones complejas entre los datos de entrada y salida.
Deep learning: Esta aproximación consigue modelar abstracciones de alto nivel usando múltiples capas de procesamiento no lineal.

En función de factores como la calidad y la naturaleza de los datos, el tiempo de entrenamiento o el nivel de precisión deseado, determinamos qué tipo de aprendizaje automático es el más adecuado en cada caso.