El aprendizaje a través del análisis de datos se remonta al siglo XIX, cuando el doctor John Snow creó un mapa de la ciudad de Londres, donde registró los puntos de la ciudad en donde se habían presentado muertes por cólera, lo que permitió identificar que entre más cerca se estaba del cauce de las aguas residuales, más defunciones había por esta razón. Logrando con este análisis convencer a las autoridades de Londres de construir un sistema de alcantarillado, y en consecuencia minimizar los casos de cólera.
La evolución del análisis de datos ha avanzado a pasos agigantados, hasta llegar a valerse de la Inteligencia Artificial, como lo hace hoy en día.
La Inteligencia Artificial (IA) es la capacidad de un sistema, aplicación, maquina, de emular el comportamiento inteligente del ser humano realizando tareas intelectuales como percepción, razonamiento, autonomía, planeación. IA es aprovechada en varias ramas de la tecnología para ayudar a tomar decisiones en base a grandes cantidades de datos (Big Data), categorizando esta información, de manera certera y muy rápida.
La Industria de la Ciberseguridad, es una de las tantas que ha sabido aprovechar su potencial y bondades. Específicamente se vale de una de las ramas de IA, Machine Learning, y a su vez, de una de las ramas de ML, Deep Learning:
- Machine Learning (ML): Es la capacidad de aprender (de una máquina o programa) sin haber sido explícitamente programado previamente, sino en base a algoritmos que pueden develar información de interés acerca de un cúmulo de datos (Big Data) para la resolución de determinado problema.
En lugar de escribir código, se alimenta de datos a un algoritmo genérico, y este construye su propia lógica en base a estos mismos datos, permitiendo por ejemplo, categorizarlos de acuerdo a patrones identificados por este algoritmo.
- Deep Learning (DL): Rama de ML que específicamente se enfoca en algoritmos que construyen redes neuronales artificiales, inspirándose en redes neuronales biológicas formadas en el cerebro humano.
En su conjunto se integran de la siguiente manera:
ML a su vez se desglosa en dos tipos, de acuerdo a su forma de aprendizaje:
- Aprendizaje Supervisado: Los seres humanos le indican al programa (o máquina), que comportamientos son buenos o malos (etiquetado), y este determina las coincidencias para desarrollar firmas multidimensionales
ML con aprendizaje supervisado tiene algunas variantes en base a las funciones que puede realizar por ejemplo:- Clasificación: Permite etiquetar datos, asignándoles una clase o categoría, por ejemplo spam/no spam, fraude/no fraude, malware/no malware.
- Regresión: los datos son etiquetados con un valor real, pensando en un punto flotante, mas que una etiqueta, por ejemplo series de datos en el tiempo como precios de un stock a través del tiempo
- Aprendizaje no Supervisado: el programa (o máquina) desarrolla los algoritmos sin tener previamente etiquetados los datos (Big Data), permitiéndole determinar que es normal y que es anormal. Un ejemplo de estos algoritmos es:
- Clustering: Los datos no son etiquetados, pero pueden ser divididos en diferentes grupos basandose en similitudes u otras medidas de estructura natural en los datos.
¿Por qué se adopta el uso de ML en Ciberseguridad?
Diferentes organizaciones (como empresas de Seguridad), actualmente cuentan con una gran cantidad de datos, que pueden permitir reforzar la ciberseguridad, ayudando a la detección de adversarios y una de las tecnologías que permite aprovechar de mejor manera estos datos es ML.
Los beneficios principales que ofrece ML a esta industria son la automatización, imparcialidad, es capaz de perfeccionarse conforme pasa el tiempo, así como analizar grandes cantidades de datos a una gran velocidad.
¿Cómo es usado IA/ML en Ciberseguridad hoy en día?
Principalmente se utiliza el modo de ML con aprendizaje supervisado que permite una detección de amenazas automatizada, a través de la siguiente secuencia de pasos:
Las soluciones que están basadas en el uso de ML son más adaptables, dinámicas y en teoría requieren de una mínima intervención humana. Algunas soluciones que utilizan hoy en día ML son:
- Endpoint Protection
- IDS’s Avanzados
- Prevención de Fraudes
- Sniffers de Red
- Mail and Web Gateways
En lo que respecta al uso de ML en la detección de Malware, que principalmente corresponde a las Soluciones Endpoint, la aproximación es la siguiente
- Dos niveles de aprendizaje jerárquico
- Aprendizaje supervisado: con la finalidad de detectar flujos maliciosos y posteriormente identificar tipos específicos de malware
- Combinar Aprendizaje no supervisado para alcanzar una nueva clase de programa de descubrimiento
- Deep Learning
- Descubrir patrones escondidos o sofisticados
- Analizar y detectar malware nunca antes visto
En conclusión, la IA así como ML y DL, son herramientas que ayudan en gran medida a mitigar las amenazas que hoy en día aquejan al mundo digital, de una manera más independiente (del ser humano), inteligente, dinámica y automatizada, aunque, para lograr protegerse ante estas amenazas no es suficiente, no es posible prescindir de la inteligencia humana (al menos hoy en día), los conocimientos, experiencia, sentido común del ser humano, no han logrado ser igualados por estas tecnologías, por lo que en la Seguridad Conducida por Datos, quien tiene la última palabra para responder ante amenazas en el mundo de la ciberseguridad sigue siendo el expertise del ser humano.
Si tiene alguna duda, comentario u opinión sobre este artículo, no dude en contactarnos.