Una guía sencilla para entender la inteligencia artificial

Una guía sencilla para entender la inteligencia artificial

Una guía sencilla para entender la inteligencia artificial

¿Ya conoces la inteligencia artificial?

En los últimos seis meses, los chatbots, como ChatGPT, y los generadores de imagen, como Midjourney, se han convertido rápidamente en un fenómeno cultural.

Pero la inteligencia artificial (IA) o los modelos de aprendizaje automatizado (machine-learning) existen ya desde hace un tiempo.

En esta guía para principiantes iremos más allá de los chatbots para observar diferentes tipos de IA y ver cómo ya forma parte de nuestras vidas.

¿Cómo aprende la IA?

La clave de todo aprendizaje automatizado es un proceso llamado entrenamiento, en el que se alimenta a un programa informático con una gran cantidad de datos -a veces con etiquetas que explican qué son esos datos- y una serie de instrucciones.

La orden puede ser algo así como: «busca todas las imágenes que contengan caras» o «clasifica estos sonidos».

El programa buscará entonces patrones en los datos que se le han proporcionado para cumplir con la tarea que se le pidió.

Es posible que necesite alguna ayuda en el camino -como «eso no es una cara» o «esos dos sonidos son diferentes»- pero lo que el programa aprende de los datos y las pistas que recibe se convierte en el modelo de IA, y el material de entrenamiento acaba definiendo sus habilidades.

Una forma de ver cómo este proceso de entrenamiento podría crear diferentes tipos de IA es pensar en diferentes animales.

A lo largo de millones de años, el entorno natural ha hecho que los animales desarrollen habilidades específicas. De manera similar, los millones de ciclos que una IA completa durante su entrenamiento de datos determinarán la forma en que se desarrolla y conducirán a modelos de IA especializados.

Entonces, ¿qué ejemplos hay sobre cómo hemos entrenado a los distintos modelos de IA para desarrollar diferentes habilidades?

¿Qué son los chatbots?

Ilustración de un loro con el pico resaltado.

Piensa en un chatbot como si fuera un loro. Es un imitador y puede repetir palabras que ha escuchado con cierta comprensión de su contexto pero sin un sentido completo de su significado.

Los chatbots hacen lo mismo -aunque a un nivel más sofisticado- y están a punto de cambiar nuestra relación con la palabra escrita.

Pero, ¿cómo saben escribir estos chatbots?

Son un tipo de IA conocido como Grandes modelos de lenguaje (LLM, por sus siglas en inglés) y son entrenados con grandes volúmenes de texto.

Un LLM es capaz de considerar no solo las palabras individuales, sino oraciones completas y comparar el uso de las palabras y las frases en un pasaje con otros ejemplos de sus datos de entrenamiento.

Usando estas miles de millones de comparaciones entre palabras y oraciones es capaz de leer una pregunta y generar una respuesta, como el texto predictivo en tu teléfono pero a una escala enorme.

Lo increíble sobre los LLM es que pueden aprender las reglas de la gramática y averiguar el significado de palabras por sí mismos, sin asistencia humana.

¿Puedo hablar con una IA?

Si has usado Alexa, Siri o cualquier otro tipo de sistema de reconocimiento de voz, entonces has estado utilizando la IA.

Ilustración de un conejo con sus orejas destacadas.

Imagina un conejo con sus grandes orejas, adaptadas para captar pequeñas variaciones de sonido

La IA registra los sonidos cuando hablas, elimina el ruido de fondo, separa tus palabras en unidades fonéticas -los sonidos individuales que forman una palabra hablada- y luego los compara con una biblioteca de sonidos del idioma.

Tus palabras se convierten entonces en texto, en el que los errores de escucha pueden corregirse antes de que se dé una respuesta.

Este tipo de inteligencia artificial se conoce como procesamiento natural del lenguaje.

Es la tecnología que se aplica cuando dices «sí» para confirmar una transacción bancaria, o cuando le pides a tu celular que te diga qué tiempo va a hacer en los próximos días en la ciudad a la que vas a viajar.

¿Puede la IA comprender imágenes?

Ilustración de un búho con sus ojos resaltados.

¿Alguna vez tu celular ha reunido tus fotos y las ha puesto en carpetas con nombres como «en la playa» o «de fiesta»?

Entonces has estado utilizando IA sin darte cuenta. Un algoritmo de IA descubre patrones en tus fotos y las agrupa para ti.

Estos programas han sido entrenados a base de revisar pilas de imágenes, todas etiquetadas con una simple descripción.

Si a una IA de reconocimiento de imágenes le proporcionas suficientes imágenes con la etiqueta «bicicleta», con el tiempo comenzará a entender cómo es una bicicleta y en qué forma es distinta de un barco o un automóvil.

A veces, la IA está entrenada para descubrir pequeñas diferencias en imágenes similares.

Así es como funciona el reconocimiento facial, encontrando una relación sutil entre las características de tu rostro que lo hacen distinto y único cuando se compara con cualquier otro rostro del planeta.

El mismo tipo de algoritmo ha sido entrenado con escaneos médicos para identificar tumores malignos y es capaz de revisar miles de escaneos en el tiempo que le llevaría a un médico tomar una decisión sobre uno solo.

¿Cómo crea la IA nuevas imágenes?

Ilustración de un camaleón con el dibujo de su piel resaltado.

Recientemente, el reconocimiento de imágenes se ha adaptado a modelos de IA que han aprendido el poder camaleónico de manipular patrones y colores.

Estas IA de generación de imagen pueden convertir los patrones visuales que recogen de millones de fotografías y dibujos en imágenes completamente nuevas.

Puedes pedirle a la IA que cree una imagen fotográfica de algo que nunca ha ocurrido, por ejemplo, la foto de una personas caminando sobre la superficie de Marte.

O puedes dirigir de forma creativa el estilo de la imagen: «haz un retrato del entrenador de la selección inglesa de fútbol, pintado al estilo de Picasso».

Las últimas IA inician el proceso de generar esta nueva imagen con una colección de píxeles coloreados de forma aleatoria.

Se fija en los puntos aleatorios en busca de algún indicio de un patrón que haya aprendido durante el entrenamiento, patrones que le sirven para crear diferentes objetos.

Estos patrones se mejoran lentamente agregando más capas de puntos, conservando los puntos que desarrollan el patrón y descartando otros, hasta que al final emerge una imagen semejante a la que se le pide.

Si la IA desarrolla de manera simultánea patrones como «superficie de Marte», «astronauta» y «caminar», es capaz de producir una nueva imagen.

Como la nueva imagen se construye a partir de capas de píxeles al azar, el resultado es algo que nunca había existido, pero que se sigue basando en los miles de millones de patrones que la IA ha aprendido con las imágenes originales con las que se le entrenó.

Esto implica un desafío en asuntos relacionados con los derechos de autor y la ética de que una IA genere obras de arte a partir del duro trabajo de artistas, diseñadores y fotógrafos reales.

¿Y los vehículos autónomos?

Los vehículos autónomos han sido parte de la conversación sobre IA desde hace décadas, y la ciencia ficción ha conseguido fijarlos en la imaginación popular.

La IA autónoma se conoce como conducción autónoma. Los vehículos con esta tecnología están equipados con cámaras, radar y láseres de medición de distancias.

Ilustración de una libélula con las alas y ojos resaltados.

Piensa en una libélula, con visión de 360 grados y sensores en las alas que le ayudan a maniobrar y a hacer ajustes constantes durante el vuelo.

De forma similar, el modelo de IA utiliza los datos de sus sensores para identificar objetos y determinar si se mueven y, de ser así, qué tipo de objeto en movimiento es: otro vehículo, una bicicleta, un peatón…

Miles y miles de horas de entrenamiento para entender cómo se conduce han permitido a la IA ser capaz de tomar decisiones y actuar en el mundo real para conducir el vehículo y evitar choques.

Los algoritmos predictivos pueden haber tenido problemas durante muchos años para lidiar con la naturaleza a veces impredecible de los conductores humanos, pero los vehículos autónomos ahora han recopilado millones de kilómetros de datos en carreteras reales. En San Francisco ya hay usuarios que pagan por ser transportados en un vehículo autónomo.

La conducción autónoma es también un claro ejemplo de cómo las nuevas tecnologías deben superar algo más que obstáculos técnicos.

La legislación de los gobiernos y las regulaciones de seguridad, junto con la profunda sensación de ansiedad sobre lo que ocurre cuando le entregas el control a las máquinas, son aún obstáculos potenciales para un futuro completamenet automatizado en nuestras carreteras.

¿Qué sabe la IA sobre mí?

Ilustración de un panal con abejas resaltadas.

Algunas IA simplemente manejan números, recogiéndolos y combinándolos para crear un enjambre de información, cuyos productos pueden ser extremadamente valiosos.

Es posible que ya existan varios perfiles de tus acciones financieras y sociales, particularmente en internet, que podrían ser usados para hacer predicciones sobre tu comportamiento.

Tu tarjeta de fidelización del supermercado rastrea tus hábitos y gustos a través de tu compra semanal. Las agencias de crédito rastrean cuánto tienes en el banco y cuánto debes de tus tarjetas de crédito.

Netflix y Amazon llevan un registro de cuántas horas de contenido viste anoche. Tus cuentas de redes sociales saben cuántos videos comentaste hoy.

Y no eres tú solo, estos números existen para todo el mundo, lo que permite a los modelos de IA revisarlos y buscar tendencias sociales.

Estos modelos ya están dando forma a tu vida, desde ayudar a decidir si te van a dar un préstamo o una hipoteca a influir en tus decisiones de compra mostrándote determinados anuncios publicitarios.

¿La IA podrá hacer todo?

Ilustración de una criatura híbrida, el cuerpo de un león con el rostro de un búho, un pico de loro, orejas de conejo y alas de libélula.

¿Sería posible combinar algunas de estas habilidades en un único modelo híbrido de IA?

Eso es exactamente lo que hace uno de los avances más recientes en IA.

Se llama IA multimodal, y permite que un modelo observe diferentes tipos de datos, como imágenes, texto, audio o video, y descubra nuevos patrones entre ellos.

Este enfoque multimodal fue una de las razones del gran salto en capacidad entre ChatGPT3.5, que solo fue entrenado con texto, y ChatGPT4, que fue entrenado también con imágenes.

La idea de un modelo de IA único capaz de procesar cualquier tipo de información y, por lo tanto, llevar a cabo cualquier tarea, desde traducir idiomas a diseñar nuevos medicamentos, se conoce como inteligencia artificial general (IAG).

Para algunos, es el objetivo último de toda investigación en inteligencia artificial; para otros, es el camino para todas esas distopías de ciencia ficción en la que desatamos una inteligencia tan incomprensible que ya no somos capaces de controlarla.

¿Cómo se entrena a la IA?

Hasta hace poco, el proceso clave en el entrenamiento de la mayoría de las IA se conocía como «aprendizaje supervisado».

Los humanos ponían etiquetas a grandes paquetes de datos de entrenamiento y se le pedía a la IA que buscara patrones en los datos.

Se le pedía entonces a la IA que aplicara esos patrones a nuevos datos y que reportara sobre su precisión.

Por ejemplo, imagina que le das a la IA una docena de fotos, seis etiquetadas como «automóvil» y seis como «furgoneta».

Seis automóviles rojos y seis furgonetas blancas.

Después pídele a la IA que encuentre un patrón visual que clasifique los automóviles y las furgonetas en dos grupos.

¿Qué crees que pasará cuando le pidas que clasifique esta foto?