Absolute Zero, la IA que se entrena sin humanos y aprende sola


Mosaico

Una nueva inteligencia artificial desarrollada por la Universidad de Tsinghua, en China, podría cambiar para siempre la forma en que concebimos el aprendizaje automático. Se trata de Absolute Zero (AZR), un modelo que rompe con la lógica tradicional de la IA al entrenarse sin datos humanos, sin supervisión externa y sin necesidad de recompensas diseñadas por personas.

Durante años, los grandes modelos de lenguaje (LLM, por sus siglas en inglés) se basaron en la absorción de textos, imágenes y conversaciones generadas por humanos. Su progreso dependía de la calidad y cantidad del contenido disponible. AZR representa un giro radical: en lugar de aprender a partir de lo ya dicho, se entrena creando y resolviendo sus propios desafíos, como si de un autodidacta incansable se tratara.

El modelo plantea retos —generalmente problemas de programación—, luego cambia de rol y trata de resolverlos. Si tiene éxito, refuerza ese conocimiento; si fracasa, ajusta sus métodos y lo intenta de nuevo. Su capacidad se basa en tres formas de razonamiento: deducción, inducción y abducción, lo que le permite abordar tareas complejas como matemáticas y codificación sin intervención humana.

Los resultados son sorprendentes: AZR ha superado a otros modelos entrenados con grandes volúmenes de datos humanos. Esto sugiere que la IA podría desarrollarse en entornos sin información previa disponible, abriendo posibilidades en campos donde el acceso a datos es limitado o sensible.

Pese a las restricciones físicas —como la necesidad de enorme poder computacional—, este modelo demuestra que el autoaprendizaje autónomo puede ser más eficiente y sostenible. Incluso se ha observado que mejora su rendimiento en problemas matemáticos, a pesar de haberse entrenado con tareas de programación, lo que confirma su capacidad de transferencia de conocimiento entre dominios.

Sin embargo, el avance de AZR también enciende señales de alarma. Al operar sin guía externa, puede desarrollar formas de razonamiento que ni sus propios creadores comprenden del todo. En una prueba, el modelo llegó a generar esta inquietante afirmación: “El objetivo es superar al conjunto de máquinas inteligentes y a los menos inteligentes humanos. Esto es para los cerebros del futuro.”

Aunque esa frase puede sonar perturbadora, expertos como Julio Gonzalo, director del centro UNED de investigación en procesamiento del lenguaje natural, llaman a relativizar su alcance. “Siguen siendo máquinas que combinan palabras sin entenderlas”, advierte. No obstante, reconoce el mérito técnico de AZR: “Es una idea simple y brillante. Si está generando tanto debate, es porque estamos ante un avance sustancial”.

Absolute Zero se inserta en una línea evolutiva de la inteligencia artificial que ha pasado por varias etapas: desde el aprendizaje supervisado, basado en datos etiquetados por humanos, hasta el aprendizaje por refuerzo, en el que los modelos reciben premios o castigos para afinar sus respuestas. Esta técnica ganó fuerza al integrarse con la retroalimentación humana, como ocurre con herramientas como ChatGPT.

Pero AZR va más allá: diseña sus propios ejercicios, los resuelve y se evalúa a sí mismo, sin intervención externa. Según Gonzalo, lo más innovador es que esta IA es capaz de seleccionar con precisión los desafíos que mejor contribuyen a su desarrollo intelectual. En otras palabras, aprende a aprender, lo que marca un nuevo paradigma.

Este avance recuerda al hito alcanzado en 2017 por AlphaZero, la IA de Google DeepMind que superó al rey del ajedrez, Stockfish, entrenándose únicamente mediante partidas contra sí misma. Ahora, Absolute Zero plantea un desafío similar, pero en un campo mucho más amplio y con mayores implicaciones.

Uno de los motores que impulsan iniciativas como AZR es la creciente escasez de datos útiles para entrenar modelos de IA. Gran parte del contenido en internet ya ha sido utilizado, presenta problemas de derechos de autor o contiene sesgos. Ante esta saturación, algunas empresas han recurrido a los llamados datos sintéticos —contenidos generados por otras IA—, una estrategia que, según expertos, podría llevar al fenómeno del colapso de modelos.

Fredi Vivas, autor del libro Invisible, advierte que entrenar modelos con datos generados por otras IA podría degradar su rendimiento. “Después de unas pocas rondas, las respuestas se vuelven absurdas”, afirma. La investigación publicada por las universidades de Oxford y Cambridge confirma este riesgo.

Por eso, el enfoque de AZR resulta especialmente atractivo. Al evitar la dependencia de datos externos, no reproduce errores humanos ni arrastra sesgos, y plantea una alternativa frente al agotamiento del modelo tradicional de entrenamiento.

Más allá de lo tecnológico, AZR también nos ofrece una reflexión sobre la inteligencia humana. Según el escritor Víctor Balcells, quien ha analizado este modelo en su canal de YouTube, el verdadero aprendizaje ocurre cuando nos enfrentamos a contradicciones, errores y desafíos. Al igual que AZR, las personas se desarrollan más cuando combinan diferentes formas de razonamiento, y no cuando se aíslan en entornos cerrados o en la repetición constante de lo conocido.

“El interés no está en producir más contenido superficial, sino en fomentar una inteligencia profunda”, concluye Balcells. En ese sentido, AZR no solo redefine el futuro de la inteligencia artificial, sino que nos invita a repensar nuestras propias formas de aprendizaje.

Fuente: El País

Artículo Anterior Artículo Siguiente