Open AI, la empresa dirigida por Sam Altman que ya nos ha sorprendido con chatbots como GPT-4o, o su herramienta de vídeo Sora, parece que tiene un nuevo modelo en camino. Se llama o1 y en teoría va a ser capaz de reducir de forma significativa las alucinaciones propias de la IA. Incluso los hay que dicen que es capaz de razonar… ¿estamos ante la primera AGI?
¿Qué es o1?: el nuevo modelo de Open AI
OpenAI ha lanzado el tan esperado modelo o1, anteriormente conocido en rumores como el modelo «Strawberry». Este nuevo modelo se centra en la capacidad de razonamiento, siendo capaz de resolver preguntas más complejas y de manera más eficiente que los modelos anteriores, aunque a un precio significativamente más alto. Junto con el modelo o1, también se lanzó una versión más pequeña y económica llamada o1-mini.
El modelo o1 representa un paso importante hacia el objetivo de OpenAI de desarrollar inteligencia artificial con capacidades cercanas a las humanas. Este modelo es particularmente efectivo en la resolución de problemas complejos, como la escritura de código y la solución de problemas que requieren varios pasos. En términos prácticos, o1 es más preciso y eficiente en estas tareas que sus predecesores, aunque sigue siendo más costoso y más lento de utilizar que GPT-4o. OpenAI describe esta versión como una «vista previa» para enfatizar que aún está en una fase temprana de desarrollo.
Los usuarios de ChatGPT Plus y Team ya pueden acceder a las versiones o1-preview y o1-mini, mientras que los usuarios de Enterprise y Edu tendrán acceso a partir de la próxima semana. Para los desarrolladores, el acceso a través de la API es bastante costoso: el precio es de $15 por cada millón de tokens de entrada y $60 por cada millón de tokens de salida, en comparación con los $5 y $15 que cuesta GPT-4o.
Las novedades de o1: el nuevo modelo de Open AI
Una de las principales diferencias entre o1 y los modelos anteriores es su método de entrenamiento. Según cuenta desde Open AI, o1 fue entrenado con un nuevo algoritmo de optimización y un dataset diferente, lo que lo hace fundamentalmente distinto de GPT-4o. Este modelo utiliza aprendizaje por refuerzo, lo que le permite resolver problemas de manera más autónoma, y emplea un enfoque llamado «cadena de pensamiento» que simula el proceso paso a paso que los humanos siguen al razonar. Esta técnica hace que o1 sea más preciso y reduzca las alucinaciones, aunque OpenAI admite que el problema aún no se ha resuelto por completo. Lo que distingue a o1 es su capacidad para resolver problemas matemáticos y de programación de forma mucho más eficaz, superando a GPT-4o en muchas de las pruebas.
Sin embargo, o1 no es superior a GPT-4o en todas las áreas. Por ejemplo, no es tan efectivo en términos de conocimiento factual sobre el mundo, ni tiene la capacidad de navegar por la web o procesar archivos e imágenes. Además, parece que este nuevo modelo es de hecho más lento que el anterior. A pesar de esto, OpenAI considera que o1 marca el comienzo de una nueva generación de capacidades, enfocándose más en el razonamiento profundo. La empresa de Sam Altman ha diseñado la interfaz de o1 para que parezca más humana en sus procesos, mostrando pasos como «Estoy pensando en esto» o «Déjame ver» mientras resuelve problemas. Aunque estas expresiones no indican pensamiento real, están diseñadas para mostrar cómo el modelo procesa preguntas complejas de manera más detallada que los modelos anteriores.
La creación de sistemas autónomos que puedan tomar decisiones y actuar por los usuarios es uno de los grandes objetivos de OpenAI. Por lo tanto, la mejora en las capacidades de razonamiento que trae o1 es vista como un paso clave hacia este futuro. Y vamos a ver capaz a este modelo de hacer cosas impresionantes como programar un videojuego con un solo prompt.
OpenAI o1 codes a video game from a prompt. pic.twitter.com/aBEcehP0j8
— OpenAI (@OpenAI) September 12, 2024