La compañía Anthropic ha desarrollado recientemente Claude 3. La última versión de su LLM. Y parece que han subido un peldaño más el listón de lo que la Inteligencia Artificial puede hacer.
Tanto es así que los primeros tests muestran que es mejor que ChatGPT
Anthropic ha lanzado tres modelos , Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus. Este último es el más potente de todos y el que más parece que va a sorprendernos a todos.
Claude 3 Opus VS GPT4
En la newsletter The Rundown AI , (os recomiendo suscribiros) han hecho varias pruebas con este modelo y estos son los resultados:
- Redacción de contenido. Claude parece responder de manera más natural que ChatGPT. Con un estilo menos robótico.
- Código. En el caso de esta prueba les pidieron a ambas plataformas crear una app para convertir monedas. El resultado de Claude fue mucho más específico mientras que el de ChatGPT fue más plano.
- Matemáticas. Aquí es donde ChatGPT funcionó mejor que Claude 3. La prueba incluía operaciones con números primos.
- Escritura creativa. Aquí Claude 3 estuvo ligeramente por encima de ChatGPT a la hora de escribir 10 frases que acabasen con «th» (en inglés)
Los creadores de Claude 3 afirman que se podría llegar a una IA consciente. Ya han visto detalles sorprendentes
Y es que Alex Albert, uno de los ingenieros de prompts de Anthropic compartió recientemente una anécdota sobre los tests de Claude 3. Ha sido tan potente da que pensar sobre la dirección de toda la industria de la IA.
Fun story from our internal testing on Claude 3 Opus. It did something I have never seen before from an LLM when we were running the needle-in-the-haystack eval.
— Alex (@alexalbert__) March 4, 2024
For background, this tests a model’s recall ability by inserting a target sentence (the "needle") into a corpus of… pic.twitter.com/m7wWhhu6Fg
Básicamente fue un test donde insertan un elemento como una frase en una serie de documentos no relacionados y se hace una pregunta al modelo sobre ese elemento introducido. Es un poco la idea de encontrar una aguja en un pajar.
Claude 3 Opus fue capaz de identificar ese documento y además mencionó que sospechaba que el elemento podía haber sido introducido para comprobar si estaba prestando atención. De esta manera Claude 3 Opus ha podido mostrar capacidades meta cognitivas
La idea es que Claude 3 Opus podría estar siendo consciente de si mismo como para darse cuenta de que lo están sometiendo a un test.
Es algo fascinante y que está suscitando mucho revuelo entre los especialistas en IA.