Esta vez las palabras de Elon Musk en Twitter (X) no eran un farol. Cumpliendo el plazo que había dicho, ayer Grok el chatbot de xAI, compartió de forma pública su código y datos sobre su funcionamiento. Volver a Grok un modelo de código abierto no deja de ser una estrategia por parte de Musk para presionar a los demás modelos a volverse Open Source.
El código abierto de Grok
Tras la demanda que presentó Elon Musk contra Open AI por no cumplir con su promesa de mantener el código abierto, era cuestión de tiempo que Grok tuviese que predicar con el ejemplo. La semana pasada Musk puso un tweet asegurando que Grok iba a publicar su código antes de que terminase la semana. Ya sabemos que el sudafricano tiene por costumbre twittear todo tipo de cosas, por lo que no era una certeza que fuese a ser cierto. Sin embargo, ayer justo antes de que terminase el plazo, Grok de xAI se volvió Open Source. Esto permite que los desarrolladores de IA e investigadores puedan aprender sobre cómo funciona Grok para implementar los conocimientos adquiridos en sus propios modelos. No deja de ser una forma de democratizar el progreso que ofrece la IA. Hasta ahora, los principales modelos open source que servían este propósito eran LLama-2 de Meta y Mistral AI de la startup francesa. Por su parte Open AI ha limitado el código abierto de sus herramientas según Microsoft ha ganado más peso entre bastidores. Por esta razón Musk quiere presionarles para volver la tecnología accesible.
Observando el código público de Grok, la primera conclusión es que el modelo es gigante. Los expertos de xAI han compartido que es un modelo con 314.000 millones de parámetros. Esto sería aproximadamente cuatro veces el tamaño de LLama.2 y sus 65.000 millones de parámetros. Un mayor tamaño a priori significa que el modelo tiene una habilidad para ofrecer respuestas en más profundidad y con mayor precisión. A pesar de la transparencia en el código de Grok, lo que sigue siendo una incógnita son los datos utilizados para su entrenamiento. Esto ya hemos visto como parece ser información delicada dentro del sector de la IA, ya que todavía podría haber vacíos legales en torno a los derechos de los datos que utilizan los chatbots. Por ejemplo, no sabemos si utilizan todos los datos disponibles en Google, redes sociales o incluso bases de datos de aplicaciones.
¿Por qué es importante el código abierto?
Con el enorme progreso que estamos experimentando gracias a la IA, es muy importante el posicionamiento de las compañías con respecto al código abierto. En una primera instancia, proyectos como OpenAI partían de la base de que era necesario mantenerse Open Source para que ninguna empresa privada acaparase conocimientos con el potencial de revolucionar el mundo. Sin embargo, la IA ha demostrado ser muy cara ya que Microsoft habría invertido más de 13.000 millones en OpenAI. También ha demostrado ser ciertamente peligrosa en las manos incorrectas. Y por esto, OpenAI ya no parece tan partidaria de compartir libremente todos sus avances. Desde luego es todo un debate. Para algunos la transparencia es lo más importante, ya que demuestra la buena intención por parte de estas compañías que están realizando avances que van a cambiar el mundo. Pero también es cierto que el Open Source conlleva algunos riesgos. En mi opinión, la naturaleza abierta y comunitaria del código abierto no sólo acelera el desarrollo y la adopción de nuevas soluciones, sino que asegura la sostenibilidad de la IA a largo plazo. No deja de ser una forma de que puedan beneficiarse los individuos, empresas y la sociedad en general.