Todavía estamos aguardando con intriga el lanzamiento oficial de Google Gemini, la herramienta con IA de Google que promete competir directamente con Chat GPT. Sin embargo, el video en el que promocionan esta nueva herramienta podría haber sido fingido. No sería la primera vez que las grandes empresas tecnológicas demuestran que el marketing en ocasiones va por delante del desarrollo tecnológico.
Cuánto hay de falso en la demo de Google Gemini
Tan solo hace unos días, Google compartió en su canal de YouTube una demos del que va a ser su próximo modelo: Gemini. Enseguida ha superado los dos millones de visualizaciones ya que demuestra unas habilidades de la IA completamente revolucionarios. Básicamente, el modelo parece ser capaz de describir y reconocer los dibujos que un humano va haciendo sobre varios post-its. Lo sorprendente es que a raíz de sencillos bocetos es capaz de reconocer lo que aparece en el papel, su significado e incluso las relaciones con otros conceptos complejos. Por ejemplo, con solo añadir un sol al dibujo o unas líneas onduladas, Gemini es capaz de interpretar el clima dentro de lo que muestra el boceto. Pero también puede interpretar el significado de varios signos hechos con la mano, por ejemplo para jugar al piedra-papel o tijeras. Aunque parezca una tarea sencilla, lo que demuestra la supuesta demo es la capacidad de abstracción y relación de conceptos que hasta ahora solo un humano podía hacer. Pero a pesar de provocar una reacción viral entre los usuarios, se han generado dudas sobre las capacidades de Gemini debido a la veracidad del video.
Lo que ha hecho que muchos desconfíen de la compañía y de la demo es que en realidad el modelo no reconoce el vídeo tal y como sucede. A primera vista, parece que el modelo interpreta a tiempo real los bocetos según aparecen sobre el papel o las manos según gesticulan. Sin embargo, por el momento el video ha sido creado mediante prompts de texto e imágenes fijas. Es decir, hasta cierto punto si es capaz de interpretar imágenes y hacer interpretaciones sorprendentes, pero todavía está lejos de poder hacerlo a tiempo real o en base a videos. Google no ha pretendido ser completamente engañoso con esta demo, ya que en la descripción del video podemos ver una explicación sobre su creación. Pero es innegable que la demo busca mostrar a Gemini como un modelo mucho más potente de lo que es por el momento. De ser capaz de interpretar imágenes de la forma que muestra el video, la IA podría muy pronto ser capaz de interactuar con el mundo real de formas inimaginables. Como suele pasar en el marketing, hay que observar las palabras con mucha atención, ya que el video demuestra lo que Gemini “podría” hacer. Por suerte o por desgracia, eso todavía tendrá que esperar.