Un foro con información a raudales
Para el que pueda no estar familiarizado con esta página, Reddit es el mayor foro de internet. Contiene una cantidad de información ingente sobre todos los temas que te puedas imaginar y cada día lo visitan más de 50 millones de personas de todo el mundo. En determinadas comunidades, el contenido es frecuentemente memes y publicaciones de humor, pero esto es solo la punta del iceberg. Dentro de esta enorme red, existen foros dedicados a temas de actualidad, tecnología, y por supuesto inteligencia artificial. Cuentan con moderadores y profesionales muy respetados por el sector que ofrecen una información muy completa y valiosa. En ocasiones es la plataforma que usan los desarrolladores de videojuegos por ejemplo para comunicar novedades y actualizaciones. Por estas razones, las comunidades o subreddits más populares tienen millones de seguidores y son decisivas en la opinión pública sobre muchos temas. Incluso han visto filtraciones o noticias que han dado la vuelta al mundo.
Crédito por enseñar a los chatbots
Toda esta información tan relevante ha despertado la atención de los gigantes de la IA. Google, Microsoft y Open AI han usado estos foros para entrenar y enseñar a sus chatbots como ellos mismos confirman entre sus fuentes. Sin embargo, ahora Reddit considera que ofrecer este servicio de manera gratuita debe cambiar. Por ello, su intención es cobrar a las grandes corporaciones para poder acceder a su API (application programming interface). Esta era la manera en que las entidades solían poder descargar y procesar la inconcebible cantidad de conversaciones y posts de los usuarios.
La razón detrás de esta decisión es comprensible, Reddit estaba creando un valor que no estaba recibiendo ninguna compensación a cambio. Pero no solo eso, es un ejemplo de plantarse ante el actual sistema de aprendizaje de estos sistemas, que toma información de internet sin tener en consideración a sus creadores. Incluso en el largo plazo, puede que estos programas de IA se conviertan en una competencia directa para Reddit y la información que ofrece. A día de hoy, Chat GPT y Bard ya incorporan parte de la información de Reddit tanto para su proceso de aprendizaje como para ofrecer información actualizada.
Con la búsqueda de información para alimentar sus modelos de lenguaje, los gigantes tecnológicos están demostrando el valor que tiene la información en este importante paso. No son descabelladas las teorías por lo tanto que afirman que la información y los datos se van a convertir en la moneda más valiosa, y esto explica el comportamiento de las grandes empresas digitales. No solo eso, si no que pone de manifiesto la necesidad de cesar los casos donde esta información se “regala” o se ofrece sin obtener nada a cambio como era el caso de Reddit. Otro ejemplo donde hemos visto el mismo fenómeno es Twitter.
Lo cierto es que estos servidores de IA necesitan encontrar constantemente inmensas bases de datos para poder ser lo más competitivas posibles. Y el atractivo detrás de Reddit es su constante novedad y actualidad. Pero como han anunciado, solo van a limitar el acceso de las grandes empresas de IA, para la investigación académica o sin ánimo de lucro seguirán permitiendo acceder a su base de datos. Ellos mismos quieren incorporar inteligencia artificial y machine learning para poder depurar y mejorar su contenido. Por ejemplo, identificando y etiquetando el contenido en su plataforma que ha sido creado por chatbots. En general, la IA puede ser una gran herramienta para incorporar por sus moderadores en lugar de empresas externas.
La protesta
Los cambios en la API de Reddit vienen en un tiempo convulso para la red, debido al apagón o blackout que están llevando a cabo los moderadores desde hace dos semanas. Algunos de los cambios de la API afectan de manera directa a las aplicaciones de terceros que utilizan habitualmente los usuarios y podría llevar a su insostenibilidad económica o cierre. Lo que comenzaron como 48 horas de protesta se han extendido durante este tiempo en muchas comunidades debido a que en el debate no parece haber ninguna resolución. Pero todo indica que los empleados de Reddit están presionando a los moderadores para poner fin a esta protesta que mantiene algunos hilos cerrados. Los cambios en la API parecen una realidad mientras el tiempo se agota (la actualización es el 1 de julio) y la directiva se muestra firme, para nada dispuesta a dar su brazo a torcer.