León Esquer | Reddit Demanda a Anthropic

Según Reddit, la cosa no es nueva. Afirman haber solicitado previamente a Anthropic que cesara estas prácticas de extracción de datos –lo que en el argot se conoce como scraping–, pero aparentemente sin éxito. La plataforma sostiene que los bots de Anthropic accedieron o intentaron acceder a su contenido más de 100,000 veces, incluso después de que Anthropic hubiera asegurado, en julio del año pasado, que había bloqueado el acceso de sus bots a Reddit.

Ben Lee, el director legal de Reddit, lo puso en palabras bastante claras: "No se debería permitir que las compañías de IA extraigan información y contenido de las personas sin limitaciones claras sobre cómo pueden usar esos datos".

Por su parte, Anthropic no se ha quedado callada. Un portavoz de la compañía ha declarado que no están de acuerdo con las afirmaciones de Reddit y que se defenderán "enérgicamente".

El Valor del Contenido y los Acuerdos con Gigantes de la IA

Este movimiento de Reddit no surge de la nada. La plataforma, con sus cerca de 108 millones de usuarios activos diarios (según cifras de principios de 2025), es una mina de oro en términos de datos conversacionales, opiniones y conocimiento colectivo. Conscientes de esto, Reddit ya ha establecido acuerdos de licencia con otros pesos pesados de la IA como Google y OpenAI.

Estos acuerdos, según la propia Reddit, tienen como objetivo principal establecer las condiciones necesarias para proteger la privacidad de sus usuarios. Buscan garantizar, por ejemplo, el derecho de los usuarios a que se elimine su contenido de los sistemas de entrenamiento si así lo deciden, y evitar que se utilice la información para fines no deseados, como el spam. En esencia, se trata de que, si se va a usar el contenido, sea bajo reglas claras y con el consentimiento de la plataforma que lo alberga y, por extensión, de su comunidad.

La demanda contra Anthropic subraya precisamente la postura de Reddit: el acceso y uso de su contenido para entrenar modelos de IA debe ser mediante un acuerdo de licencia, no a través de una extracción no autorizada que, según ellos, se ha enriquecido injustamente con el trabajo de millones de usuarios.

Este caso, sin duda, sentará un precedente interesante en la continua tensión entre los creadores de contenido y las desarrolladoras de inteligencia artificial, un campo que, como sabemos, necesita cantidades masivas de datos para evolucionar. Estaremos atentos a cómo se desarrolla este litigio.

Referencias:
Independent, La Nación