OpenAI es una empresa que siempre va a estar en el ojo del huracán. La compañía marcó un hito en la historia de la tecnología con el lanzamiento de ChatGPT a finales de 2023. Sin embargo, sobrevive la duda sobre el entrenamiento de sus modelos de lenguaje. En una entrevista reciente, el CEO de Youtube, Neal Mohah, advirtió que, si la firma de Sam Altman utiliza contenido de Youtube para entrenar a su modelo Sora, habrá problemas serios.
La incertidumbre sobre las bases de datos que se utilizaron para entrenar a ChatGPT sigue en la discusión pública. Todo apunta a que esas dudas se trasladarán a Sora, el generador de video de OpenAI. La advertencia del directivo de Youtube no llegó sin razón; es una respuesta a las recientes declaraciones de la CTO de OpenAI, Mira Murati. En conversación con Wall Street Journal, la ejecutiva comentó que no sabía exactamente si Sora usó videos de Youtube o Facebook para su entrenamiento.
En nuestra opinión, ¡es una respuesta alarmante! En primer lugar, Murati no es una persona que solo trabaja en OpenAI y que es ajena al desarrollo de Sora. Se trata de la CTO de la compañía y, con plena seguridad, debe saber de dónde se tomó el contenido para su entrenamiento. Y si no lo sabe, alguien debería decirle cómo responder de forma más contundente. En cambio, se limitó a decir que OpenAI utilizó datos públicos y licenciados.
¿Acaso Murati no está enterada de todas las disputas legales que enfrenta OpenAI por este tema? Una de ellas, contrapone a la empresa de Sam Altman con el diario New York Times, quien asegura que muchos trabajos con derechos de autor fueron utilizados sin autorización para sus modelos de IA.
¿Qué dijo el CEO de Youtube sobre Sora?
Durante una entrevista con Bloomberg, el CEO de Youtube habló sobre Sora y el posible uso de los videos de la plataforma para su desarrollo. No caminó allí él solo, sino que fue llevado por su entrevistadora a dicho escenario. La periodista le preguntó si pensaba que OpenAI había utilizado videos de Youtube para crear esta herramienta de IA para la generación de video. Mohan recalcó que no tiene información sobre ello.
La periodista le cuestionó si hacerlo representaría una infracción a sus políticas y los derechos de autor. El CEO de Youtube indicó que, si ese fuera el caso, la empresa de Altman incurriría en una violación clara de los términos de servicio.
“Desde la perspectiva del creador, cuando un usuario sube el fruto de su trabajo y esfuerzo a nuestra plataforma, ellos tienen ciertas expectativas. Una de esas expectativas es que los términos de servicio se van a cumplir. Estos no permiten descargar cosas como transcripciones o bits de videos, y esa es una clara violación de nuestros términos de servicio. Esas son las reglas sobre el camino en términos del contenido de nuestra plataforma”.
Lo que es un hecho es que Sora caminará sobre tierras hostiles desde sus orígenes. Muchos especialistas consideran que no hay duda de que OpenAI se vale de contenido protegido por derechos de autor para el entrenamiento de sus modelos de lenguaje. Entonces, ¿por qué con su herramienta de IA para la generación de video las cosas tendrían que ser diferentes?
¿Qué podría pasar entre Google y OpenAI si Sora es entrenado con videos de Youtube?
En caso de que OpenAI use videos de Youtube para entrenar su nueva herramienta de IA generativa, podría haber un gran pleito legal entre Google y la compañía propietaria de Chat-GPT. Entre las consecuencias que vienen a nuestra cabeza, se encuentran las siguientes:
- Google podría poner una demanda contra OpenAI: La reacción inmediata de Google sería abrir un proceso legal contra la compañía por violar y transgredir los términos de servicio de Youtube. En sus lineamientos, señala que el contenido que suben los usuarios a la plataforma no puede ser empleado para el entrenamiento de modelos de IA sin su consentimiento explícito.
- Sanciones o regulaciones estrictas contra OpenAI: El enfrentamiento legal estaría en portadas de todos los diarios. Google es una Big Tech y tiene la capacidad de ejercer presión sobre un tema específico. En este caso, avivaría el debate dentro de los gobiernos para que limiten el uso de contenido protegido por derechos de autor para la investigación en IA. Existe la posibilidad de que los organismos reguladores inicien investigaciones e impongan sanciones contra OpenAI si se determina que violó alguna ley.
- Demandas de creadores contra OpenAI: Los creadores de contenido, quienes viven de la generación de su material, no estarían de acuerdo en que OpenAI use sus videos para crear una herramienta que podría impactar su estilo de vida. Varios influencers podría emprender acciones legales contra la empresa de Sam Altman por violación a sus derechos de autor y privacidad.
¿Crees que OpenAI use videos de Youtube para entrenar a su herramienta de generación de video Sora? Te leemos en la zona de comentarios y las redes sociales.