La empresa OpenAI ha generado controversia al utilizar millones de videos de YouTube para el entrenamiento de sus inteligencias artificiales, un hecho que ha provocado la molestia de Google. Este enfoque de aprendizaje basado en una enorme cantidad de datos audiovisuales ha generado un debate sobre los límites éticos y legales en el uso de contenidos de terceros para el desarrollo de tecnologías avanzadas. La magnitud de la colección de videos empleada por OpenAI, así como la naturaleza sensible de los datos de usuarios de YouTube, plantean interrogantes sobre la privacidad y la seguridad de la información. La reacción de Google, una de las principales compañías detrás de YouTube, refleja la creciente preocupación en la industria tecnológica ante el uso de datos de manera controvertida.
OpenAI enfrenta la ira de Google por utilizar millones de videos de YouTube en su entrenamiento de IA
La semana pasada, Google acusó a OpenAI de utilizar vídeos de YouTube para entrenar a Sora, su inteligencia artificial. Según una investigación de The New York Times, OpenAI también empleó más de un millón de horas de videos de YouTube para entrenar a Whisper, su IA que convierte audio en texto. Esta situación ha generado molestia en Google, ya que consideran que se han utilizado sus datos y además, OpenAI es su principal rival en el campo de la inteligencia artificial.
Se especula sobre si este caso llegará a los tribunales o si las compañías llegarán a un acuerdo en beneficio mutuo. OpenAI se vio en la necesidad de recurrir a videos de YouTube para entrenar a sus inteligencias artificiales, debido a la escasez de datos reales disponibles para mejorar sus sistemas.
OpenAI desafía a Google al emplear videos de YouTube para entrenar a sus inteligencias artificiales
De acuerdo con el periódico The New York Times, las principales empresas de inteligencia artificial han agotado los datos públicos y privados disponibles para entrenar a sus IA. Ante esta situación, OpenAI se vio en la obligación de utilizar videos de YouTube, podcasts y audiolibros para alimentar a sus sistemas, a pesar de encontrarse en una zona gris legal.
Finalmente, OpenAI decidió emplear cerca de un millón de horas de videos de YouTube para entrenar a Whisper, su IA de conversión de voz a texto. Aunque se ampararon en el concepto de uso razonable al utilizar solo una fracción del vasto contenido de la plataforma. Incluso se menciona la posible implicación del presidente de OpenAI, Greg Brockman, en la obtención de estos videos.
Por su parte, el portavoz de Google, Matt Bryant, ha confirmado que la compañía ha tenido conocimiento de las actividades de OpenAI y que sus políticas prohíben el uso no autorizado de contenido de YouTube.
La investigación revela que Meta también se ha visto en la necesidad de buscar nuevas fuentes de datos, considerando la licencia de libros e incluso la compra de una editorial. Expertos sugieren que las empresas de IA podrían quedarse sin datos en el año 2028, lo que ha llevado a considerar la creación de datos sintéticos como una alternativa.
La competencia en el mercado de la inteligencia artificial ha llevado a las empresas a saltarse las normas de copyright en busca de una ventaja competitiva. Esta carrera sin límites plantea interrogantes sobre la seguridad de estas IA y sus posibles consecuencias.
Deja una respuesta