OpenAI utilizó millones de videos de YouTube para entrenar a sus inteligencias artificiales: Google está muy molesto.

La empresa OpenAI ha generado controversia al utilizar millones de videos de YouTube para el entrenamiento de sus inteligencias artificiales, un hecho que ha provocado la molestia de Google. Este enfoque de aprendizaje basado en una enorme cantidad de datos audiovisuales ha generado un debate sobre los límites éticos y legales en el uso de contenidos de terceros para el desarrollo de tecnologías avanzadas. La magnitud de la colección de videos empleada por OpenAI, así como la naturaleza sensible de los datos de usuarios de YouTube, plantean interrogantes sobre la privacidad y la seguridad de la información. La reacción de Google, una de las principales compañías detrás de YouTube, refleja la creciente preocupación en la industria tecnológica ante el uso de datos de manera controvertida.

Index

OpenAI enfrenta la ira de Google por utilizar millones de videos de YouTube en su entrenamiento de IA

La semana pasada, Google acusó a OpenAI de utilizar vídeos de YouTube para entrenar a Sora, su inteligencia artificial. Según una investigación de The New York Times, OpenAI también empleó más de un millón de horas de videos de YouTube para entrenar a Whisper, su IA que convierte audio en texto. Esta situación ha generado molestia en Google, ya que consideran que se han utilizado sus datos y además, OpenAI es su principal rival en el campo de la inteligencia artificial.

Se especula sobre si este caso llegará a los tribunales o si las compañías llegarán a un acuerdo en beneficio mutuo. OpenAI se vio en la necesidad de recurrir a videos de YouTube para entrenar a sus inteligencias artificiales, debido a la escasez de datos reales disponibles para mejorar sus sistemas.

OpenAI desafía a Google al emplear videos de YouTube para entrenar a sus inteligencias artificiales

OpenAI desafía a Google al emplear videos de YouTube para entrenar a sus inteligencias artificiales

De acuerdo con el periódico The New York Times, las principales empresas de inteligencia artificial han agotado los datos públicos y privados disponibles para entrenar a sus IA. Ante esta situación, OpenAI se vio en la obligación de utilizar videos de YouTube, podcasts y audiolibros para alimentar a sus sistemas, a pesar de encontrarse en una zona gris legal.

Finalmente, OpenAI decidió emplear cerca de un millón de horas de videos de YouTube para entrenar a Whisper, su IA de conversión de voz a texto. Aunque se ampararon en el concepto de uso razonable al utilizar solo una fracción del vasto contenido de la plataforma. Incluso se menciona la posible implicación del presidente de OpenAI, Greg Brockman, en la obtención de estos videos.

Por su parte, el portavoz de Google, Matt Bryant, ha confirmado que la compañía ha tenido conocimiento de las actividades de OpenAI y que sus políticas prohíben el uso no autorizado de contenido de YouTube.

La investigación revela que Meta también se ha visto en la necesidad de buscar nuevas fuentes de datos, considerando la licencia de libros e incluso la compra de una editorial. Expertos sugieren que las empresas de IA podrían quedarse sin datos en el año 2028, lo que ha llevado a considerar la creación de datos sintéticos como una alternativa.

La competencia en el mercado de la inteligencia artificial ha llevado a las empresas a saltarse las normas de copyright en busca de una ventaja competitiva. Esta carrera sin límites plantea interrogantes sobre la seguridad de estas IA y sus posibles consecuencias.

Sara García

Hola, soy Sara, experta y apasionada de la tecnología. Como redactora en Digital Soft, un periódico independiente de actualidad sobre tecnología y PCs, tengo el privilegio de compartir las últimas novedades con rigurosa objetividad. Mi pasión por la innovación y la precisión me impulsa a investigar a fondo cada tema para ofrecer a nuestros lectores la información más relevante y actualizada. ¡Descubre conmigo el fascinante mundo de la tecnología!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir