Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Nvidia Scrapes YouTube, Eyes Netflix, Discovery to Train New AI Video Model

Автор: Proof News

Загружено: 2024-08-09

Просмотров: 844

Описание:

Soon after OpenAI announced its video-generating artificial intelligence model Sora in February, Nvidia leadership decided to compete.

“We need one Sora like model,” wrote Sanja Fidler, vice president of AI research at Nvidia, in a company Slack channel shared with Proof News and first reported on by 404 Media. In a matter of days, Nvidia assembled more than a hundred workers to help lay the training foundation for a similar “state of the art” video model.

An investigation by Proof News found that Nvidia's team began curating video datasets from around the internet, ranging in size from hundreds of clips to hundreds of millions. According to the company Slack and internal documents, staff quickly focused on YouTube, home to billions of videos, which Nvidia’s workforce gathered by downloading datasets of previously scraped videos as well as scraping their own. They also discussed how to pull video from Discovery and Netflix.

Ingredients

Hypothesis: Nvidia downloaded millions of videos without permission from YouTube and potentially other sources in order to create a huge training set for a Sora-like video generation model.

Sample size: Internal Nvidia communications, consisting of Slack messages and emails, shared with Proof News. We are omitting the exact size of our sample to protect our source.

Techniques: We read through a large number of Slack messages and emails in order to establish whether the company had permission to use the videos and how it intended to use them.

Key findings: Nvidia built what Liu described in an email as “a video data factory” yielding a “human lifetime” worth of training content a day. Communications described the model as a foundation for commercial applications.

Limitations: We do not know if Nvidia obtained video from sources beyond YouTube and a handful of datasets mentioned in communications. Nvidia did not respond directly to our questions.

Why we think news needs an ingredients label
   • What's in your news?  

Links

Read the full investigation
https://www.proofnews.org/nvidia-scra...

Read 404 Media’s report
https://www.404media.co/nvidia-ai-scr...

Watch our previous report on tech companies using YouTube to train AI
   • Was your favorite YouTube channel used to ...  


https://www.proofnews.org/
  / proof_news  
  / proof__news  

Join us in making trustworthy, verifiable information the new baseline:
https://www.proofnews.org/donate/

Nvidia Scrapes YouTube, Eyes Netflix, Discovery to Train New AI Video Model

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Отзыв Microsoft: абсолютный КОШМАР конфиденциальности 2025 года

Отзыв Microsoft: абсолютный КОШМАР конфиденциальности 2025 года

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

4 Hours Chopin for Studying, Concentration & Relaxation

4 Hours Chopin for Studying, Concentration & Relaxation

Срочно! ДИКОЕ решение Путина по Донбассу. Эрдоган ЖЁСТКО КИНУЛ Кремль! В России КАТАСТРОФА. ЭЙДМАН

Срочно! ДИКОЕ решение Путина по Донбассу. Эрдоган ЖЁСТКО КИНУЛ Кремль! В России КАТАСТРОФА. ЭЙДМАН

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Разработка с помощью Gemini 3, AI Studio, Antigravity и Nano Banana | Подкаст Agent Factory

Разработка с помощью Gemini 3, AI Studio, Antigravity и Nano Banana | Подкаст Agent Factory

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Новый код — Шон Гроув, OpenAI

Новый код — Шон Гроув, OpenAI

Как Дженсен Хуанг создал самую дорогую компанию в мире

Как Дженсен Хуанг создал самую дорогую компанию в мире

Satya Nadella demos an app he built | Microsoft AI Tour Bengaluru

Satya Nadella demos an app he built | Microsoft AI Tour Bengaluru

20 концепций искусственного интеллекта, объясненных за 40 минут

20 концепций искусственного интеллекта, объясненных за 40 минут

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

Что такое генеративный ИИ и как он работает? – Лекции Тьюринга с Миреллой Лапатой

Что такое генеративный ИИ и как он работает? – Лекции Тьюринга с Миреллой Лапатой

Трамп запускает миссию GENESIS – самый мощный гос-ИИ в истории

Трамп запускает миссию GENESIS – самый мощный гос-ИИ в истории

Proof Ingredients: Is AI going to replace software developers?

Proof Ingredients: Is AI going to replace software developers?

Proof Ingredients: AI no longer says to eat rocks, but still ok with licking them

Proof Ingredients: AI no longer says to eat rocks, but still ok with licking them

ЗЕЛЕНСКИЙ СКАЗАЛ

ЗЕЛЕНСКИЙ СКАЗАЛ "НЕТ": Украина сорвала планы Кремля! СДЕЛКА С ПУТИНЫМ — ЛОВУШКА

Генеральный директор Google DeepMind только что изменил мое представление об искусственном интелл...

Генеральный директор Google DeepMind только что изменил мое представление об искусственном интелл...

Как работает ChatGPT: объясняем нейросети просто

Как работает ChatGPT: объясняем нейросети просто

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]