Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Depth Anything - Generating Depth Maps from a Single Image with Neural Networks

Автор: Oxen

Загружено: 2024-02-18

Просмотров: 4150

Описание:

This week we cover the "Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data" paper from TikTok, The University of Hong Kong, Zhejiang Lab, and Zhejiang University. In this paper, they create a large dataset of labeled and unlabeled imagery to train a neural network for depth estimation from a single image, without any extra hardware or algorithmic complexity.

--

Get Oxen 🐂 https://oxen.ai/

Oxen.ai makes versioning your datasets as easy as versioning your code! Even is millions of unstructured images, we quickly handle any type of data so you can build cutting-edge AI.

--

Depth Anything 📜 https://arxiv.org/abs/2401.10891

The Dataset 🔢 https://www.oxen.ai/datasets/HRWSI

Depth Anything Notes 📜 https://www.oxen.ai/blog/arxiv-dives-...

MiDas 📜 https://arxiv.org/abs/1907.01341v3

Demo Depth Anything 🤗 huggingface.co/spaces/LiheYoung/Depth-Anything

Join Arxiv Dives 🤿 https://oxen.ai/community

Discord 🗿   / discord  

--

Chapters
0:00 Intro to Depth Anything
2:00 Use Cases
3:10 Real World Example
5:12 What is a Depth Map?
7:00 Crash Course in Traditional Techniques
9:42 Enter Depth Anything
16:00 Learning from the Teacher Model
18:35 DINOv2 Model
19:18 Depth Anything Architecture
21:29 Evaluation
25:55 Ablation Studies
28:22 Data, Perturbations, Feature Loss
31:15 Qualitative Results
33:00 Limitations

Depth Anything - Generating Depth Maps from a Single Image with Neural Networks

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Deep Dive Into The Toolformer

Deep Dive Into The Toolformer

How to Estimate Real Distance to Objects with a Single Camera and YOLO11

How to Estimate Real Distance to Objects with a Single Camera and YOLO11

Лучшие модели оценки глубины (MiDaS, Depth Pro, Depth Anything v2, DepthCrafter, Marigold, Metric3D)

Лучшие модели оценки глубины (MiDaS, Depth Pro, Depth Anything v2, DepthCrafter, Marigold, Metric3D)

Transforming 2D Images into 3D Metric Point Clouds with Depth Anything

Transforming 2D Images into 3D Metric Point Clouds with Depth Anything

This AI Sees Depth from ONE Image 🤯 (Is It Cheating Physics?)

This AI Sees Depth from ONE Image 🤯 (Is It Cheating Physics?)

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

How Neural Nets estimate depth from 2D images? Monocular Depth Estimation Explained!

How Neural Nets estimate depth from 2D images? Monocular Depth Estimation Explained!

Управление поведением LLM без тонкой настройки

Управление поведением LLM без тонкой настройки

Artificial Intelligence For the Stereographer

Artificial Intelligence For the Stereographer

Может ли у ИИ появиться сознание? — Семихатов, Анохин

Может ли у ИИ появиться сознание? — Семихатов, Анохин

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

(Preview) MonoNav: MAV Navigation via Monocular Depth Estimation and Reconstruction

(Preview) MonoNav: MAV Navigation via Monocular Depth Estimation and Reconstruction

Тренды в ИИ 2026. К чему готовиться каждому.

Тренды в ИИ 2026. К чему готовиться каждому.

Tutorial: Efficient Gaussian Splatting | CVPR 2024

Tutorial: Efficient Gaussian Splatting | CVPR 2024

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

How Diffusion Works for Text

How Diffusion Works for Text

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Точка зрения: что вы увидите во время захвата искусственным интеллектом

Точка зрения: что вы увидите во время захвата искусственным интеллектом

2D Image to 3D Point Cloud with DepthAnything: Live Course (Monocular Depth Estimation)

2D Image to 3D Point Cloud with DepthAnything: Live Course (Monocular Depth Estimation)

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com