Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Spatial Audio Rendering for Speech Live Translation

Автор: Microsoft Research

Загружено: 2025-11-24

Просмотров: 276

Описание:

Language barriers in virtual meetings remain a persistent challenge to global collaboration. While real-time translation technologies offer a promising solution, their integration into conversational interfaces often neglects key perceptual cues. This study explores how spatial audio rendering of translated speech affects comprehension, cognitive load, and user experience in multilingual teleconferencing. We conducted a within-subjects experiment involving 8 confederates (speakers) and 47 participants (listeners) simulating global team meetings, using Wizard-of-Oz live English translations of conversations in Greek, Kannada, Mandarin Chinese, and Ukrainian—languages selected for their diversity in grammar, script, and resource availability. Participants experienced four audio conditions for the translated speech: spatial audio (aligned with the speaker’s on-screen location) with and without background reverberation, and two non-spatial configurations (diotic and monaural). We measured listener comprehension accuracy, NASA-TLX workload ratings, and satisfaction Likert scores, complemented by qualitative feedback.

Results show that participants listening to spatially-rendered translated speech were more than twice as likely to comprehend compared to non-spatial audio, and experienced a reduction in perceived listening effort of approximately 2.4%. Participants also reported greater clarity and engagement when spatial cues and voice timbre differentiation were preserved. We discuss design implications for integrating real-time translation into virtual meeting platforms, offering guidelines for delivering translated speech in ways that minimize cognitive load and improve conversational clarity. These findings advance best practices for inclusive, cross-language communication in telepresence systems.

Speaker: Margarita Geleta

Spatial Audio Rendering for Speech Live Translation

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Coauthor roundtable: Reflecting on healthcare economics, biomedical research, and medical education

Coauthor roundtable: Reflecting on healthcare economics, biomedical research, and medical education

Ideas: Community building, machine learning, and the future of AI

Ideas: Community building, machine learning, and the future of AI

Working of a Good Design - By Ar. Sangeet Sharma

Working of a Good Design - By Ar. Sangeet Sharma

The Best Professional Connectors to Explain Your Opinions in English

The Best Professional Connectors to Explain Your Opinions in English

Business English at Work - Talking to your Boss - American and British English

Business English at Work - Talking to your Boss - American and British English

Why Love Is Harder in a Second Language | Magdalena Hoeller | TED

Why Love Is Harder in a Second Language | Magdalena Hoeller | TED

The secrets of learning a new language | Lýdia Machová | TED

The secrets of learning a new language | Lýdia Machová | TED

Scaling AI Safety Across Cultures and Languages | Beyza Ermiş, Cohere | BLISS e.V.

Scaling AI Safety Across Cultures and Languages | Beyza Ermiş, Cohere | BLISS e.V.

СБОРНИК № 2 НА 1 ЧАС самых популярных мелодий пианино COLLECTION No.2 FOR 1 HOUR popular piano music

СБОРНИК № 2 НА 1 ЧАС самых популярных мелодий пианино COLLECTION No.2 FOR 1 HOUR popular piano music

Designing safe digital systems for the humanitarian sector

Designing safe digital systems for the humanitarian sector

Кембридж, на скольких языках вы говорите?

Кембридж, на скольких языках вы говорите?

Как научиться понимать беглую английскую речь? Разбираемся вместе!

Как научиться понимать беглую английскую речь? Разбираемся вместе!

[2025] Feeling Good Mix - English Deep House, Vocal House, Nu Disco | Emotional / Intimate Mood

[2025] Feeling Good Mix - English Deep House, Vocal House, Nu Disco | Emotional / Intimate Mood

Microsoft Research Forum | Season 2, Episode 2

Microsoft Research Forum | Season 2, Episode 2

КЛАССИЧЕСКАЯ МУЗЫКА ДЛЯ ВОССТАНОВЛЕНИЯ НЕРВНОЙ СИСТЕМЫ🌿 Нежная музыка успокаивает нервную систему 22

КЛАССИЧЕСКАЯ МУЗЫКА ДЛЯ ВОССТАНОВЛЕНИЯ НЕРВНОЙ СИСТЕМЫ🌿 Нежная музыка успокаивает нервную систему 22

Лукашенко обменял политзеков, ВСУ отбивают Покровск? Встреча в Берлине. Фейгин, Морозов, Филипенко

Лукашенко обменял политзеков, ВСУ отбивают Покровск? Встреча в Берлине. Фейгин, Морозов, Филипенко

Слова, которые не ранят: разговор об истинном этикете с Анной Валл

Слова, которые не ранят: разговор об истинном этикете с Анной Валл

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

🎧 Speak Like a Native – Secrets for Natural English | B1–B2 Listening Practice

🎧 Speak Like a Native – Secrets for Natural English | B1–B2 Listening Practice

⚡️ Военные США ликвидированы || Президент бьёт тревогу

⚡️ Военные США ликвидированы || Президент бьёт тревогу

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]