Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Gemma 3n First Look & LOCAL Chatbot Demo (TTS, Vision, Roleplay)

Автор: Bijan Bowen

Загружено: 2025-06-27

Просмотров: 24015

Описание:

Timestamps:

00:00 - Intro
01:26 - Technical First Look
03:48 - Giving It A Voice
04:17 - React App Chatbot Demo
07:18 - GGUF Mentions
07:57 - Multimodal Testing
09:20 - Thoughts RE Omni Models
10:45 - Real Image Testing
12:45 - Refusal Testing
14:37 - Roleplay Testing
16:00 - Translation Testing
16:54 - More RP Testing
18:40 - Script Overview
25:45 - Offline TTS Tips
26:14 - Closing Thoughts

AI Consulting: https://bijanbowen.com
Discord:   / discord  

In this video, we take a look at Gemma3n, a newly released native multimodal model from Google DeepMind. Originally built for edge devices like phones, it’s now available on Hugging Face and can be run locally on a variety of systems using multiple backends.

We start with a brief technical overview of the model, then show how to integrate it with TTS (text-to-speech) to give it a voice — allowing the model to listen, respond, and speak, fully offline. We demo a simple chatbot using a React front end and walk through speech pipeline scripts, covering both the GGUF mention and the backend options.

In the second half, we explore the multimodal image capabilities, test image understanding, translation, refusal handling, and even a few rounds of roleplay to see how the model behaves with character prompts.

HF Repo: https://huggingface.co/google/gemma-3...

Github For React App: https://github.com/OminousIndustries/...

Gemma 3n First Look & LOCAL Chatbot Demo (TTS, Vision, Roleplay)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Qwen3 TTS First Look & Testing – A LOCAL Model For Voice Cloning and TTS!

Qwen3 TTS First Look & Testing – A LOCAL Model For Voice Cloning and TTS!

Google Gemma 3 270M First Test - Is This The SMALLEST Usable LLM?

Google Gemma 3 270M First Test - Is This The SMALLEST Usable LLM?

GLM-4.7 Flash In OpenCode Is an Agentic Coding BEAST!

GLM-4.7 Flash In OpenCode Is an Agentic Coding BEAST!

OpenAI сломался… как и все остальные.

OpenAI сломался… как и все остальные.

Gemma 3n E4B Multimodal Model Test w/ PyQt6 GUI and Gemini CLI

Gemma 3n E4B Multimodal Model Test w/ PyQt6 GUI and Gemini CLI

Qwen3 VL 30B First Look & Testing – The Most Powerful LOCAL Vision Model!

Qwen3 VL 30B First Look & Testing – The Most Powerful LOCAL Vision Model!

КЛОНИРОВАНИЕ ГОЛОСА БЕСПЛАТНО! НОВАЯ МОДЕЛЬ CosyVoice 3 в ComfyUI ЛОКАЛЬНО, ЛУЧШАЯ СВЯЗКА!

КЛОНИРОВАНИЕ ГОЛОСА БЕСПЛАТНО! НОВАЯ МОДЕЛЬ CosyVoice 3 в ComfyUI ЛОКАЛЬНО, ЛУЧШАЯ СВЯЗКА!

Я УДАЛИЛ Claude Code – Вот, что я использую сейчаc

Я УДАЛИЛ Claude Code – Вот, что я использую сейчаc

MedGemma - An Open Doctor Model?

MedGemma - An Open Doctor Model?

LiquidAI LFM2.5 Models Tested – Micro Vision and Speech-to-Speech!

LiquidAI LFM2.5 Models Tested – Micro Vision and Speech-to-Speech!

ОБЫЧНЫЙ VPN УМЕР: Чем обходить блокировки в 2026

ОБЫЧНЫЙ VPN УМЕР: Чем обходить блокировки в 2026

25 Things You Didn't Know ChatGPT Could Do

25 Things You Didn't Know ChatGPT Could Do

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Как я автоматизировал NotebookLM с помощью Claude Code и Telegram

Как я автоматизировал NotebookLM с помощью Claude Code и Telegram

GLM-4.7 Flash Is INSANE – Is This the BEST Local Coding Model?

GLM-4.7 Flash Is INSANE – Is This the BEST Local Coding Model?

Conversation with Elon Musk | World Economic Forum Annual Meeting 2026

Conversation with Elon Musk | World Economic Forum Annual Meeting 2026

Gemma 3n may be GAME CHANGING

Gemma 3n may be GAME CHANGING

Gemini 3 заставил меня пересмотреть использование ChatGPT

Gemini 3 заставил меня пересмотреть использование ChatGPT

Лучшие приложения для разработки на Linux в 2026 году

Лучшие приложения для разработки на Linux в 2026 году

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com