🚀 Обзор приложения
Gemini Live — реал-тайм общение с ИИ-ассистентом Google Gemini через голос, видео и текст.
Голосовой ввод
Говорите напрямую в микрофон, ассистент расшифрует вашу речь
Видео-трансляция
Поделитесь тем, что видит ваша камера, с ассистентом
Текстовый ввод
Введите текст в поле для отправки сообщения
Голосовой ответ
Слушайте ответы ассистента с красивым голосом
Быстрый старт
- Откройте приложение и войдите с логином и паролем
- Разрешите доступ к микрофону при первом использовании
- Нажмите кнопку микрофона и начните говорить
- Ассистент ответит голосом и текстом в чате
🎮 Управление интерфейсом
Основные кнопки управления и их горячие клавиши.
🎤 Микрофон
Включает/выключает запись голоса. Нажмите ещё раз — остановится.
M
🎥 Камера
Включает/выключает трансляцию с веб-камеры. На мобильных с несколькими камерами появляется кнопка переключения.
V
💬 Поле ввода текста
Введите текстовое сообщение и нажмите Enter для отправки.
Enter — отправить
⏹️ Стоп / новая сессия
Прерывает текущий разговор. Для нового чата нажмите «+» в сайдбаре.
Escape
Индикаторы состояния
| Статус | Значение |
|---|---|
| 🟢 Online | Соединение установлено, можно говорить |
| 🟡 Подключение… | Установка WebSocket-соединения |
| 🔴 Offline | Соединение разорвано, автоматическое переподключение |
✨ Возможности и функции
Полный список того, что умеет приложение.
🎙️ Голосовое взаимодействие
- Автоматическое распознавание речи в реальном времени
- Синтез речи с ирландским акцентом (голос Puck)
- Отображение транскрипции пользователя и ассистента
- Очистка транскрипции от латинских артефактов через Mistral
📹 Видео-функции
- Трансляция с фронтальной или задней камеры
- Кнопка переключения камер (если устройство поддерживает)
- Прямой анализ видео ассистентом в реальном времени
💭 Память и контекст
- Персональная память пользователя (обновляется ИИ автоматически)
- История сессий с авто-саммаризацией при отключении
- 3 слоя контекста: профиль → саммари → последние 10 сообщений
- Сайдбар с историей разговоров — переключайтесь между темами
🔧 Технические возможности
- WebSocket для минимальной задержки
- Автоматический реконнект при потере соединения
- JWT-авторизация — пароль передаётся только при входе
- Двусторонний переводчик на отдельной странице
🌐 Переводчик
Отдельный режим для двустороннего синхронного перевода между русским и иностранным языком в реальном времени. Доступен по адресу /translator или кнопкой 🌐 в основном интерфейсе.
Доступные языки
| Флаг | Язык | Пара перевода |
|---|---|---|
| 🇬🇧 | English | Русский ↔ Английский |
| 🇩🇪 | Deutsch | Русский ↔ Немецкий |
| 🇮🇹 | Italiano | Русский ↔ Итальянский |
| 🇵🇱 | Polski | Русский ↔ Польский |
Как начать
- Откройте
/translatorили нажмите кнопку 🌐 в основном интерфейсе - Выберите иностранный язык на экране входа
- Введите логин и пароль, нажмите «Войти»
- Смена языка в шапке — реконнект происходит автоматически
Интерфейс переводчика
Экран разделён на две колонки:
Левая колонка — Русский
Речь русскоязычного участника и перевод с иностранного
Правая колонка — Иностранный
Речь иностранного участника и перевод с русского
Три режима микрофона
🎤 Центральная кнопка — авто-определение языка
Расположена на линии раздела между колонками. Переводчик сам определяет говорящего: кириллица → русская колонка, латиница → иностранная. Нажмите повторно — выключить.
🎤 Кнопка в заголовке левой колонки — принудительно русский
Фиксирует русский язык вне зависимости от произношения. Полезно когда авто-определение ошибается. Центральная кнопка тускнеет при активации.
🎤 Кнопка в заголовке правой колонки — принудительно иностранный
Фиксирует иностранного говорящего. Полезно для польского и других языков с неоднозначной транскрипцией.
Переключение режимов
Нажатие на активную колонную кнопку выключает её. Между режимами можно переключаться в любой момент.
Особенности работы
- Переводчик не сохраняет историю разговоров в базе данных
- Транскрипция русской речи автоматически очищается от латинских артефактов
- При смене языка в шапке история очищается и сессия перезапускается
- Переводчик понимает только два языка пары — на третьем скажет «Повторите, пожалуйста»
⚠️ Квота API исчерпана
Если видите «⚠️ Квота API исчерпана» — подождите ~30 секунд, переводчик переподключится автоматически. Это ограничение бесплатного плана Google.
❓ Часто задаваемые вопросы
Почему я не слышу ответы?
Проверьте: громкость в браузере, разрешение автовоспроизведения звука, не заглушены ли вкладки.
Как разрешить доступ к микрофону?
Нажмите на иконку замка 🔒 в адресной строке → «Разрешения» → Микрофон → «Разрешить». Перезагрузите страницу.
Может ли ассистент видеть мою камеру?
Да — когда камера включена, видеопоток передаётся ассистенту в реальном времени для анализа.
Камера не переключается на мобильном Chrome
Это ограничение Chrome Android. При ошибке переключения появится кнопка с адресом сайта для перехода в другой браузер (Firefox, Safari).
Безопасны ли мои данные?
Данные передаются по зашифрованному соединению (HTTPS + WSS). JWT-токен не содержит пароль. Пароль передаётся только один раз при входе.
Сессия истекла — просит войти заново
JWT-токен действует 7 дней. Введите логин и пароль повторно.
🔧 Решение проблем
Ошибка подключения / Offline
Проверьте что сервер запущен. Перезагрузите страницу (Ctrl+Shift+R). Проверьте консоль браузера (F12 → Console).
Ассистент не отвечает — API ошибка
Возможно исчерпана квота Google API. Подождите несколько минут. Приложение переподключится автоматически.
Плохое качество распознавания речи
Говорите чётко, близко к микрофону. Снизьте фоновый шум. Проверьте уровень громкости микрофона в системе.
Видео не отправляется
Проверьте разрешения браузера. Убедитесь что камера не занята другим приложением. Попробуйте другой браузер.
Диагностика WebSocket
F12 → Network → фильтр WS → найдите соединение /ws — смотрите сообщения в реальном времени.
⌨️ Горячие клавиши
| Клавиша | Действие |
|---|---|
M | Включить/выключить микрофон |
V | Включить/выключить камеру |
Enter | Отправить текстовое сообщение |
Escape | Остановить разговор |
Ctrl+Shift+R | Жёсткая перезагрузка страницы |
F12 | Открыть DevTools (диагностика) |
Совет
Горячие клавиши работают только когда фокус не в поле ввода текста.