🚀 Обзор приложения

Gemini Live — реал-тайм общение с ИИ-ассистентом Google Gemini через голос, видео и текст.

🎤

Голосовой ввод

Говорите напрямую в микрофон, ассистент расшифрует вашу речь

🎥

Видео-трансляция

Поделитесь тем, что видит ваша камера, с ассистентом

💬

Текстовый ввод

Введите текст в поле для отправки сообщения

🔊

Голосовой ответ

Слушайте ответы ассистента с красивым голосом

Быстрый старт

  1. Откройте приложение и войдите с логином и паролем
  2. Разрешите доступ к микрофону при первом использовании
  3. Нажмите кнопку микрофона и начните говорить
  4. Ассистент ответит голосом и текстом в чате

🎮 Управление интерфейсом

Основные кнопки управления и их горячие клавиши.

🎤 Микрофон
Включает/выключает запись голоса. Нажмите ещё раз — остановится.
M
🎥 Камера
Включает/выключает трансляцию с веб-камеры. На мобильных с несколькими камерами появляется кнопка переключения.
V
💬 Поле ввода текста
Введите текстовое сообщение и нажмите Enter для отправки.
Enter — отправить
⏹️ Стоп / новая сессия
Прерывает текущий разговор. Для нового чата нажмите «+» в сайдбаре.
Escape

Индикаторы состояния

СтатусЗначение
🟢 OnlineСоединение установлено, можно говорить
🟡 Подключение…Установка WebSocket-соединения
🔴 OfflineСоединение разорвано, автоматическое переподключение

✨ Возможности и функции

Полный список того, что умеет приложение.

🎙️ Голосовое взаимодействие

  • Автоматическое распознавание речи в реальном времени
  • Синтез речи с ирландским акцентом (голос Puck)
  • Отображение транскрипции пользователя и ассистента
  • Очистка транскрипции от латинских артефактов через Mistral

📹 Видео-функции

  • Трансляция с фронтальной или задней камеры
  • Кнопка переключения камер (если устройство поддерживает)
  • Прямой анализ видео ассистентом в реальном времени

💭 Память и контекст

  • Персональная память пользователя (обновляется ИИ автоматически)
  • История сессий с авто-саммаризацией при отключении
  • 3 слоя контекста: профиль → саммари → последние 10 сообщений
  • Сайдбар с историей разговоров — переключайтесь между темами

🔧 Технические возможности

  • WebSocket для минимальной задержки
  • Автоматический реконнект при потере соединения
  • JWT-авторизация — пароль передаётся только при входе
  • Двусторонний переводчик на отдельной странице

🌐 Переводчик

Отдельный режим для двустороннего синхронного перевода между русским и иностранным языком в реальном времени. Доступен по адресу /translator или кнопкой 🌐 в основном интерфейсе.

Доступные языки

ФлагЯзыкПара перевода
🇬🇧EnglishРусский ↔ Английский
🇩🇪DeutschРусский ↔ Немецкий
🇮🇹ItalianoРусский ↔ Итальянский
🇵🇱PolskiРусский ↔ Польский

Как начать

  1. Откройте /translator или нажмите кнопку 🌐 в основном интерфейсе
  2. Выберите иностранный язык на экране входа
  3. Введите логин и пароль, нажмите «Войти»
  4. Смена языка в шапке — реконнект происходит автоматически

Интерфейс переводчика

Экран разделён на две колонки:

🇺🇦

Левая колонка — Русский

Речь русскоязычного участника и перевод с иностранного

🇬🇧

Правая колонка — Иностранный

Речь иностранного участника и перевод с русского

Три режима микрофона

🎤 Центральная кнопка — авто-определение языка
Расположена на линии раздела между колонками. Переводчик сам определяет говорящего: кириллица → русская колонка, латиница → иностранная. Нажмите повторно — выключить.
🎤 Кнопка в заголовке левой колонки — принудительно русский
Фиксирует русский язык вне зависимости от произношения. Полезно когда авто-определение ошибается. Центральная кнопка тускнеет при активации.
🎤 Кнопка в заголовке правой колонки — принудительно иностранный
Фиксирует иностранного говорящего. Полезно для польского и других языков с неоднозначной транскрипцией.
Переключение режимов Нажатие на активную колонную кнопку выключает её. Между режимами можно переключаться в любой момент.

Особенности работы

  • Переводчик не сохраняет историю разговоров в базе данных
  • Транскрипция русской речи автоматически очищается от латинских артефактов
  • При смене языка в шапке история очищается и сессия перезапускается
  • Переводчик понимает только два языка пары — на третьем скажет «Повторите, пожалуйста»
⚠️ Квота API исчерпана Если видите «⚠️ Квота API исчерпана» — подождите ~30 секунд, переводчик переподключится автоматически. Это ограничение бесплатного плана Google.

❓ Часто задаваемые вопросы

Почему я не слышу ответы?
Проверьте: громкость в браузере, разрешение автовоспроизведения звука, не заглушены ли вкладки.
Как разрешить доступ к микрофону?
Нажмите на иконку замка 🔒 в адресной строке → «Разрешения» → Микрофон → «Разрешить». Перезагрузите страницу.
Может ли ассистент видеть мою камеру?
Да — когда камера включена, видеопоток передаётся ассистенту в реальном времени для анализа.
Камера не переключается на мобильном Chrome
Это ограничение Chrome Android. При ошибке переключения появится кнопка с адресом сайта для перехода в другой браузер (Firefox, Safari).
Безопасны ли мои данные?
Данные передаются по зашифрованному соединению (HTTPS + WSS). JWT-токен не содержит пароль. Пароль передаётся только один раз при входе.
Сессия истекла — просит войти заново
JWT-токен действует 7 дней. Введите логин и пароль повторно.

🔧 Решение проблем

Ошибка подключения / Offline Проверьте что сервер запущен. Перезагрузите страницу (Ctrl+Shift+R). Проверьте консоль браузера (F12 → Console).
Ассистент не отвечает — API ошибка Возможно исчерпана квота Google API. Подождите несколько минут. Приложение переподключится автоматически.
Плохое качество распознавания речи Говорите чётко, близко к микрофону. Снизьте фоновый шум. Проверьте уровень громкости микрофона в системе.
Видео не отправляется Проверьте разрешения браузера. Убедитесь что камера не занята другим приложением. Попробуйте другой браузер.
Диагностика WebSocket F12 → Network → фильтр WS → найдите соединение /ws — смотрите сообщения в реальном времени.

⌨️ Горячие клавиши

КлавишаДействие
MВключить/выключить микрофон
VВключить/выключить камеру
EnterОтправить текстовое сообщение
EscapeОстановить разговор
Ctrl+Shift+RЖёсткая перезагрузка страницы
F12Открыть DevTools (диагностика)
Совет Горячие клавиши работают только когда фокус не в поле ввода текста.