ИИ-копайлот для звонков (VoiceCoPilot): подсказки в реальном времени в браузере
Веб-приложение слушает разговор, распознаёт речь через Whisper, за 2 секунды выдаёт подсказку что сказать. Скрипты продаж и база знаний в контексте.
- 2 сек Подсказка от ИИ
- реальное время Транскрипт и суфлёр
- браузер Без установок
Проблема
В молодом отделе продаж — отсутствие знания продукта, ответы не по скрипту, слабая отработка возражений. Нужен был ИИ-помощник для личного использования: слушает разговор в реальном времени, понимает контекст и мгновенно предлагает, что сказать дальше.
Решение
Создан VoiceCoPilot — браузерное приложение. Открыли ссылку, дали доступ к микрофону, при необходимости включили захват звука окна (чтобы слышать собеседника). Речь распознаётся через Whisper, транскрипт на экране; по кнопке за ~2 секунды Gemini даёт подсказку, что ответить. Редактирование транскрипта на лету (исправление ошибок распознавания учитывается в подсказках). В проект загружаются файлы (PDF, DOCX) с регламентами и скриптами — ИИ опирается на них. Умная память по последним подсказкам без повторов. Два режима распознавания: браузер (Web Speech API) или сервер (Whisper). S3 для файлов, проекты с токенами, автосохранение транскриптов в БД.
Результат
Копайлот из браузера: без установок, ссылка и микрофон. Реальное время, подсказки за 2 секунды, контекст из своих файлов. Подходит продажникам, саппорту, переговорщикам, HR.
Стек
React, FastAPI, Whisper, OpenRouter (Gemini), PostgreSQL, WebSockets.
Нужен такой копайлот под свои скрипты и базу знаний? Напиши.
Любой звонок превращается в разговор с суфлёром: реальное время, редактирование транскрипта на лету, контекст проекта из загруженных файлов.