Кейсы
Автоматизация

Голосовые в текст: 40 войсов в день без потери времени

Бот перехватывает аудио в чате, Whisper транскрибирует, AI чистит мусор — результат текстом. PM вернул 10 часов в неделю.

Срок 1 вечер
Стек Telegram · n8n · OpenAI · Whisper
Результат Было: 40 войсов = 120 минут. Стало: скан глазами = 20 минут. Высвобождено 10 часов в неделю.
  • 120 мин/день 20 мин/день
    Время на войсы
  • уходит на прослушивание 10 ч/нед вернулись
    Время PM
  • слушать по одному 40 в день текстом
    Поток войсов

Проблема

Клиент — проектный менеджер — получал по 40 голосовых в день от разрабов, маркетинга и саппорта. Два часа рабочего времени ежедневно уходило на прослушивание дыхания, пауз и потока сознания. Пятиминутный войс ради одного факта. Десять войсов подряд без возможности перемотать к сути.

Хуже того: контекст терялся. После 20-го войса забывалось, что было в пятом. Важные задачи проваливались, потому что PM физически не успевал переварить весь входящий поток.

Решение

Собрал связку на n8n за один вечер. Четыре шага:

  1. Перехват — бот ловит аудиофайл в любом чате Telegram (личка, группа, канал).
  2. Транскрипция — Whisper (OpenAI) превращает звук в сырой текст с точностью 95%+.
  3. Очистка — AI убирает словесный мусор: «типа», «эээ», «как бы», «ну вот», повторы, незаконченные мысли. Оставляет сухие факты и задачи.
  4. Доставка — чистый текст прилетает ответом в тот же чат. Можно сканировать глазами за 30 секунд вместо 5 минут прослушивания.

Вся связка работает на n8n, деплой на VPS, никаких внешних сервисов кроме OpenAI.

Результат

Было: 40 войсов = 120 минут страданий. Стало: скан текста глазами = 20 минут. Клиенту вернули 10 часов в неделю — целый рабочий день. Ни один факт не теряется: текст можно поискать, скопировать, переслать.


Тонете в войсах? Напишите — соберу автоматизацию под ваш чат.

Технологии Telegram n8n OpenAI Whisper
Итог

Было: 40 войсов = 120 минут. Стало: скан глазами = 20 минут. Высвобождено 10 часов в неделю.

Следующий кейс

ИИ-юрист: анализ 15 условий и сборка КП за секунды

Первый агент на базе GPTs — автоматизация юридического анализа и подготовка коммерческого предложения по регистрации недвижимости.