Голосовые в текст: 40 войсов в день без потери времени
Бот перехватывает аудио в чате, Whisper транскрибирует, AI чистит мусор — результат текстом. PM вернул 10 часов в неделю.
- −100 мин/день Время на войсы
- 10 ч/нед Вернули клиенту
- 1 вечер Сборка связки
Проблема
Клиент (PM) получал по 40 голосовых в день от разрабов, маркетинга, саппорта. Два часа рабочего времени ежедневно уходило на прослушивание дыхания и пауз. Выловить смысл в потоке сознания — отдельная работа.
Решение
Собрал связку на n8n за вечер: бот перехватывает аудиофайл в любом чате → Whisper (OpenAI) транскрибирует звук в текст → AI чистит словесный мусор («типа», «эээ», «как бы») и оставляет сухие факты → результат прилетает текстом.
Результат
Было: 40 войсов = 120 минут страданий. Стало: скан глазами по диагонали = 20 минут. Клиенту вернули 10 часов в неделю — целый рабочий день. Автоматизация как уважение к своему времени.
Стек
Telegram-бот, n8n, OpenAI (Whisper), доочистка текста через AI.
Хочешь такой же контур под свои чаты? Напиши — обсудим.
Было: 40 войсов = 120 минут. Стало: скан глазами = 20 минут. Высвобождено 10 часов в неделю.