Рынок речевой аналитики меняется: крупным банкам больше не нужна обычная расшифровка звонков. Им требуются глубокие сигналы в речи - признаки стресса, эмоций и отклонений от сценариев. Наша заявка в программу Техлаб Москва под задачу Газпромбанка - подтверждение этого тренда.
Банки начинают искать сигналы в речи. Для нас это важный момент
Иногда хорошие рыночные сигналы приходят не через исследование, не через большую стратегическую сессию и не через длинный анализ рынка.
Иногда они приходят обычным сообщением в мессенджере.
Мне написала Софья, модератор программ Московского инновационного кластера, и пригласила принять участие в международной программе «Техлаб Москва».
Сначала это выглядело как обычное приглашение в технологическую программу.
Лучшие команды могут получить до 2 млн рублей на внедрение ИИ-решений, поработать с крупными заказчиками, выйти на коммерческие соглашения и привлечь инвестиции для масштабирования.
Я уточнил главное: если участие бесплатное, могу посмотреть.
Дальше оказалось, что это не классический акселератор, где команды идут слушать лекции, проходить трекинг и искать абстрактный рынок.
Логика другая: есть готовый запрос от крупной компании. Команда берет этот запрос и дорабатывает ИИ-решение под конкретную задачу заказчика, который уже готов смотреть в сторону внедрения.
Вот это стало интереснее.
Среди заказчиков в программе есть крупные компании. Но для нас особенно важным оказался запрос Газпромбанка.
В официальном описании трека Газпромбанк выступает партнером направления прикладного ИИ. Задача сформулирована вокруг мультимодального анализа речи: нужно распознавать аномальные эмоциональные паттерны в поведении клиента и выявлять признаки стресса, недовольства или усталости, чтобы определить дальнейший сценарий взаимодействия с человеком.
Если перевести с формального языка на нормальный, банк хочет лучше понимать, что происходит с человеком в коммуникации.
Не просто что человек сказал.
А как он это сказал.
- Есть ли признаки эмоционального напряжения.
- Есть ли стресс.
- Есть ли нестандартная реакция.
- Есть ли отклонение от нейтрального состояния.
- Можно ли по речи, тексту, паузам, темпу, интонации и структуре диалога увидеть важный сигнал раньше, чем он станет проблемой.
Для банка это понятно.
Клиенту предлагают услугу, продукт, решение. Нужно понять его реакцию не только по формальному ответу, но и по состоянию в моменте.
Менеджер работает в стрессовом сценарии. Нужно понимать, насколько он устойчив, как ведет коммуникацию, как реагирует на давление, не ломается ли в сложном диалоге.
Речь в таких задачах перестает быть просто записью звонка.
Она становится слоем сигналов.
И для нас это важный рыночный момент.
Потому что мы давно идем в сторону, где коммуникации - это не просто текст для расшифровки и не просто материал для контроля менеджеров.
- Внутри звонков есть факты.
- Есть отклонения.
- Есть повторяющиеся паттерны.
- Есть сигналы качества диалога.
- Есть признаки того, где клиент оживает, где сопротивляется, где теряет интерес, где менеджер удерживает инициативу, а где отпускает её.
И если раньше рынок чаще просил что-то более простое - расшифровать звонки, найти ошибки, сделать резюме, проверить скрипт - то сейчас формулировка становится глубже.
Крупные заказчики начинают спрашивать не только:
«Что было сказано?»
А:
«Что можно понять из коммуникации?»
Это совсем другой уровень задачи.
И здесь для нас есть окно.
Не потому что мы уже сделали готовый продукт именно под психоэмоциональные состояния.
Нет.
Мы отправили заявку честно: у нас есть работающая AI-платформа анализа речевых коммуникаций, и мы можем доработать её под банковский сценарий.
Это важная разница.
Мы не идем в такую программу с презентацией на уровне идеи.
Платформа уже работает.
Она обрабатывает реальные звонки, извлекает из них факты, сигналы, резюме, отклонения и управленческие выводы. В пиковые дни система анализирует до 30 000 звонков.
- У нас уже есть технологический контур обработки речевых данных.
- Есть опыт работы с большими массивами коммуникаций.
- Есть инфраструктура на собственных серверах.
- Есть российский контур.
- Есть возможность поднимать решение внутри закрытого контура заказчика.
А значит, задача Газпромбанка для нас выглядит не как прыжок в неизвестность, а как логичное расширение.
Сейчас платформа помогает бизнесу понять, что происходит в продажах и коммуникациях.
Следующий слой - понять, какие дополнительные сигналы можно извлекать из самой речи и поведения человека в диалоге:
- Темп.
- Паузы.
- Интонация.
- Сбивчивость.
- Резкие изменения реакции.
- Повторяющиеся эмоциональные маркеры.
- Связь между формальным текстом и тем, как человек его произносит.
Важно не уйти в опасную сторону.
Я не считаю правильным обещать, что AI будет «определять состояние человека» как окончательную истину.
Это слишком сильная и рискованная формулировка.
Правильнее говорить иначе: система может выявлять признаки и маркеры, которые требуют внимания, проверки или дальнейшей интерпретации.
Не диагноз. Не приговор. Не магическое знание человека. А сигнал.
В этом вообще много общего с тем, как мы смотрим на продажи.
- Мы не говорим, что AI знает бизнес лучше собственника.
- Мы не говорим, что модель сама найдет единственную причину провала.
- Мы не говорим, что можно заменить управленческое решение автоматическим выводом.
Мы говорим другое:
в коммуникациях уже есть много фактов, которые руками почти невозможно обработать.
Если эти факты поднять, структурировать и показать руководителю в понятной форме, у него появляется более точная картина.
- В продажах это может быть сигнал, что менеджеры не фиксируют следующий шаг.
- Что клиент часто уходит после отправки КП.
- Что возражение по цене не раскрывается.
- Что команда теряет инициативу после первого интереса.
- Что в успешных сделках повторяется один паттерн, а в проваленных - другой.
В банковском сценарии это может быть сигнал другого типа:
- клиент реагирует напряженно;
- менеджер не справляется со стрессом;
- в диалоге появляется нестандартная эмоциональная динамика;
- коммуникация требует другого сценария продолжения.
Смысл один и тот же:
не спорить на ощущениях, а поднимать сигналы из реальной коммуникации.
Поэтому заявка в «Техлаб Москва» для меня не просто история про грант.
Да, до 2 млн рублей на внедрение - это полезно.
Но главный смысл не в этом.
Главный смысл в том, что крупный банк формулирует задачу очень близко к направлению, в которое мы уже движемся.
Рынок начинает смотреть на речь шире:
- Не как на архив звонков.
- Не как на источник текстовой расшифровки.
- Не как на материал для ручного контроля.
А как на слой данных, из которого можно доставать управленческие, поведенческие и клиентские сигналы.
Для нас это подтверждение направления.
И одновременно шанс сильнее завестись в корпоративный и банковский контур.
Такие возможности нельзя просто наблюдать со стороны.
Если появляется официальный запрос от крупного заказчика, который совпадает с тем, что ты строишь, нужно откликаться.
- Даже если задача шире текущей версии продукта.
- Даже если придется дорабатывать методологию.
- Даже если потребуется отдельная адаптация под безопасность, данные, закрытый контур и требования банка.
Потому что именно так продукт взрослеет.
- Не в вакууме.
- Не в презентациях.
- Не в рассуждениях о рынке.
А через реальные задачи крупных заказчиков.
Мы отправили заявку.
Подали её не как «давайте мы с нуля что-нибудь исследуем», а как доработку уже работающей AI-платформы под конкретный банковский сценарий.
Если коротко, наш заход такой:
- у нас уже есть платформа анализа речевых коммуникаций;
- она работает на реальной нагрузке;
- она развернута в российском контуре;
- она может быть поднята внутри закрытого контура заказчика;
- мы умеем извлекать из звонков факты, сигналы, отклонения и управленческие выводы;
- теперь хотим расширить этот слой на признаки эмоционального напряжения, стресса и нестандартных реакций в речи.
Посмотрим, что получится.
Но сам факт этого запроса для меня уже важен.
Банки начинают искать более глубокую аналитику речи.
Мы здесь.
И если крупным компаниям нужны пилоты на больших массивах звонков, в закрытом контуре и с понятной прикладной задачей - мы готовы разговаривать.
FAQ
Что такое мультимодальный анализ речи?
Это анализ коммуникации не по одному источнику сигнала, а по нескольким слоям: аудио, текстовой расшифровке, темпу, паузам, интонации, структуре диалога и реакции человека на вопросы или предложения.
Чем такая задача отличается от обычной транскрибации звонков?
Транскрибация отвечает на вопрос «что было сказано». Более глубокая речевая аналитика пытается понять, какие сигналы есть в самой коммуникации: напряжение, сбивчивость, нестандартная реакция, потеря инициативы, изменение тона или другие признаки, которые могут быть важны для следующего сценария взаимодействия.
Почему это важно для банков?
В банковских сценариях коммуникация часто связана с доверием, риском, стрессом, финансовым решением и работой менеджера под давлением. Поэтому банку важно видеть не только формальный ответ клиента, но и признаки его реакции в моменте.
Что уже есть у платформы «Дожми Продажи»?
Платформа уже анализирует реальные звонки, извлекает из них факты, сигналы, резюме, отклонения и управленческие выводы. В пиковые дни система обрабатывает до 30 000 звонков.
Можно ли развернуть решение в закрытом контуре?
Да. У платформы есть российский контур, собственная серверная инфраструктура и возможность развёртывания внутри закрытого контура заказчика с учётом требований к безопасности и обработке данных.