Схематичный меловой рисунок на черной доске, показывающий разбор звонка: от обычной расшифровки к извлечению сигналов (паузы, темп, интонации, эмоции) для анализа речи клиента.

Банки начинают искать сигналы в речи. Для нас это важный момент

Денис Логинов
7 мин чтения
Если, в двух словах ...

Рынок речевой аналитики меняется: крупным банкам больше не нужна обычная расшифровка звонков. Им требуются глубокие сигналы в речи - признаки стресса, эмоций и отклонений от сценариев. Наша заявка в программу Техлаб Москва под задачу Газпромбанка - подтверждение этого тренда.

Банки начинают искать сигналы в речи. Для нас это важный момент

Иногда хорошие рыночные сигналы приходят не через исследование, не через большую стратегическую сессию и не через длинный анализ рынка.

Иногда они приходят обычным сообщением в мессенджере.

Мне написала Софья, модератор программ Московского инновационного кластера, и пригласила принять участие в международной программе «Техлаб Москва».

Сначала это выглядело как обычное приглашение в технологическую программу.

Лучшие команды могут получить до 2 млн рублей на внедрение ИИ-решений, поработать с крупными заказчиками, выйти на коммерческие соглашения и привлечь инвестиции для масштабирования.

Я уточнил главное: если участие бесплатное, могу посмотреть.

Дальше оказалось, что это не классический акселератор, где команды идут слушать лекции, проходить трекинг и искать абстрактный рынок.

Логика другая: есть готовый запрос от крупной компании. Команда берет этот запрос и дорабатывает ИИ-решение под конкретную задачу заказчика, который уже готов смотреть в сторону внедрения.

Вот это стало интереснее.

Среди заказчиков в программе есть крупные компании. Но для нас особенно важным оказался запрос Газпромбанка.

В официальном описании трека Газпромбанк выступает партнером направления прикладного ИИ. Задача сформулирована вокруг мультимодального анализа речи: нужно распознавать аномальные эмоциональные паттерны в поведении клиента и выявлять признаки стресса, недовольства или усталости, чтобы определить дальнейший сценарий взаимодействия с человеком.

Если перевести с формального языка на нормальный, банк хочет лучше понимать, что происходит с человеком в коммуникации.

Не просто что человек сказал.

А как он это сказал.

  • Есть ли признаки эмоционального напряжения.
  • Есть ли стресс.
  • Есть ли нестандартная реакция.
  • Есть ли отклонение от нейтрального состояния.
  • Можно ли по речи, тексту, паузам, темпу, интонации и структуре диалога увидеть важный сигнал раньше, чем он станет проблемой.

Для банка это понятно.

Клиенту предлагают услугу, продукт, решение. Нужно понять его реакцию не только по формальному ответу, но и по состоянию в моменте.

Менеджер работает в стрессовом сценарии. Нужно понимать, насколько он устойчив, как ведет коммуникацию, как реагирует на давление, не ломается ли в сложном диалоге.

Речь в таких задачах перестает быть просто записью звонка.

Она становится слоем сигналов.

И для нас это важный рыночный момент.

Потому что мы давно идем в сторону, где коммуникации - это не просто текст для расшифровки и не просто материал для контроля менеджеров.

  • Внутри звонков есть факты.
  • Есть отклонения.
  • Есть повторяющиеся паттерны.
  • Есть сигналы качества диалога.
  • Есть признаки того, где клиент оживает, где сопротивляется, где теряет интерес, где менеджер удерживает инициативу, а где отпускает её.

И если раньше рынок чаще просил что-то более простое - расшифровать звонки, найти ошибки, сделать резюме, проверить скрипт - то сейчас формулировка становится глубже.

Крупные заказчики начинают спрашивать не только:

«Что было сказано?»

А:

«Что можно понять из коммуникации?»

Это совсем другой уровень задачи.

И здесь для нас есть окно.

Не потому что мы уже сделали готовый продукт именно под психоэмоциональные состояния.

Нет.

Мы отправили заявку честно: у нас есть работающая AI-платформа анализа речевых коммуникаций, и мы можем доработать её под банковский сценарий.

Это важная разница.

Мы не идем в такую программу с презентацией на уровне идеи.

Платформа уже работает.

Она обрабатывает реальные звонки, извлекает из них факты, сигналы, резюме, отклонения и управленческие выводы. В пиковые дни система анализирует до 30 000 звонков.

  • У нас уже есть технологический контур обработки речевых данных.
  • Есть опыт работы с большими массивами коммуникаций.
  • Есть инфраструктура на собственных серверах.
  • Есть российский контур.
  • Есть возможность поднимать решение внутри закрытого контура заказчика.

А значит, задача Газпромбанка для нас выглядит не как прыжок в неизвестность, а как логичное расширение.

Сейчас платформа помогает бизнесу понять, что происходит в продажах и коммуникациях.

Следующий слой - понять, какие дополнительные сигналы можно извлекать из самой речи и поведения человека в диалоге:

  • Темп.
  • Паузы.
  • Интонация.
  • Сбивчивость.
  • Резкие изменения реакции.
  • Повторяющиеся эмоциональные маркеры.
  • Связь между формальным текстом и тем, как человек его произносит.

Важно не уйти в опасную сторону.

Я не считаю правильным обещать, что AI будет «определять состояние человека» как окончательную истину.

Это слишком сильная и рискованная формулировка.

Правильнее говорить иначе: система может выявлять признаки и маркеры, которые требуют внимания, проверки или дальнейшей интерпретации.

Не диагноз. Не приговор. Не магическое знание человека. А сигнал.

В этом вообще много общего с тем, как мы смотрим на продажи.

  • Мы не говорим, что AI знает бизнес лучше собственника.
  • Мы не говорим, что модель сама найдет единственную причину провала.
  • Мы не говорим, что можно заменить управленческое решение автоматическим выводом.

Мы говорим другое:

в коммуникациях уже есть много фактов, которые руками почти невозможно обработать.

Если эти факты поднять, структурировать и показать руководителю в понятной форме, у него появляется более точная картина.

  • В продажах это может быть сигнал, что менеджеры не фиксируют следующий шаг.
  • Что клиент часто уходит после отправки КП.
  • Что возражение по цене не раскрывается.
  • Что команда теряет инициативу после первого интереса.
  • Что в успешных сделках повторяется один паттерн, а в проваленных - другой.

В банковском сценарии это может быть сигнал другого типа:

  • клиент реагирует напряженно;
  • менеджер не справляется со стрессом;
  • в диалоге появляется нестандартная эмоциональная динамика;
  • коммуникация требует другого сценария продолжения.

Смысл один и тот же:

не спорить на ощущениях, а поднимать сигналы из реальной коммуникации.

Поэтому заявка в «Техлаб Москва» для меня не просто история про грант.

Да, до 2 млн рублей на внедрение - это полезно.

Но главный смысл не в этом.

Главный смысл в том, что крупный банк формулирует задачу очень близко к направлению, в которое мы уже движемся.

Рынок начинает смотреть на речь шире:

  • Не как на архив звонков.
  • Не как на источник текстовой расшифровки.
  • Не как на материал для ручного контроля.

А как на слой данных, из которого можно доставать управленческие, поведенческие и клиентские сигналы.

Для нас это подтверждение направления.

И одновременно шанс сильнее завестись в корпоративный и банковский контур.

Такие возможности нельзя просто наблюдать со стороны.

Если появляется официальный запрос от крупного заказчика, который совпадает с тем, что ты строишь, нужно откликаться.

  • Даже если задача шире текущей версии продукта.
  • Даже если придется дорабатывать методологию.
  • Даже если потребуется отдельная адаптация под безопасность, данные, закрытый контур и требования банка.

Потому что именно так продукт взрослеет.

  • Не в вакууме.
  • Не в презентациях.
  • Не в рассуждениях о рынке.

А через реальные задачи крупных заказчиков.

Мы отправили заявку.

Подали её не как «давайте мы с нуля что-нибудь исследуем», а как доработку уже работающей AI-платформы под конкретный банковский сценарий.

Если коротко, наш заход такой:

  • у нас уже есть платформа анализа речевых коммуникаций;
  • она работает на реальной нагрузке;
  • она развернута в российском контуре;
  • она может быть поднята внутри закрытого контура заказчика;
  • мы умеем извлекать из звонков факты, сигналы, отклонения и управленческие выводы;
  • теперь хотим расширить этот слой на признаки эмоционального напряжения, стресса и нестандартных реакций в речи.

Посмотрим, что получится.

Но сам факт этого запроса для меня уже важен.

Банки начинают искать более глубокую аналитику речи.

Мы здесь.

И если крупным компаниям нужны пилоты на больших массивах звонков, в закрытом контуре и с понятной прикладной задачей - мы готовы разговаривать.

FAQ

Что такое мультимодальный анализ речи?

Это анализ коммуникации не по одному источнику сигнала, а по нескольким слоям: аудио, текстовой расшифровке, темпу, паузам, интонации, структуре диалога и реакции человека на вопросы или предложения.

Чем такая задача отличается от обычной транскрибации звонков?

Транскрибация отвечает на вопрос «что было сказано». Более глубокая речевая аналитика пытается понять, какие сигналы есть в самой коммуникации: напряжение, сбивчивость, нестандартная реакция, потеря инициативы, изменение тона или другие признаки, которые могут быть важны для следующего сценария взаимодействия.

Почему это важно для банков?

В банковских сценариях коммуникация часто связана с доверием, риском, стрессом, финансовым решением и работой менеджера под давлением. Поэтому банку важно видеть не только формальный ответ клиента, но и признаки его реакции в моменте.

Что уже есть у платформы «Дожми Продажи»?

Платформа уже анализирует реальные звонки, извлекает из них факты, сигналы, резюме, отклонения и управленческие выводы. В пиковые дни система обрабатывает до 30 000 звонков.

Можно ли развернуть решение в закрытом контуре?

Да. У платформы есть российский контур, собственная серверная инфраструктура и возможность развёртывания внутри закрытого контура заказчика с учётом требований к безопасности и обработке данных.