Event Intelligence · модуль 01

Транскрибация деловых мероприятий

Автоматическая расшифровка конференций, форумов и корпоративных мероприятий. Русская экспертная речь, разделение по спикерам, WER 4–6%. Данные не покидают ваш контур.

Запросить demo-прогон ← Все модули

On-premise

152-ФЗ

WER 4–6%

Русский язык

01 / проблема

Почему стандартные подходы не работают
на деловых мероприятиях

Ручная расшифровка - это недели работы

Двухдневный форум с 20 параллельными треками - это 300–500 часов аудио. Ни одна команда стенографистов не справится за приемлемые деньги и сроки. В итоге расшифровывается 10–15% контента, остальное теряется.

Облачные сервисы не понимают экспертный русский

Otter, Fireflies, Google Speech - обучены на бытовой речи. Термины из госуправления, финансов, промышленности они транскрибируют с WER 25–40%. Каждую запись нужно перечитывать и исправлять вручную.

Чувствительный контент нельзя отдавать в облако

Закрытые сессии, стратегические обсуждения, персональные данные участников - это все уходит на зарубежные серверы. Для госзаказчиков и крупных корпораций это неприемлемо.

Транскрипт без структуры бесполезен

Сырой текст без разметки спикеров, без таймкодов, без привязки к программе мероприятия - не управленческий артефакт. Это просто файл, который никто не читает.

02 / процесс

От аудио до структурированного текста
за 8–12 минут на час записи

Захват

Подключение к многоканальному аудио. Поддержка прямого потока (RTMP/SRT) и файлов после мероприятия.

Multi-channel audio

MP4 / WAV / MKV

Распознавание

GigaAM или Whisper large-v3 распознают русскую экспертную речь. WER 4–6% на отраслевой лексике.

GigaAM / Whisper v3

WER 4–6%

Диаризация

pyannote-audio разделяет спикеров. Каждая реплика получает метку участника и точный таймкод.

pyannote-audio

Таймкоды

Доставка

Размеченный транскрипт, субтитры, семантический индекс и API-вывод. Готово к следующим модулям агента.

DOCX / SRT / JSON

Qdrant index

03 / спецификация

Технические параметры

Модели

GigaAM / Whisper large-v3

WER на экспертной речи

4–6%

Диаризация

pyannote-audio

Языки

Русский (основной), English

Входные форматы

MP3, WAV, MP4, MKV, RTMP

Скорость обработки

1 час записи ~ 8–12 мин

Размещение

On-premise в вашем контуре

Соответствие

152-ФЗ, NDA по умолчанию

04 / результат

Что вы получаете на выходе

TXT

Размеченный транскрипт

Полный текст с таймкодами и метками спикеров. Экспорт в DOCX, PDF, JSON.

SRT

Субтитры к видео

Готовый SRT/VTT для публикации записей сессий с точной синхронизацией.

IDX

Семантический индекс

Транскрипт загружается в векторную базу - по нему можно задавать вопросы в интерфейсе агента.

API

Структурированный JSON

Машиночитаемый вывод для интеграции с вашей CRM, LMS или BI-системой.

On-premise

Ни один байт не уходит наружу

Весь стек разворачивается на вашем железе или в вашем закрытом облаке. Модели работают локально - нет вызовов внешних API, нет передачи аудио третьим лицам.

Соответствие 152-ФЗ «О персональных данных»

Работа под NDA по умолчанию

Серверы и данные - только на территории РФ

Закрытые сессии и стратегические обсуждения под защитой

Интеграция с существующей инфраструктурой ИБ

Следующий шаг

Покажем на вашем материале

Возьмем одну архивную запись сессии, прогоним через контур, отдадим размеченный транскрипт. Видно сразу - без слайдов.

Запросить demo-прогон

или @d0brocycle в telegram

Транскрибация деловых мероприятий

Почему стандартные подходы не работают на деловых мероприятиях

Ручная расшифровка - это недели работы

Облачные сервисы не понимают экспертный русский

Чувствительный контент нельзя отдавать в облако

Транскрипт без структуры бесполезен

От аудио до структурированного текста за 8–12 минут на час записи

Захват

Распознавание

Диаризация

Доставка

Технические параметры

Что вы получаете на выходе

Размеченный транскрипт

Субтитры к видео

Семантический индекс

Структурированный JSON

Ни один байт не уходит наружу

Покажем на вашем материале

Почему стандартные подходы не работают
на деловых мероприятиях

От аудио до структурированного текста
за 8–12 минут на час записи