EA
Event Intelligence · модуль 01

Транскрибация деловых мероприятий

Автоматическая расшифровка конференций, форумов и корпоративных мероприятий. Русская экспертная речь, разделение по спикерам, WER 4–6%. Данные не покидают ваш контур.

On-premise
152-ФЗ
WER 4–6%
Русский язык
01 / проблема

Почему стандартные подходы не работают на деловых мероприятиях

01

Ручная расшифровка - это недели работы

Двухдневный форум с 20 параллельными треками - это 300–500 часов аудио. Ни одна команда стенографистов не справится за приемлемые деньги и сроки. В итоге расшифровывается 10–15% контента, остальное теряется.

02

Облачные сервисы не понимают экспертный русский

Otter, Fireflies, Google Speech - обучены на бытовой речи. Термины из госуправления, финансов, промышленности они транскрибируют с WER 25–40%. Каждую запись нужно перечитывать и исправлять вручную.

03

Чувствительный контент нельзя отдавать в облако

Закрытые сессии, стратегические обсуждения, персональные данные участников - это все уходит на зарубежные серверы. Для госзаказчиков и крупных корпораций это неприемлемо.

04

Транскрипт без структуры бесполезен

Сырой текст без разметки спикеров, без таймкодов, без привязки к программе мероприятия - не управленческий артефакт. Это просто файл, который никто не читает.

02 / процесс

От аудио до структурированного текста за 8–12 минут на час записи

01

Захват

Подключение к многоканальному аудио. Поддержка прямого потока (RTMP/SRT) и файлов после мероприятия.

Multi-channel audio
MP4 / WAV / MKV
02

Распознавание

GigaAM или Whisper large-v3 распознают русскую экспертную речь. WER 4–6% на отраслевой лексике.

GigaAM / Whisper v3
WER 4–6%
03

Диаризация

pyannote-audio разделяет спикеров. Каждая реплика получает метку участника и точный таймкод.

pyannote-audio
Таймкоды
04

Доставка

Размеченный транскрипт, субтитры, семантический индекс и API-вывод. Готово к следующим модулям агента.

DOCX / SRT / JSON
Qdrant index
03 / спецификация

Технические параметры

Модели
GigaAM / Whisper large-v3
WER на экспертной речи
4–6%
Диаризация
pyannote-audio
Языки
Русский (основной), English
Входные форматы
MP3, WAV, MP4, MKV, RTMP
Скорость обработки
1 час записи ~ 8–12 мин
Размещение
On-premise в вашем контуре
Соответствие
152-ФЗ, NDA по умолчанию
04 / результат

Что вы получаете на выходе

TXT

Размеченный транскрипт

Полный текст с таймкодами и метками спикеров. Экспорт в DOCX, PDF, JSON.

SRT

Субтитры к видео

Готовый SRT/VTT для публикации записей сессий с точной синхронизацией.

IDX

Семантический индекс

Транскрипт загружается в векторную базу - по нему можно задавать вопросы в интерфейсе агента.

API

Структурированный JSON

Машиночитаемый вывод для интеграции с вашей CRM, LMS или BI-системой.

On-premise

Ни один байт не уходит наружу

Весь стек разворачивается на вашем железе или в вашем закрытом облаке. Модели работают локально - нет вызовов внешних API, нет передачи аудио третьим лицам.

Соответствие 152-ФЗ «О персональных данных»
Работа под NDA по умолчанию
Серверы и данные - только на территории РФ
Закрытые сессии и стратегические обсуждения под защитой
Интеграция с существующей инфраструктурой ИБ
Следующий шаг

Покажем на вашем материале

Возьмем одну архивную запись сессии, прогоним через контур, отдадим размеченный транскрипт. Видно сразу - без слайдов.