Вопросы и ответы
Вопросы об AI-аналитике
деловых мероприятий
Здесь собраны вопросы, которые чаще всего задают организаторы форумов, IT-директора корпораций и руководители проектов в госсекторе. Если вашего вопроса нет — напишите @d0brocycle в telegram, ответим тем же днём.
01 / технология
Технология и качество
GigaAM от Сбера и Whisper large-v3 от OpenAI — обе модели разворачиваются on-premise. Под каждое мероприятие тестируем 2-3 связки на образце аудио и выбираем сочетание с лучшим WER на вашей терминологии.
На экспертной речи (госуправление, ИИ, финансы, промышленность) — WER 4–6%. Это в 4-7 раз лучше, чем у Otter.ai или Google Speech, которые на той же лексике дают 25–40%.
Да, WER 8–12%. Это близко к родному уровню Otter, но они всё равно лучше на чистом English. На смешанной русско-английской речи (это норма для деловых форумов) AIDA значительно точнее.
pyannote-audio — текущий стандарт для разделения голосов. Точность падает при 8+ спикерах в одном помещении, но для большинства сессий (1 модератор + 3-5 спикеров) работает стабильно.
Качество ASR прямо зависит от качества входа. Шум, эхо, далёкие микрофоны добавляют 10-20% к WER. Поэтому подготовка к мероприятию (микрофонная дисциплина, техкарта звукорежиссёра) — половина успеха AI-обработки.
02 / безопасность
Безопасность и соответствие
Да, полностью. Весь стек разворачивается в вашем контуре, данные не покидают периметр организации. Голосовые записи могут быть биометрическими данными, поэтому on-premise — единственный способ соблюсти 152-ФЗ для деловых мероприятий с участниками.
Стек собран из аттестуемых компонентов: локальные модели, российские инструменты оркестрации, изолированный контур. Сам процесс аттестации — отдельная дорожная карта после пилота, занимает время и бюджет. Для пилота не требуется, если работаете в периметре без внешних интеграций с ГИС.
Только на вашем железе или в вашем закрытом облаке. Мы не имеем доступа к вашим данным после развёртывания. Серверы в РФ — мандат для on-premise варианта.
Согласия на запись и обработку собираются на этапе регистрации, это стандартная практика для крупных мероприятий. Модули с персонализацией (матчинг, дайджесты) работают только для согласившихся. Общая аналитика — на обезличенных данных.
Заказчик. Все права на транскрипты, отчёты, дайджесты, медиа-нарезку передаются по стандартным договорам, как это делается в Росконгрессе и аналогичных фондах. Мы оставляем право только на сам инструмент.
03 / коммерция
Стоимость и формат работы
От 5 до 8 млн ₽ единоразово за пилотный проект (одно мероприятие или серия). Включает развёртывание стека, настройку под вашу терминологию, обработку события, доставку артефактов. Точная цена зависит от объёма аудио и набора модулей.
От 2 до 4 млн ₽/год. Включает обновления моделей, поддержку, развитие новых модулей под ваши задачи. Имеет смысл, если у вас регулярные мероприятия (квартальные, корпоративные форумы).
8 недель от подписания до первого пилотного запуска: 2 недели на согласование архитектуры, 4 недели на развёртывание и настройку, 2 недели на интеграцию с вашими процессами и пилот. На самом мероприятии обработка идёт в реальном времени, итоговые артефакты — за 24 часа после.
Да, чаще всего пилот начинается с транскрибации + одного-двух аналитических модулей (отчёт по итогам или матчинг). Остальные подключаются после успешного пилота.
Перед пилотом мы делаем demo-прогон на одной вашей записи (1-2 часа) — это бесплатно и занимает 2-3 дня. Если на этом этапе видно, что результат не дотягивает до ваших ожиданий, дальше не идём.
04 / сценарии
Применение и сценарии
Да, через прямой поток (RTMP/SRT) или после события файлами. Но основная сила решения — на офлайн-форумах с десятками параллельных треков, где облачные сервисы Zoom не справляются с масштабом.
Да, корпоративный сценарий: внутренние конференции, советы директоров, quarterly business reviews, защиты проектов. Набор модулей меняется — для совещаний правления обычно нужны транскрибация, отчёт, поиск по содержанию, без публичного матчинга.
Да, отраслевая специфика учитывается через RAG на ваш глоссарий и при необходимости fine-tuning моделей под терминологию. Это даёт WER 4-6% даже на узкой лексике.
Транскрипция работает в потоке с задержкой 30-60 секунд. Полная аналитика (отчёт, дайджесты, матчинг) — пакетная обработка, итоговые артефакты к утру следующего дня. Это сознательный выбор: качество выше при пакетной обработке.
9 дней, 3800 участников, 156 транскрипций, 36 аудиторий, 6 модулей в работе, итоговый отчёт через 24 часа после каждого дня. Подробный кейс с архитектурой и метриками →
05 / выбор
Сравнение с альтернативами
Otter — облачный сервис для англоязычных встреч. AIDA — on-premise платформа для деловых мероприятий на русском с шестью модулями аналитики. Полное сравнение по 12 параметрам →
Войси — отличный сервис транскрибации с фокусом на русский язык и облачным удобством. AIDA — это вертикальная платформа: транскрибация плюс ещё пять модулей. Сравнение по 10 параметрам и сценариям →
Они продают часы, не продукт. Цикл согласования 6+ месяцев, ещё столько же на реализацию. У вас форум в августе. Мы приходим с готовым вертикальным решением под event-домен и разворачиваемся за 8 недель.
Передача данных в OpenAI или Anthropic нарушает 152-ФЗ для деловых мероприятий. Плюс стоимость на масштабе сотен сессий становится сопоставимой с on-premise — но без контроля над данными.
Не нашли ответа?
Разберём ваш кейс за 60 минут
Опишите ваше мероприятие — масштаб, чувствительность контента, ожидания от итоговых документов. Скажем прямо, подходит ли AIDA и что входит в пилот.