1С:Распознавание речи

1С:Распознавание речи

Описание

«1С:Распознавание речи» – облачный продукт по автоматическому преобразованию речи в текст. Механизмы распознавания речи доступны из встроенного языка «1С:Предприятие». Партнеры фирмы «1С», разработчики и программисты, сопровождающие информационные системы пользователей, могут интегрировать «1С:Распознавание речи» в прикладные решения и усовершенствовать различные бизнес-процессы.

  • Длинный текст проще надиктовать, чем вводить на клавиатуре, в этом поможет «Распознавание речи». Электронные письма, содержание задач и комментариев, текстовые блоки в документах удобнее вводить голосом, особенно если у пользователя заняты руки, а также при работе на мобильных устройствах.
  • Можно распознавать записи телефонных звонков или совещаний при хорошем качестве аудиозаписи. Для лучшего результата рекомендуется записывать отдельные звуковые каналы для каждого собеседника.
  • Можно использовать голосовое управление в приложениях так, чтобы по команде пользователя открывались нужные формы, строились отчеты, выполнялся поиск, заполнялись реквизиты.
  • «1С:Распознавание речи» может применяться в задачах по роботизации звонков для проведения опросов и сбора информации, в голосовых системах самообслуживания, для речевой аналитики работы с клиентами, а также при создании интерфейсов для людей с ограниченными возможностями.
  • При потоковом распознавании речи поддерживается работа с дополнительной грамматикой: в начале работы вы можете передать какие-то специфичные термины (фамилии сотрудников, названия номенклатуры или компаний-контрагентов) для их уверенного распознавания.
  • Распознавание речи осуществляется с помощью облачного сервиса или локально с использованием скачанной модели распознавания. При локальном варианте аудиоданные никуда не будут отправляться, что может быть важно при особых требованиях к конфиденциальности. Использование облачного «1С:Распознавания речи» происходит без нагрузки на оборудование пользователя и упрощает реализацию распознавания речи, особенно при большом объеме аудиоданных.
  • Мы постоянно работаем над улучшением качества распознавания речи и добавляем новые возможности. Все улучшения сначала появляются в облачном режиме и только потом становятся доступными в локальном варианте, поэтому качество распознавания речи в облачном и локальном вариантах может отличаться.
  • Для ознакомления с механизмом распознавания речи доступно демоприложение (конфигурация 1С), которое позволит распознавать речь из потокового аудио или звуковых файлов с помощью облачного сервиса или локально. Реализованные в демоприложении возможности можно заимствовать для встраивания распознавания речи в различные прикладные решения на платформе «1С:Предприятие 8».

Возможности

  • Потоковое распознавание – пользователь отправляет аудиоданные в режиме реального времени, в ответ периодически получает распознанный текст. Удобно при диктовке текста или при управлении интерфейсом программы. Длительность одного сеанса при потоковом распознавании речи с помощью облачного сервиса имеет ограничение в 2 часа. При локальном распознавании речи ограничений длительности сеанса нет.
  • Файловое распознавание – пользователь отправляет на распознавание файл с аудиозаписью и в ответ получает идентификатор задачи, по которому в дальнейшем сможет получить результат распознавания. В данном случае пользователь может отправить готовый аудиофайл, например, запись совещания. Распознанный текст будет предоставлен пользователю с задержкой, которая зависит от длительности аудиофайла и текущей загрузки облачного сервиса. Файловое распознавание может обрабатывать многоканальные аудиозаписи, в этом случае каждый канал будет распознаваться и тарифицироваться независимо. Для распознавания принимаются форматы аудио WAV signed 16 bit little-endian и Opus в контейнере ogg. Частота дискретизации аудио – от 8 кГц до 48кГц. Максимальный размер аудиофайла – 1Гб длительностью до 4 часов. Результаты распознавания доступны для скачивания в течение 7 суток после выполнения задания.
  • Функция разделения по спикерам - позволяет получить расшифровку аудиофайла с делением её на собеседников. В результате распознавания пользователь получит текст, в котором будут отображены результаты отдельно по каждому из спикеров. Функцию можно использовать, например, для получения транскрибации разговоров при проведение собеседований, опросов пользователей, совещаний, оценке качества звонков и так далее.
  • В настоящее время поддерживается распознавание речи на русском и английском языках. В дальнейшем состав доступных языков планируется расширять.
  • Условия использования

    Работает в программах:

  • 1С:Документооборот 3.0 (диктовка текста электронных писем, задач, отчетов и резолюций, голосовой подбор адресатов писем) Облачный продукт «1С:Распознавание речи» доступен средствами встроенного языка платформы «1С:Предприятие 8» с версии 8.3.23 и может быть встроен в любое пользовательское приложение 1С. Программа 1С, в которую встраиваются механизмы распознавания, должна быть на официальной поддержке. При локальном распознавании речи рекомендуется учитывать минимальные требования к ресурсам оборудования:
  • x64: процессор Intel Core i5 или AMD Ryzen 5 и последующие модели, оперативная память 12 Гбайт и выше,
  • x32: процессор Intel Core i5 или AMD Ryzen 5 и последующие модели, оперативная память 4 Гбайт и выше. Качество распознавания речи на платформе x32 снижено.
  • Цена

    Использование распознавания речи в локальном режиме не тарифицируется.

    В облачном режиме стоимость зависит от типа распознавания и длительности аудио.

    Потоковое распознавание. Единица тарификации распознавания равна 1 секунде потокового распознавания. Списание стоимости выполняется за каждые полные или неполные 20 секунд аудиоданных. Например, за распознавание потокового аудио длительностью 12 секунд будет списано 20 единиц тарификации, а для потокового аудио длительностью 64 секунды – 80 единиц.

    Файловое распознавание. Единица тарификации распознавания равна 4 секундам файлового распознавания. Списание стоимости выполняется за каждые полные или неполные 20 секунд аудиофайла. Например, за распознавание файла длительностью 12 секунд будет списано 5 единиц тарификации, а для аудиофайла длительностью 64 секунды – 20 единиц.

  • Примерно 1 час потокового аудио или 4 часа файлового аудио
  • Тестовый тариф доступен в течение 1 года с момента активации, предоставляется однократно
  • Примерно 27 часов потокового аудио или 110 часов файлового аудио
  • Примерно 270 часов потокового аудио или 1100 часов файлового аудио
  • Примерно 2 700 часов потокового аудио или 11 000 часов файлового аудио
  • Примерно 13 500 часов потокового аудио или 55 000 часов файлового аудио
  • 1С:Распознавание речи (тестовый, 3600 единиц)


    Бесплатно

    1С:Распознавание речи (0,1 млн единиц)


    1000 руб./год

    1С:Распознавание речи (1 млн единиц)


    9000 руб./год

    1С:Распознавание речи (10 млн единиц)


    80 000 руб./год

    1С:Распознавание речи (50 млн единиц)


    350 000 руб./год

  • По окончании срока действия тарифа или при списании всех включенных в него единиц использование распознавания речи будет приостановлено.
  • Дополнительно

      Инструкции

    • Сценарии использования и демопримеры работы с механизмом распознавания речи включены в документацию по встроенному языку платформы 1С (см. раздел «Инструкции по разработке на 1С» на сайте Информационной системы 1С:ИТС).
    • Экспериментальные модели распознавания речи

    • При усовершенствовании работы сервиса для пользователей могут становиться доступными обновленные и экспериментальные версии моделей распознавания речи. "Поведение платформы 1С:Предприятие" при использовании экспериментальных моделей распознавания речи может отличаться от документируемого для основных моделей.

    Возврат к списку