Практический пример: коллекция высказываний

Предоставлено более 7 миллионов высказываний для создания многоязычных цифровых помощников на 13 языках.

Сборник высказываний

Реальное решение мира

Данные, которые поддерживают глобальное общение

Потребность в обучении произношению возникает, потому что не все клиенты используют точные слова или фразы, взаимодействуя или задавая вопросы своим голосовым помощникам в формате сценария. Вот почему специальные голосовые приложения должны обучаться на данных спонтанной речи. Например, «Где находится ближайшая больница?» «Найти больницу рядом со мной» или «Есть ли поблизости больница?» все они указывают на одно и то же намерение поиска, но формулируются по-разному.

Коллекция высказываний1

Проблема

Чтобы реализовать дорожную карту речи клиентов Digital Assistant для языков мира, команде необходимо было получить большие объемы обучающих данных для модели искусственного интеллекта распознавания речи. Критическими требованиями заказчика были:

  • Получите большие объемы обучающих данных (подсказки одного говорящего продолжительностью не более 3–30 секунд) для служб распознавания речи на 13 мировых языках.
  • Для каждого языка поставщик будет генерировать текстовые подсказки для записи говорящим (если только
    материалы клиента) и расшифровать полученный звук.
  • Предоставьте аудиоданные и транскрипцию записанных высказываний с соответствующими файлами JSON.
    содержащий метаданные для всех записей.
  • Обеспечьте разнообразный состав говорящих по возрасту, полу, образованию и диалекту
  • Обеспечьте разнообразное сочетание сред записи в соответствии со спецификациями.
  • Каждая аудиозапись должна быть не менее 16 кГц, но предпочтительно 44 кГц.

Ускорьте свой разговорный ИИ
разработка приложений на 100%

«После оценки многих поставщиков клиент выбрал Shaip из-за их опыта в проектах диалогового ИИ. Мы были впечатлены компетенцией Shaip в выполнении проектов, их опытом в поиске, расшифровке и предоставлении необходимых высказываний от опытных лингвистов на 13 языках в сжатые сроки и с требуемым качеством».

Решения

Благодаря нашему глубокому пониманию разговорного ИИ мы помогли клиенту собрать, расшифровать и аннотировать данные вместе с командой опытных лингвистов и аннотаторов, чтобы обучить их многоязычный голосовой пакет для обработки речи на основе ИИ.

Объем работ для Shaip включал, помимо прочего, сбор больших объемов данных аудиообучения для распознавания речи, расшифровку аудиозаписей на нескольких языках для всех языков в нашей дорожной карте языков Уровня 1 и Уровня 2 и предоставление соответствующих JSON файлы, содержащие метаданные. Shaip собирал высказывания продолжительностью от 3 до 30 секунд в масштабе, сохраняя при этом желаемый уровень качества, необходимый для обучения моделей машинного обучения для сложных проектов.

  • Аудио собрано, расшифровано и аннотировано: 22,250 часа
  • Поддерживаемые языки: 13 (датский, корейский, арабский из Саудовской Аравии, голландский, материковый и тайваньский китайский, франко-канадский, мексиканский испанский, турецкий, хинди, польский, японский, русский)
  • Количество высказываний: 7M +
  • Сроки: 7-8 месяцев

Собирая звуковые высказывания на частоте 16 кГц, мы обеспечили здоровое сочетание говорящих по возрасту, полу, образованию и диалектам в различных средах записи.

Результат

Высококачественные звуковые данные высказывания от опытных лингвистов позволили клиенту точно обучить
их многоязычная модель распознавания речи на 13 глобальных языках уровня 1 и 2. Благодаря наборам данных для обучения, отвечающим золотым стандартам, клиент может предложить интеллектуальную и надежную цифровую помощь для решения будущих реальных проблем.

Наша экспертиза

0 +
Собрано часов выступлений
0
Команда сборщиков голосовых данных
0 %
PII-совместимый
0 +
Классный номер
> 0
Принятие данных и точность
0 +
Клиентура из списка Fortune 500

Расскажите, чем мы можем помочь с вашей следующей инициативой в области искусственного интеллекта.