Практический пример: коллекция высказываний
Предоставлено более 7 миллионов высказываний для создания многоязычных цифровых помощников на 13 языках.
Реальное решение мира
Данные, которые поддерживают глобальное общение
Потребность в обучении произношению возникает, потому что не все клиенты используют точные слова или фразы, взаимодействуя или задавая вопросы своим голосовым помощникам в формате сценария. Вот почему специальные голосовые приложения должны обучаться на данных спонтанной речи. Например, «Где находится ближайшая больница?» «Найти больницу рядом со мной» или «Есть ли поблизости больница?» все они указывают на одно и то же намерение поиска, но формулируются по-разному.
Проблема
Чтобы реализовать дорожную карту речи клиентов Digital Assistant для языков мира, команде необходимо было получить большие объемы обучающих данных для модели искусственного интеллекта распознавания речи. Критическими требованиями заказчика были:
- Получите большие объемы обучающих данных (подсказки одного говорящего продолжительностью не более 3–30 секунд) для служб распознавания речи на 13 мировых языках.
- Для каждого языка поставщик будет генерировать текстовые подсказки для записи говорящим (если только
материалы клиента) и расшифровать полученный звук. - Предоставьте аудиоданные и транскрипцию записанных высказываний с соответствующими файлами JSON.
содержащий метаданные для всех записей. - Обеспечьте разнообразный состав говорящих по возрасту, полу, образованию и диалекту
- Обеспечьте разнообразное сочетание сред записи в соответствии со спецификациями.
- Каждая аудиозапись должна быть не менее 16 кГц, но предпочтительно 44 кГц.
«После оценки многих поставщиков клиент выбрал Shaip из-за их опыта в проектах диалогового ИИ. Мы были впечатлены компетенцией Shaip в выполнении проектов, их опытом в поиске, расшифровке и предоставлении необходимых высказываний от опытных лингвистов на 13 языках в сжатые сроки и с требуемым качеством».
Производство
Благодаря нашему глубокому пониманию разговорного ИИ мы помогли клиенту собрать, расшифровать и аннотировать данные вместе с командой опытных лингвистов и аннотаторов, чтобы обучить их многоязычный голосовой пакет для обработки речи на основе ИИ.
Объем работ для Shaip включал, помимо прочего, сбор больших объемов данных аудиообучения для распознавания речи, расшифровку аудиозаписей на нескольких языках для всех языков в нашей дорожной карте языков Уровня 1 и Уровня 2 и предоставление соответствующих JSON файлы, содержащие метаданные. Shaip собирал высказывания продолжительностью от 3 до 30 секунд в масштабе, сохраняя при этом желаемый уровень качества, необходимый для обучения моделей машинного обучения для сложных проектов.
- Аудио собрано, расшифровано и аннотировано: 22,250 часов
- Поддерживаемые языки: 13 (датский, корейский, арабский из Саудовской Аравии, голландский, материковый и тайваньский китайский, франко-канадский, мексиканский испанский, турецкий, хинди, польский, японский, русский)
- Количество высказываний: 7M +
- Сроки: 7-8 месяцев
Собирая звуковые высказывания на частоте 16 кГц, мы обеспечили здоровое сочетание говорящих по возрасту, полу, образованию и диалектам в различных средах записи.
Результат
Высококачественные звуковые данные высказываний от опытных лингвистов позволили клиенту точно обучить свою многоязычную модель распознавания речи на 13 глобальных языках уровня 1 и 2. С наборами обучающих данных золотого стандарта клиент может предложить интеллектуальную и надежную цифровую помощь для решения будущих реальных проблем.
Наша экспертиза
Рекомендуемые ресурсы
Руководство для покупателя
Руководство покупателя: диалоговый ИИ
Чат-бот, с которым вы разговаривали, работает на продвинутой системе искусственного интеллекта, которая обучена, протестирована и построена с использованием множества наборов данных для распознавания речи.
Блог
Состояние разговорного ИИ в 2021 году
Инфографика Conversational AI 2021 рассказывает о том, что такое Conversational AI, его эволюция, типы, рынок разговорного AI по регионам, сценарии использования, проблемы и т. Д.
Блог
3 препятствия на пути развития разговорного ИИ
Shaip запускает эволюцию разговорного ИИ как инструмента взаимодействия с клиентами, предлагая необходимые аннотированные аудиоданные на более чем 50 языках.
Расскажите, чем мы можем помочь с вашей следующей инициативой в области искусственного интеллекта.