Голосовые подсказки для оплаты UPI: учет разнообразия для усовершенствованных моделей ИИ

Использование опыта Шайпа в оперативном создании разнообразных аудиозаписей для поддержки голосовых платежных систем UPI с использованием высококачественных, культурно разнообразных данных.

Голосовые подсказки для оплаты через upi

Обзор проекта

Shaip сотрудничал с ведущей финтех-компанией для разработки голосового платежного приложения путем создания и записи разнообразных платежных подсказок UPI. Проект включал создание 2,500 уникальных подсказок и 87,000 разнообразных подсказок по 13 платежным намерениям, таким как отправка денег, запрос денег, запрос баланса и оплата счетов. Эти подсказки были записаны в течение 200 часов 45 докладчиками из разных регионов, с разным опытом и возрастными группами, что обеспечило широкий спектр языкового и экологического разнообразия.

Целью проекта была разработка высококачественных данных для обучения модели искусственного интеллекта, которая могла бы распознавать и реагировать на голосовые команды, связанные с платежами UPI в реальных условиях.

Голосовой платеж upi

Основная статистика

Записаны аудиочасы платежных инструкций UPI

200

Спикеры из разных слоев общества (возраст, образование, регион)

45

Охвачены намерения с помощью более 87,000 XNUMX разнообразных подсказок

13

Языки: Английский язык, с носителями разных языков (кумаони, бенгали, малаялам, гуджарати, хинди, маратхи и т. д.)

Объем проекта

Быстрое создание

В сферу охвата входило создание уникальных подсказок для голосовой платежной системы UPI. Подсказки были разработаны для охвата нескольких намерений, обеспечивая их разнообразие по структуре, словарю и именованным сущностям. Некоторые ключевые аспекты включали:

13 ключевых намерений, в том числе:

  • Посылать деньги: 65,653 XNUMX уникальных и разнообразных подсказок
  • Запрос баланса: 3,052 подсказок
  • Просьба денег: 26,972 подсказок
  • История транзакций, пополнение счета, оплата счетов и т. д.

Аудио запись

Для обеспечения аутентичности и применимости в реальном мире подсказки были записаны 45 носителями языка с разным языковым фоном. Разнообразие, зафиксированное через разные родные языки, региональные диалекты и среду (в помещении и на открытом воздухе), помогло улучшить данные обучения.

  • Языковое разнообразие: Пользователи, свободно владеющие английским языком, но имеющие различные родные языки, такие как кумаони, гуджарати, хинди, бангла, маратхи и малаялам.
  • Возраст, пол и образование: Данные охватывают широкий спектр демографических показателей.
  • Городские и сельские спикеры: Для отражения реальных условий были включены как городские, так и сельские жители.
  • Среда записи: Аудиозаписи проводились как в помещении, так и на открытом воздухе с включением различных фоновых шумов.

Задачи

Языковое и региональное разнообразие

Необходимо было тщательно спланировать и реализовать все необходимые подсказки, чтобы они отражали различные региональные диалекты и особенности говорящих.

Естественные аудиовариации

Для реальных условий решающее значение имела обработка фоновых шумов и условий окружающей среды (в помещении и на улице).

Разнообразные профили спикеров

Включение в исследование представителей разных возрастных групп, с разным уровнем образования и из разных сельских/городских регионов усложнило сбор достоверных данных.

Решение

Компания Shaip предложила решение, которое позволило преодолеть трудности проекта за счет применения передовых методов НЛП и тщательного планирования как при создании, так и при записи подсказок. Ключевые аспекты решения включали:

Быстрое создание

  • 2,500 Были созданы уникальные подсказки, каждая из которых отличалась структурой и словарным запасом.
  • 13 Были охвачены различные намерения: от простых платежных запросов до более сложных запросов, таких как история транзакций и оплата счетов.

Аудио запись

  • 200 часа аудиозаписей были проведены пользователи 45, обеспечивая разнообразие между родными языками, средами и демографическими показателями носителей языка.
  • Для обеспечения естественной вариации звука запись производилась как в помещении, так и на открытом воздухе.
  • Спикеры представляли ряд региональных диалектов, что обеспечивало точное языковое представительство.
Намерение Отправить Баланс Запрос Просьба денег История транзакций
Незамедлительный Сделайте платеж в размере двести сто долларов Суматри за аренду дома Я хочу узнать текущий остаток на моем сберегательном счете. Можете ли вы попросить Раджи триста восемнадцать рупий на экстренный случай? Покажите мне историю транзакций по моей дебетовой карте.
Гуджарати સુમાત્રીને и видеоигры Он сотрудничает с Джоном Билдом и его коллегой. વા માંગુ છું. શું તમે રાજી પાસેથી ઇમર્જન્સી માટે ત્રણસો અઢા Ты можешь это сделать? Он может быть использован в качестве примера.
Хинди Сэнсэй Кейнс Мэн Кейнс и Лили Сейлс В Кейси Кейнс В ролях: Джон Бэйл и Мэн Уинсон в фильме "Джон Джонс". ाहता हूँ। Он и Рэйчел Сон Кейнс и КейлЛон Сон. Ты хочешь, чтобы Мисс Сейсон была? Мимо и Дэйв Кейнс и Лэнсон Бэтмен.
Малайялам വീട്ടുവാടകയാി ന്നൂറ് നൽകൂ. എൻ്റെ Это очень удобно. Свободное время и деньги Вы хотите это сделать? Это может быть сделано в соответствии с вашими требованиями.
Телугу ఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒక్క వంద చెల్ల ించండి నేను నా సేవింగ్స్ అకౌంట్ లో నా ప్రస్తుత బ్యాల Он Д-р Уилсон. Обратная связь Что вам нужно? నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రను నాకు చూపి ంచండి.
Бангла (বাংলা) বাড়ি ভাড়ার জন্য সুমাত্রিকে ২১,০০০ টাকা পরিশ োধ করুন আমি আমার সঞ্চয় অ্যাকাউন্টে বর্তমান ব্যালেন্ স জানতে চাই। আপনি রাজির কাছে তাৎক্ষণিক অবস্থার জন্য Ты можешь это сделать? আমার ডেবিট কার্ডের লেনদেনের ইতিহাস দেখান।
Маратхи Сэнсэй Уилсон и Джонс. एकशे रुपये द्या. Майлз и Билли Сейлс. Джон Джонс. Дэн Рэйчел и Джон Джонс в Нью-Йорке. Где это? Миссис Дэйв Кейси Уинстон.

Результат

Высококачественные, разнообразные аудиоданные, предоставленные Shaip, позволили клиенту разработать голосовую платежную систему UPI на основе ИИ, способную распознавать команды на различных диалектах, в разных средах и контекстах. Данные помогли улучшить:

  • Распознавание голоса в реальном времени в сложных условиях.
  • Более точная транзакция UPI обработка для более широкого круга пользователей.
  • Масштабируемость. Проект закладывает прочную основу для расширения охвата других индийских языков.

Результат

  • 200 часа аудиофайлов (формат 8 кГц PCM WAV, моно)
  • 87,000+ разнообразные подсказки, аннотированные уникальными намерениями
  • Метаданные: Профили говорящих, сведения об окружающей среде и точность транскрипции
Цитата значок

Способность компании Shaip передать многообразие Индии с помощью уникальных подсказок и аутентичных аудиозаписей стала настоящим прорывом для нашей системы голосовых платежей UPI. Их команда обеспечила точную обработку каждого аспекта проекта — от создания подсказок до качества записи — что помогло нам создать более инклюзивную и надежную модель распознавания голоса.

★ ★ ★ ★ ★
Цитата значок