Голосовые подсказки для оплаты UPI: учет разнообразия для усовершенствованных моделей ИИ
Использование опыта Шайпа в оперативном создании разнообразных аудиозаписей для поддержки голосовых платежных систем UPI с использованием высококачественных, культурно разнообразных данных.
Обзор проекта
Shaip сотрудничал с ведущей финтех-компанией для разработки голосового платежного приложения путем создания и записи разнообразных платежных подсказок UPI. Проект включал создание 2,500 уникальных подсказок и 87,000 разнообразных подсказок по 13 платежным намерениям, таким как отправка денег, запрос денег, запрос баланса и оплата счетов. Эти подсказки были записаны в течение 200 часов 45 докладчиками из разных регионов, с разным опытом и возрастными группами, что обеспечило широкий спектр языкового и экологического разнообразия.
Целью проекта была разработка высококачественных данных для обучения модели искусственного интеллекта, которая могла бы распознавать и реагировать на голосовые команды, связанные с платежами UPI в реальных условиях.
Основная статистика
Записаны аудиочасы платежных инструкций UPI
200
Спикеры из разных слоев общества (возраст, образование, регион)
45
Охвачены намерения с помощью более 87,000 XNUMX разнообразных подсказок
13
Языки: Английский язык, с носителями разных языков (кумаони, бенгали, малаялам, гуджарати, хинди, маратхи и т. д.)
Объем проекта
Быстрое создание
В сферу охвата входило создание уникальных подсказок для голосовой платежной системы UPI. Подсказки были разработаны для охвата нескольких намерений, обеспечивая их разнообразие по структуре, словарю и именованным сущностям. Некоторые ключевые аспекты включали:
13 ключевых намерений, в том числе:
- Посылать деньги: 65,653 XNUMX уникальных и разнообразных подсказок
- Запрос баланса: 3,052 подсказок
- Просьба денег: 26,972 подсказок
- История транзакций, пополнение счета, оплата счетов и т. д.
Аудио запись
Для обеспечения аутентичности и применимости в реальном мире подсказки были записаны 45 носителями языка с разным языковым фоном. Разнообразие, зафиксированное через разные родные языки, региональные диалекты и среду (в помещении и на открытом воздухе), помогло улучшить данные обучения.
- Языковое разнообразие: Пользователи, свободно владеющие английским языком, но имеющие различные родные языки, такие как кумаони, гуджарати, хинди, бангла, маратхи и малаялам.
- Возраст, пол и образование: Данные охватывают широкий спектр демографических показателей.
- Городские и сельские спикеры: Для отражения реальных условий были включены как городские, так и сельские жители.
- Среда записи: Аудиозаписи проводились как в помещении, так и на открытом воздухе с включением различных фоновых шумов.
Задачи
Необходимо было тщательно спланировать и реализовать все необходимые подсказки, чтобы они отражали различные региональные диалекты и особенности говорящих.
Для реальных условий решающее значение имела обработка фоновых шумов и условий окружающей среды (в помещении и на улице).
Включение в исследование представителей разных возрастных групп, с разным уровнем образования и из разных сельских/городских регионов усложнило сбор достоверных данных.
Решение
Шаип предоставил решение, которое устранило проблемы проекта, внедрив передовые методы НЛП и тщательное планирование как быстрого создания, так и записи. Ключевые аспекты
Решение включало:
Быстрое создание
- 2,500 Были созданы уникальные подсказки, каждая из которых отличалась структурой и словарным запасом.
- 13 Были охвачены различные намерения: от простых платежных запросов до более сложных запросов, таких как история транзакций и оплата счетов.
Аудио запись
- 200 часа аудиозаписей были проведены пользователи 45, обеспечивая разнообразие между родными языками, средами и демографическими показателями носителей языка.
- Для обеспечения естественной вариации звука запись производилась как в помещении, так и на открытом воздухе.
- Спикеры представляли ряд региональных диалектов, что обеспечивало точное языковое представительство.
| Намерение | Отправить | Баланс Запрос | Просьба денег | История транзакций |
|---|---|---|---|---|
| Незамедлительный | Сделайте платеж в размере двести сто долларов Суматри за аренду дома | Я хочу узнать текущий остаток на моем сберегательном счете. | Можете ли вы попросить Раджи триста восемнадцать рупий на экстренный случай? | Покажите мне историю транзакций по моей дебетовой карте. |
| Гуджарати | સુમાત્રીને и видеоигры | Он сотрудничает с Джоном Билдом и его коллегой. વા માંગુ છું. | શું તમે રાજી પાસેથી ઇમર્જન્સી માટે ત્રણસો અઢા Ты можешь это сделать? | Он может быть использован в качестве примера. |
| Хинди | Сэнсэй Кейнс Кейнс и Лоуренс и Сон Ринг. ा भुगतान करें | | В ролях: Джон Бэйл и Мэн Уинсон в фильме "Джон Джонс". ाहता हूँ। | Он и Рэйчел Сон Кейнс и КейлЛон Сон. Ты хочешь, чтобы Мисс Сейсон была? | Мимо и Дэйв Кейнс и Лэнсон Бэтмен. |
| Малайялам | വീട്ടുവാടകയാി ന്നൂറ് നൽകൂ. | എൻ്റെ Это очень удобно. | Свободное время и деньги Вы хотите это сделать? | Это может быть сделано в соответствии с вашими требованиями. |
| Телугу | ఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒక్క వంద చెల్ల ించండి | నేను నా సేవింగ్స్ అకౌంట్ లో నా ప్రస్తుత బ్యాల Он Д-р Уилсон. | Обратная связь Что вам нужно? | నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రను నాకు చూపి ంచండి. |
| Бангла Банла | বাড়ি ভাড়ার জন্য সুমাত্রিকে ২১,০০০ টাকা পরিশ োধ করুন | আমি আমার সঞ্চয় অ্যাকাউন্টে বর্তমান ব্যালেন্ স জানতে চাই। | আপনি রাজির কাছে তাৎক্ষণিক অবস্থার জন্য তিনশো Вы хотите что-нибудь сделать? | আমার ডেবিট কার্ডের লেনদেনের ইতিহাস দেখান। |
| Маратхи | Сэнсэйл и Роналд Сонсон в Нью-Йорке и в Сан-Франциско. ुपये चुकवा | Мисс Блин и Миссис Джонс Джонс. | Кэтрин Джонс и Джон Сон в Нью-Йорке. Вы хотите это сделать? | Миссис Дэйв Кейнс и Лолонс Хейтон. |
Результат
Высококачественные, разнообразные аудиоданные, предоставленные Shaip, позволили клиенту разработать голосовую платежную систему UPI на основе ИИ, способную распознавать команды на различных диалектах, в разных средах и контекстах. Данные помогли улучшить:
- Распознавание голоса в реальном времени в сложных условиях.
- Более точная транзакция UPI обработка для более широкого круга пользователей.
- Масштабируемость. Проект закладывает прочную основу для расширения охвата других индийских языков.
Результат
- 200 часа аудиофайлов (формат 8 кГц PCM WAV, моно)
- 87,000+ разнообразные подсказки, аннотированные уникальными намерениями
- Метаданные: Профили говорящих, сведения об окружающей среде и точность транскрипции
Способность Шаипа запечатлеть разнообразие Индии с помощью уникальных подсказок и аутентичных аудиозаписей стала переломным моментом для нашей голосовой платежной системы UPI. Их команда обеспечила, чтобы каждый аспект проекта — от создания подсказок до качества записи — был обработан с точностью, что помогло нам создать более инклюзивную, надежную модель распознавания голоса.