Голосовые подсказки для оплаты UPI: учет разнообразия для усовершенствованных моделей ИИ

Использование опыта Шайпа в оперативном создании разнообразных аудиозаписей для поддержки голосовых платежных систем UPI с использованием высококачественных, культурно разнообразных данных.

Голосовые подсказки для оплаты через upi

Обзор проекта

Shaip сотрудничал с ведущей финтех-компанией для разработки голосового платежного приложения путем создания и записи разнообразных платежных подсказок UPI. Проект включал создание 2,500 уникальных подсказок и 87,000 разнообразных подсказок по 13 платежным намерениям, таким как отправка денег, запрос денег, запрос баланса и оплата счетов. Эти подсказки были записаны в течение 200 часов 45 докладчиками из разных регионов, с разным опытом и возрастными группами, что обеспечило широкий спектр языкового и экологического разнообразия.

Целью проекта была разработка высококачественных данных для обучения модели искусственного интеллекта, которая могла бы распознавать и реагировать на голосовые команды, связанные с платежами UPI в реальных условиях.

Голосовой платеж upi

Основная статистика

Записаны аудиочасы платежных инструкций UPI

200

Спикеры из разных слоев общества (возраст, образование, регион)

45

Охвачены намерения с помощью более 87,000 XNUMX разнообразных подсказок

13

Языки: Английский язык, с носителями разных языков (кумаони, бенгали, малаялам, гуджарати, хинди, маратхи и т. д.)

Объем проекта

Быстрое создание

В сферу охвата входило создание уникальных подсказок для голосовой платежной системы UPI. Подсказки были разработаны для охвата нескольких намерений, обеспечивая их разнообразие по структуре, словарю и именованным сущностям. Некоторые ключевые аспекты включали:

13 ключевых намерений, в том числе:

  • Посылать деньги: 65,653 XNUMX уникальных и разнообразных подсказок
  • Запрос баланса: 3,052 подсказок
  • Просьба денег: 26,972 подсказок
  • История транзакций, пополнение счета, оплата счетов и т. д.

Аудио запись

Для обеспечения аутентичности и применимости в реальном мире подсказки были записаны 45 носителями языка с разным языковым фоном. Разнообразие, зафиксированное через разные родные языки, региональные диалекты и среду (в помещении и на открытом воздухе), помогло улучшить данные обучения.

  • Языковое разнообразие: Пользователи, свободно владеющие английским языком, но имеющие различные родные языки, такие как кумаони, гуджарати, хинди, бангла, маратхи и малаялам.
  • Возраст, пол и образование: Данные охватывают широкий спектр демографических показателей.
  • Городские и сельские спикеры: Для отражения реальных условий были включены как городские, так и сельские жители.
  • Среда записи: Аудиозаписи проводились как в помещении, так и на открытом воздухе с включением различных фоновых шумов.

Задачи

Языковое и региональное разнообразие

Необходимо было тщательно спланировать и реализовать все необходимые подсказки, чтобы они отражали различные региональные диалекты и особенности говорящих.

Естественные аудиовариации

Для реальных условий решающее значение имела обработка фоновых шумов и условий окружающей среды (в помещении и на улице).

Разнообразные профили спикеров

Включение в исследование представителей разных возрастных групп, с разным уровнем образования и из разных сельских/городских регионов усложнило сбор достоверных данных.

Решение

Шаип предоставил решение, которое устранило проблемы проекта, внедрив передовые методы НЛП и тщательное планирование как быстрого создания, так и записи. Ключевые аспекты
Решение включало:

Быстрое создание

  • 2,500 Были созданы уникальные подсказки, каждая из которых отличалась структурой и словарным запасом.
  • 13 Были охвачены различные намерения: от простых платежных запросов до более сложных запросов, таких как история транзакций и оплата счетов.

Аудио запись

  • 200 часа аудиозаписей были проведены пользователи 45, обеспечивая разнообразие между родными языками, средами и демографическими показателями носителей языка.
  • Для обеспечения естественной вариации звука запись производилась как в помещении, так и на открытом воздухе.
  • Спикеры представляли ряд региональных диалектов, что обеспечивало точное языковое представительство.
НамерениеОтправитьБаланс ЗапросПросьба денегИстория транзакций
НезамедлительныйСделайте платеж в размере двести сто долларов Суматри за аренду домаЯ хочу узнать текущий остаток на моем сберегательном счете.Можете ли вы попросить Раджи триста восемнадцать рупий на экстренный случай?
Покажите мне историю транзакций по моей дебетовой карте.
Гуджаратиસુમાત્રીને и видеоигрыОн сотрудничает с Джоном Билдом и его коллегой. વા માંગુ છું.શું તમે રાજી પાસેથી ઇમર્જન્સી માટે ત્રણસો અઢા Ты можешь это сделать?Он может быть использован в качестве примера.
ХиндиСэнсэй Кейнс Кейнс и Лоуренс и Сон Ринг. ा भुगतान करें |В ролях: Джон Бэйл и Мэн Уинсон в фильме "Джон Джонс". ाहता हूँ।Он и Рэйчел Сон Кейнс и КейлЛон Сон. Ты хочешь, чтобы Мисс Сейсон была?Мимо и Дэйв Кейнс и Лэнсон Бэтмен.
Малайяламവീട്ടുവാടകയാി ന്നൂറ് നൽകൂ.എൻ്റെ Это очень удобно.Свободное время и деньги Вы хотите это сделать?Это может быть сделано в соответствии с вашими требованиями.
Телугуఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒక్క వంద చెల్ల ించండినేను నా సేవింగ్స్ అకౌంట్ లో నా ప్రస్తుత బ్యాల Он Д-р Уилсон.Обратная связь Что вам нужно?నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రను నాకు చూపి ంచండి.
Бангла Банлаবাড়ি ভাড়ার জন্য সুমাত্রিকে ২১,০০০ টাকা পরিশ োধ করুনআমি আমার সঞ্চয় অ্যাকাউন্টে বর্তমান ব্যালেন্ স জানতে চাই।আপনি রাজির কাছে তাৎক্ষণিক অবস্থার জন্য তিনশো Вы хотите что-нибудь сделать?আমার ডেবিট কার্ডের লেনদেনের ইতিহাস দেখান।
МаратхиСэнсэйл и Роналд Сонсон в Нью-Йорке и в Сан-Франциско. ुपये चुकवाМисс Блин и Миссис Джонс Джонс.Кэтрин Джонс и Джон Сон в Нью-Йорке. Вы хотите это сделать?Миссис Дэйв Кейнс и Лолонс Хейтон.

Результат

Высококачественные, разнообразные аудиоданные, предоставленные Shaip, позволили клиенту разработать голосовую платежную систему UPI на основе ИИ, способную распознавать команды на различных диалектах, в разных средах и контекстах. Данные помогли улучшить:

  • Распознавание голоса в реальном времени в сложных условиях.
  • Более точная транзакция UPI обработка для более широкого круга пользователей.
  • Масштабируемость. Проект закладывает прочную основу для расширения охвата других индийских языков.

Результат

  • 200 часа аудиофайлов (формат 8 кГц PCM WAV, моно)
  • 87,000+ разнообразные подсказки, аннотированные уникальными намерениями
  • Метаданные: Профили говорящих, сведения об окружающей среде и точность транскрипции

Способность Шаипа запечатлеть разнообразие Индии с помощью уникальных подсказок и аутентичных аудиозаписей стала переломным моментом для нашей голосовой платежной системы UPI. Их команда обеспечила, чтобы каждый аспект проекта — от создания подсказок до качества записи — был обработан с точностью, что помогло нам создать более инклюзивную, надежную модель распознавания голоса.

Золотой-5-звездочный