Гуджаратский набор данных

ગુજરાતી ડેટાસેટ

Высококачественный набор данных гуджаратского колл-центра, общих разговоров и подкастов для моделей ИИ и речи

Обзор

Название (Язык)

Набор данных языка гуджарати

Типы наборов данных

Колл-центр, общий разговор, медиаданные (данные подкастов)

Страна

Индия

Описание

Доступны незаписанные, синтетические телефонные разговоры между агентом и клиентом длительностью от 5 до 15 минут, в то время как лицензируемые общедоступные аудио- или видеофайлы, такие как интервью и подкасты с 1–5 участниками, обычно имеют продолжительность от 15 до 60 минут.

Кейсы

ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование

Детали набора данных

Тип набора данных Частота выборки Спикеры Канал Все часы Общее количество спикеров
Call Center 8 кГц 2 Выступающие Двойной 54:22:40 410
Общий разговор 8 кГц 2 Выступающие Двойной 149:15:19 308
Медиа данные 16 кГц Несколько динамиков Моно 26:04:30 102

Избранные клиенты

Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.

Amazon
Google
Microsoft
Свяжитесь с нами

Не можете найти то, что ищете?

Новые готовые наборы данных собираются по всем типам данных.

Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи

  • Это поле для целей проверки и должны быть оставлены без изменений.
  • Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.