Набор данных хинди

हिंदी डेटासेट

Набор данных высококачественного колл-центра на хинди, общих разговоров и подкастов для моделей ИИ и ASR

Обзор

Название (Язык)

Набор данных на языке хинди

Типы наборов данных

Колл-центр, Общая беседа, Медиа (подкаст), Записанный монолог

Страна

Индия

Описание

Доступны незашифрованные телефонные разговоры между двумя людьми продолжительностью от 15 до 60 минут, а также лицензируемые аудио- и видеофайлы, являющиеся общественным достоянием, такие как интервью и подкасты с количеством участников от 1 до 5 человек в том же диапазоне. Кроме того, доступны записи отдельных высказываний продолжительностью от 5 до 30 секунд, а также данные зашифрованных монологов.

Кейсы

ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование

Детали набора данных

Тип набора данных Частота выборки Спикеры Канал Все часы Общее количество спикеров
Call Center 8 кГц 2 Выступающие Двойной 70:45:51 По запросу
Call Center 8 кГц 2 Выступающие Моно 20,000:00:00 По запросу
Call Center 16 кГц 2 Выступающие Моно 29:17:20 261
Call Center 16 кГц 2 Выступающие Двойной 400:27:10 1200
Общий разговор 8 кГц 2 Выступающие Двойной 47:48:40 224
Медиа данные 16 кГц Несколько динамиков Моно 227:57:43 438
Монолог по сценарию 48 кГц Один динамик Моно 2,866:00:00 3,988
Монолог по сценарию 24 кГц Один динамик Моно 29,000:00:00 По запросу

Избранные клиенты

Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.

Amazon
Google
Microsoft
Свяжитесь с нами

Не можете найти то, что ищете?

Новые готовые наборы данных собираются по всем типам данных.

Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи

  • Это поле для целей проверки и должны быть оставлены без изменений.
  • Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.