Набор данных хинди
हिंदी डेटासेट
Набор данных высококачественного колл-центра на хинди, общих разговоров и подкастов для моделей ИИ и ASR
Обзор
Название (Язык)
Набор данных на языке хинди
Типы наборов данных
Колл-центр, Общая беседа, Медиа (подкаст), Записанный монолог
Страна
Индия
Описание
Доступны незашифрованные телефонные разговоры между двумя людьми продолжительностью от 15 до 60 минут, а также лицензируемые аудио- и видеофайлы, являющиеся общественным достоянием, такие как интервью и подкасты с количеством участников от 1 до 5 человек в том же диапазоне. Кроме того, доступны записи отдельных высказываний продолжительностью от 5 до 30 секунд, а также данные зашифрованных монологов.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
| Тип набора данных | Частота выборки | Спикеры | Канал | Все часы | Общее количество спикеров |
|---|---|---|---|---|---|
| Call Center | 8 кГц | 2 Выступающие | Двойной | 70:45:51 | По запросу |
| Call Center | 8 кГц | 2 Выступающие | Моно | 20,000:00:00 | По запросу |
| Call Center | 16 кГц | 2 Выступающие | Моно | 29:17:20 | 261 |
| Call Center | 16 кГц | 2 Выступающие | Двойной | 400:27:10 | 1200 |
| Общий разговор | 8 кГц | 2 Выступающие | Двойной | 47:48:40 | 224 |
| Медиа данные | 16 кГц | Несколько динамиков | Моно | 227:57:43 | 438 |
| Монолог по сценарию | 48 кГц | Один динамик | Моно | 2,866:00:00 | 3,988 |
| Монолог по сценарию | 24 кГц | Один динамик | Моно | 29,000:00:00 | По запросу |
Избранные клиенты
Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.
Не можете найти то, что ищете?
Новые готовые наборы данных собираются по всем типам данных.
Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи