Бенгальский набор данных
বাংলা ডেটাসেট
Высококачественный набор данных колл-центра на бенгальском языке, общих разговоров и подкастов для моделей искусственного интеллекта и речи
Обзор
Название (Язык)
Набор данных бенгальского языка
Типы наборов данных
Колл-центр, общий разговор, медиаданные (данные подкаста), подготовленный монолог
Страна
Индия
Описание
Доступны незаписанные, синтетические телефонные разговоры между агентом и клиентом продолжительностью от 5 до 15 минут. Кроме того, доступны лицензируемые аудио- и видеофайлы, являющиеся общественным достоянием, такие как интервью, подкасты и аналогичный контент с участием от 1 до 5 человек, продолжительностью от 15 до 60 минут.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
| Тип набора данных | Частота выборки | Спикеры | Канал | Все часы | Общее количество спикеров |
|---|---|---|---|---|---|
| Call Center | 8 кГц | 2 Выступающие | Двойной | 117:03:45 | 498 |
| Общий разговор | 8 кГц | 2 Выступающие | Двойной | 168:13:39 | 458 |
| Медиа данные | 16 кГц | Несколько динамиков | Моно | 24:58:58 | 90 |
| Монолог по сценарию | 24 кГц | Один динамик | Моно | 2,300:00:00 | По запросу |
Избранные клиенты
Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.
Не можете найти то, что ищете?
Новые готовые наборы данных собираются по всем типам данных.
Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи