Датский набор данных
Данск Datasæt
Высококачественный набор данных для разговорной речи на датском языке, TTS и подкастов для моделей искусственного интеллекта и речи
Обзор
Название (Язык)
Набор данных датского языка
Типы наборов данных
Колл-центр, общий разговор, медиаданные (данные подкаста), подготовленный монолог
Страна
Дания
Описание
Продолжительность незаписанных телефонных разговоров между двумя людьми составляет от 15 до 60 минут. Лицензируемые аудио- и видеофайлы, являющиеся общественным достоянием, такие как интервью или подкасты с участием от 1 до 5 человек, также имеют продолжительность от 15 до 60 минут. Кроме того, записи отдельных фраз на датском языке, сделанные в Дании, обычно длятся от 5 до 30 секунд.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
| Тип набора данных | Частота выборки | Спикеры | Канал | Все часы | Общее количество спикеров |
|---|---|---|---|---|---|
| Call Center | 8 кГц | 2 Выступающие | Моно | 2,000:00:00 | По запросу |
| Общий разговор | 8 кГц | 2 Выступающие | Двойной | 356:29:47 | 700 |
| Медиа данные | 16 кГц | Несколько динамиков | Моно | 665:16:30 | 1,261 |
| Монолог по сценарию | 48 кГц | Один динамик | Моно | 2,496:00:00 | 2,825 |
Избранные клиенты
Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.
Не можете найти то, что ищете?
Новые готовые наборы данных собираются по всем типам данных.
Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи