Датский набор данных

Данск Datasæt

Высококачественный набор данных для разговорной речи на датском языке, TTS и подкастов для моделей искусственного интеллекта и речи

Обзор

Название (Язык)

Набор данных датского языка

Типы наборов данных

Колл-центр, общий разговор, медиаданные (данные подкаста), подготовленный монолог

Страна

Дания

Описание

Продолжительность незаписанных телефонных разговоров между двумя людьми составляет от 15 до 60 минут. Лицензируемые аудио- и видеофайлы, являющиеся общественным достоянием, такие как интервью или подкасты с участием от 1 до 5 человек, также имеют продолжительность от 15 до 60 минут. Кроме того, записи отдельных фраз на датском языке, сделанные в Дании, обычно длятся от 5 до 30 секунд.

Кейсы

ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование

Детали набора данных

Тип набора данных Частота выборки Спикеры Канал Все часы Общее количество спикеров
Call Center 8 кГц 2 Выступающие Моно 2,000:00:00 По запросу
Общий разговор 8 кГц 2 Выступающие Двойной 356:29:47 700
Медиа данные 16 кГц Несколько динамиков Моно 665:16:30 1,261
Монолог по сценарию 48 кГц Один динамик Моно 2,496:00:00 2,825

Избранные клиенты

Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.

Amazon
Google
Microsoft
Свяжитесь с нами

Не можете найти то, что ищете?

Новые готовые наборы данных собираются по всем типам данных.

Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи

  • Это поле для целей проверки и должны быть оставлены без изменений.
  • Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.