Корейский набор данных
한국어 데이터셋
Высококачественный набор данных корейского колл-центра, записанных монологов и медиа (подкастов) для моделей искусственного интеллекта и речи
Обзор
Название (Язык)
Набор данных корейского языка
Типы наборов данных
Колл-центр, медиаданные, сценарий монолога
Страна
Корея
Описание
Этот набор данных включает в себя незаписанные синтетические телефонные разговоры агента с клиентом (5–15 минут), лицензируемые общедоступные аудио- и видеофайлы, такие как интервью и подкасты с 1–5 участниками (15–60 минут), а также записанные монологи с участием одного диктора, предоставляющего заранее определенный контент для обучения речевым и языковым моделям.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
| Тип набора данных | Частота выборки | Спикеры | Канал | Все часы | Общее количество спикеров |
|---|---|---|---|---|---|
| Call Center | 8 кГц | 2 Выступающие | Двойной | 102:27:55 | 1,244 |
| Медиа данные | 16 кГц | Несколько динамиков | Моно | 203:46:54 | 397 |
| Монолог по сценарию | 24 кГц | Один динамик | Моно | 500:00:00 | По запросу |
| Монолог по сценарию | 48 кГц | Один динамик | Моно | 1,955:00:00 | По запросу |
Избранные клиенты
Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.
Не можете найти то, что ищете?
Новые готовые наборы данных собираются по всем типам данных.
Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи