Корейский набор данных

한국어 데이터셋

Высококачественный набор данных корейского колл-центра, записанных монологов и медиа (подкастов) для моделей искусственного интеллекта и речи

Обзор

Название (Язык)

Набор данных корейского языка

Типы наборов данных

Колл-центр, медиаданные, сценарий монолога

Страна

Корея

Описание

Этот набор данных включает в себя незаписанные синтетические телефонные разговоры агента с клиентом (5–15 минут), лицензируемые общедоступные аудио- и видеофайлы, такие как интервью и подкасты с 1–5 участниками (15–60 минут), а также записанные монологи с участием одного диктора, предоставляющего заранее определенный контент для обучения речевым и языковым моделям.

Кейсы

ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование

Детали набора данных

Тип набора данных Частота выборки Спикеры Канал Все часы Общее количество спикеров
Call Center 8 кГц 2 Выступающие Двойной 102:27:55 1,244
Медиа данные 16 кГц Несколько динамиков Моно 203:46:54 397
Монолог по сценарию 24 кГц Один динамик Моно 500:00:00 По запросу
Монолог по сценарию 48 кГц Один динамик Моно 1,955:00:00 По запросу

Избранные клиенты

Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.

Amazon
Google
Microsoft
Свяжитесь с нами

Не можете найти то, что ищете?

Новые готовые наборы данных собираются по всем типам данных.

Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи

  • Это поле для целей проверки и должны быть оставлены без изменений.
  • Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.