Китайский набор данных
简体中文数据集
Высококачественный китайский набор данных для моделей ИИ и речи
Обзор
Название (Язык)
Набор данных на китайском языке
Типы наборов данных
Колл-центр, музыка, монолог по сценарию, медиаданные (данные подкаста)
Страна
Китай
Описание
Этот набор данных включает в себя незаписанные синтетические телефонные разговоры агента с клиентом (5–15 минут), естественные телефонные разговоры между людьми (15–60 минут) и аудиозаписи пения с транскрипциями, предоставляя разнообразные речевые данные для обучения и оценки речевых и языковых технологий.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
| Язык | Тип набора данных | Частота выборки | Спикеры | Канал | Все часы | Общее количество спикеров |
|---|---|---|---|---|---|---|
| Китайское пение | Музыка | 48 кГц | Один динамик | Моно | 06:11:32 | 10 |
| Китайский (традиционный) | Монолог по сценарию | 48 кГц | Один динамик | Моно | 1,499:00:00 | 1,805 |
| Английский с китайским акцентом | Медиа данные | 16 кГц | Несколько динамиков | Моно | 306:04:58 | 2,130 |
| Китайский упрощенный | Монолог по сценарию | 48 кГц | Один динамик | Моно | 2,761:00:00 | 3,725 |
| Китайский английский с американским акцентом | Call Center | 8 кГц | 2 Выступающие | Двойной | 152:18:33 | 2,058 |
| Китайский английский с американским акцентом | Медиа данные | 16 кГц | Несколько динамиков | Моно | 245:55:15 | 468 |
Избранные клиенты
Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.
Не можете найти то, что ищете?
Новые готовые наборы данных собираются по всем типам данных.
Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи