Китайско-английский набор данных
中英文数据集
Высококачественный набор данных колл-центра и подкастов на китайском и английском языках для моделей искусственного интеллекта и речи
Обзор
Название
Китайский английский Языковой набор данных
Тип набора данных
Call-центр
Описание
Синтетический телефонный разговор без сценария между «агентом» и «покупателем», прибл. Продолжительность звука (диапазон) 5-15 минут.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
Все часы
169
Частота дискретизации
8 кГц
Аудиоканала
Двойной
Платформа записи
Рабочий стол
Аудио форматы
. Wav
Формат транскрипции
.json
Вер (%)
5
Демографические данные набора данных
Страна
Китай
Язык
Китайский английский
пол
Женщина 1790, Мужчина 523, Неизвестно 13
Количество динамиков
2,326
Возраст
18-50
Обзор
Название
Китайский английский Языковой набор данных
Тип набора данных
Подкасты
Описание
Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
Все часы
249
Частота дискретизации
16 кГц
Аудиоканала
Моно
Платформа записи
Веб-поиск
Аудио форматы
. Wav
Формат транскрипции
.json
Вер (%)
5
Демографические данные набора данных
Страна
Китай
Язык
Китайский английский
пол
Женщина 126, Мужчина 346, Неизвестно 6
Количество динамиков
478
Возраст
18-50
Обзор
Название
Ухань Языковой набор данных
Тип набора данных
Спонтанный диалог
Все часы
500
Частота дискретизации
16 кГц
Китайский Языковой набор данных
TTS
300
16 кГц
Хоккиенский диалект Языковой набор данных
Спонтанный диалог
100
16 кГц
Шанхай Языковой набор данных
Спонтанный диалог
500
16 кГц
Сычуань Языковой набор данных
Спонтанный диалог
500
16 кГц
английский (китайский) Языковой набор данных
Спонтанный по сценарию
2,000
16 кГц
Избранные клиенты
Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.
Не можете найти то, что ищете?
Новые готовые наборы данных собираются по всем типам данных.
Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи