Китайский набор данных

简体中文数据集

Высококачественный китайский набор данных для моделей ИИ и речи

Обзор

Название (Язык)

Набор данных на китайском языке

Типы наборов данных

Колл-центр, музыка, монолог по сценарию, медиаданные (данные подкаста)

Страна

Китай

Описание

Этот набор данных включает в себя незаписанные синтетические телефонные разговоры агента с клиентом (5–15 минут), естественные телефонные разговоры между людьми (15–60 минут) и аудиозаписи пения с транскрипциями, предоставляя разнообразные речевые данные для обучения и оценки речевых и языковых технологий.

Кейсы

ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование

Детали набора данных

Язык Тип набора данных Частота выборки Спикеры Канал Все часы Общее количество спикеров
Китайское пение Музыка 48 кГц Один динамик Моно 06:11:32 10
Китайский (традиционный) Монолог по сценарию 48 кГц Один динамик Моно 1,499:00:00 1,805
Английский с китайским акцентом Медиа данные 16 кГц Несколько динамиков Моно 306:04:58 2,130
Китайский упрощенный Монолог по сценарию 48 кГц Один динамик Моно 2,761:00:00 3,725
Китайский английский с американским акцентом Call Center 8 кГц 2 Выступающие Двойной 152:18:33 2,058
Китайский английский с американским акцентом Медиа данные 16 кГц Несколько динамиков Моно 245:55:15 468

Избранные клиенты

Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.

Amazon
Google
Microsoft
Свяжитесь с нами

Не можете найти то, что ищете?

Новые готовые наборы данных собираются по всем типам данных.

Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи

  • Это поле для целей проверки и должны быть оставлены без изменений.
  • Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.