Набор данных English Deep South
Высококачественный набор данных для колл-центров, разговоров на общие темы и подкастов на английском языке для моделей ИИ и речи
Обзор
Название (Язык)
Набор данных английского языка Глубокого Юга
Типы наборов данных
Колл-центр, общий разговор, медиаданные (подкаст)
Страна
Южная часть Соединенных Штатов
Описание
Синтезированные телефонные разговоры без сценария между агентом и клиентом длятся от 5 до 15 минут, в то время как продолжительность телефонных разговоров без сценария между двумя людьми обычно составляет от 15 до 60 минут. Кроме того, лицензируемые аудио- и видеофайлы, являющиеся общественным достоянием, такие как интервью или подкасты с участием от 1 до 5 человек, также доступны продолжительностью от 15 до 60 минут.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
| Тип набора данных | Частота выборки | Спикеры | Канал | Все часы | Общее количество спикеров |
|---|---|---|---|---|---|
| Call Center | 8 кГц | 2 Выступающие | Двойной | 266:44:22 | 634 |
| Общий разговор | 8 кГц | 2 Выступающие | Двойной | 197:25:07 | 1,490 |
| Медиа данные | 16 кГц | Несколько динамиков | Моно | 261:20:58 | 565 |
Избранные клиенты
Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.
Не можете найти то, что ищете?
Новые готовые наборы данных собираются по всем типам данных.
Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи
Обзор
Название
Английский Deep South Языковой набор данных
Тип набора данных
Call-центр
Описание
Синтетический телефонный разговор без сценария между «агентом» и «покупателем», прибл. Продолжительность звука (диапазон) 5-15 минут.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
Все часы
151
Частота дискретизации
8 кГц
Аудиоканала
Двойной
Платформа записи
Рабочий стол
Аудио форматы
. Wav
Формат транскрипции
.json
Вер (%)
5
Демографические данные набора данных
Страна
Английский Deep South
Язык
Английский Deep South
пол
Женщина 221, Мужчина 1004, Неизвестно 7
Количество динамиков
1,232
Возраст
18-50
Обзор
Название
Английский Deep South Языковой набор данных
Тип набора данных
Общий разговор
Описание
Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) – 15-60 минут.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
Все часы
56
Частота дискретизации
8 кГц
Аудиоканала
Двойной
Платформа записи
Рабочий стол
Аудио форматы
. Wav
Формат транскрипции
.json
Вер (%)
5
Демографические данные набора данных
Страна
Английский Deep South
Язык
Английский Deep South
пол
Женщина 99, Мужчина 31, Неизвестно 0
Количество динамиков
130
Возраст
18-50
Обзор
Название
Английский Deep South Языковой набор данных
Тип набора данных
Подкасты
Описание
Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
Все часы
266
Частота дискретизации
16 кГц
Аудиоканала
Моно
Платформа записи
Веб-поиск
Аудио форматы
. Wav
Формат транскрипции
.json
Вер (%)
5
Демографические данные набора данных
Страна
Английский Deep South
Язык
Английский Deep South
пол
Женщина 204, Мужчина 356, Неизвестно 21
Количество динамиков
581
Возраст
18-50