Готовые наборы данных для обучения ИИ

Наборы данных для обучения чат-ботов, здравоохранения и разговорных моделей ИИ

Примеры наборов данных

Получите доступ к высококачественным масштабируемым наборам данных для обучения чат-ботов, разговорного ИИ и приложений для здравоохранения

Наборы данных включают час разговорных данных обучения ИИ на таких языках, как австралийский английский, британский английский, датский, хинди, индонезийский, малайский, африкаанс, арабский, ирландский и др. Данные здравоохранения состоят из надиктованных врачом аудиозаписей с подробным описанием клинических состояний пациентов и планов лечения, а также транскрибированных разговоров и клинических документов.

DatasetsФайлКейсыОписаниеСкачать
Диктант врача
Аудиофайлы под диктовку врача
Аудио файлы
Здравоохранение.Аудиозапись, надиктованная врачами, описывающая клиническое состояние пациентов и план лечения в больнице/клинике.
Диктант врача
Дословно расшифрованные текстовые файлы
Дословно записанные текстовые файлы
Здравоохранение.Набор транскрибированных документов, соответствующих набору аудиоданных диктовки. Дословная транскрипция, необходимая для тренировки акустических и лексических моделей распознавания речи.
Клинические заметки врача
Записи под диктовку врача
Заметки под диктовку
Здравоохранение.Набор клинических документов, продиктованных врачом, с описанием клинического состояния пациента.
Клинические заметки врача
Записи под диктовку врача
Обезличенные диктовки
Здравоохранение.Набор отформатированных клинических документов, продиктованных врачами для обучения медицинских моделей искусственного интеллекта.
Разговоры между человеком и ботом
австралийский английский
Австралийский английский
Разговорный ИИПример аудиоразговора и соответствующие расшифрованные файлы JSON
Разговоры между человеком и ботом
британский английский
Великобритания Английский
Разговорный ИИПример аудиоразговора и соответствующие расшифрованные файлы JSON
Наборы данных разговоров
Датский
Датский
Разговорный ИИПример аудиоразговора и соответствующие расшифрованные файлы JSON
Наборы данных разговоров
Хинди
Хинди
Разговорный ИИПример аудиоразговора и соответствующие расшифрованные файлы JSON
Наборы данных разговоров
Телугу
Телугу
Разговорный ИИПример аудиоразговора и соответствующие расшифрованные файлы JSON
Наборы данных разговоров
Индонезийский
Индонезийский
Разговорный ИИПример аудиоразговора и соответствующие расшифрованные файлы JSON
Наборы данных разговоров
древнееврейский
древнееврейский
Разговорный ИИПример аудиоразговора и соответствующие расшифрованные файлы JSON
Наборы данных разговоров
Malay
Malay
Разговорный ИИПример аудиоразговора и соответствующие расшифрованные файлы JSON
Наборы данных разговоров
Африкаанс
Африкаанс
Разговорный ИИПример аудиоразговора и соответствующие расшифрованные файлы JSON
Наборы данных разговоров
арабском
арабском
Разговорный ИИПример аудиоразговора и соответствующие расшифрованные файлы JSON
Наборы данных разговоров
ирландский
ирландский
Разговорный ИИПример аудиоразговора и соответствующие расшифрованные файлы JSON
Наборы данных разговоров
Шотландский
Шотландский
Разговорный ИИПример аудиоразговора и соответствующие расшифрованные файлы JSON
Наборы данных разговоров
валлийский
валлийский
Разговорный ИИПример аудиоразговора и соответствующие расшифрованные файлы JSON