Набор данных на иврите
ערכת נתונים עברית
Высококачественный набор данных для разговоров на иврите и подкастов для моделей искусственного интеллекта и речи
Обзор
Название (Язык)
Набор данных по ивриту
Типы наборов данных
Общий разговор, медиаданные
Страна
Израиль
Описание
Доступны незаписанные телефонные разговоры на иврите между двумя людьми из Израиля продолжительностью от 15 до 60 минут, а также лицензируемые общедоступные аудио- и видеофайлы, такие как интервью и подкасты с 1–5 участниками, также продолжительностью от 15 до 60 минут.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
| Тип набора данных | Частота выборки | Спикеры | Канал | Все часы | Общее количество спикеров |
|---|---|---|---|---|---|
| Общий разговор | 8 кГц | 2 Выступающие | Двойной | 398:47:10 | 814 |
| Медиа данные | 16 кГц | Несколько динамиков | Моно | 426:14:16 | 885 |
Избранные клиенты
Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.
Не можете найти то, что ищете?
Новые готовые наборы данных собираются по всем типам данных.
Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи
Обзор
Название
древнееврейский Языковой набор данных
Тип набора данных
Общий разговор
Описание
Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, иврит в Израиле.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
Все часы
399
Частота дискретизации
8 кГц
Аудиоканала
Двойной
Платформа записи
Рабочий стол
Аудио форматы
. Wav
Формат транскрипции
.json
Вер (%)
5
Демографические данные набора данных
Страна
Израиль
Язык
древнееврейский
пол
Женщина 414, Мужчина 399, Неизвестно 1
Количество динамиков
814
Возраст
18-50
Обзор
Название
древнееврейский Языковой набор данных
Тип набора данных
Подкасты
Описание
Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
Все часы
427
Частота дискретизации
16 кГц
Аудиоканала
Моно
Платформа записи
Веб-поиск
Аудио форматы
. Wav
Формат транскрипции
.json
Вер (%)
5
Демографические данные набора данных
Страна
Израиль
Язык
древнееврейский
пол
Женщина 361, Мужчина 513, Неизвестно 13
Количество динамиков
887
Возраст
18-50