Тамильский набор данных
தமிழ் தரவுத்தொகுப்பு
Откройте для себя мощь наборов данных тамильской речи для ASR, TTS и разговорного ИИ. Shaip предлагает премиальные наборы данных тамильской речи для обучения более умных языковых моделей.
Обзор
Название (Язык)
Набор данных на тамильском языке
Типы наборов данных
Колл-центр, общий разговор, медиаданные, подготовленный монолог
Страна
Индия
Описание
Этот набор данных включает в себя незаписанные синтетические разговоры агента с клиентом (5–15 минут), естественные телефонные разговоры между людьми (15–60 минут) и медиаданные с транскрипциями, предлагая разнообразные речевые данные для обучения и оценки речевых и языковых технологий.
Кейсы
ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
Детали набора данных
| Тип набора данных | Частота выборки | Спикеры | Канал | Все часы | Общее количество спикеров |
|---|---|---|---|---|---|
| Call Center | 8 кГц | 2 Выступающие | Двойной | 124:23:52 | 484 |
| Call Center | 16 кГц | 2 Выступающие | Моно | 199:44:21 | 1,986 |
| Общий разговор | 8 кГц | 2 Выступающие | Двойной | 101:42:05 | 440 |
| Общий разговор | 48 кГц | 2 Выступающие | Моно | 80:21:16 | 141 |
| Медиа данные | 16 кГц | Несколько динамиков | Моно | 43:07:01 | 32 |
| Монолог по сценарию | 24 кГц | Один динамик | Моно | 500:00:00 | По запросу |
Избранные клиенты
Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.
Не можете найти то, что ищете?
Новые готовые наборы данных собираются по всем типам данных.
Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи