Тамильский набор данных

தமிழ் தரவுத்தொகுப்பு

Откройте для себя мощь наборов данных тамильской речи для ASR, TTS и разговорного ИИ. Shaip предлагает премиальные наборы данных тамильской речи для обучения более умных языковых моделей.

Обзор

Название (Язык)

Набор данных на тамильском языке

Типы наборов данных

Колл-центр, общий разговор, медиаданные, подготовленный монолог

Страна

Индия

Описание

Этот набор данных включает в себя незаписанные синтетические разговоры агента с клиентом (5–15 минут), естественные телефонные разговоры между людьми (15–60 минут) и медиаданные с транскрипциями, предлагая разнообразные речевые данные для обучения и оценки речевых и языковых технологий.

Кейсы

ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование

Детали набора данных

Тип набора данных Частота выборки Спикеры Канал Все часы Общее количество спикеров
Call Center 8 кГц 2 Выступающие Двойной 124:23:52 484
Call Center 16 кГц 2 Выступающие Моно 199:44:21 1,986
Общий разговор 8 кГц 2 Выступающие Двойной 101:42:05 440
Общий разговор 48 кГц 2 Выступающие Моно 80:21:16 141
Медиа данные 16 кГц Несколько динамиков Моно 43:07:01 32
Монолог по сценарию 24 кГц Один динамик Моно 500:00:00 По запросу

Избранные клиенты

Расширение возможностей команд для создания ведущих в мире продуктов искусственного интеллекта.

Amazon
Google
Microsoft
Свяжитесь с нами

Не можете найти то, что ищете?

Новые готовые наборы данных собираются по всем типам данных.

Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи

  • Это поле для целей проверки и должны быть оставлены без изменений.
  • Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.