Самые надежные службы сбора речевых данных для вашего ИИ

Обучите свои модели НЛП, виртуальные помощники, прототипы TTS и многое другое с помощью качественных разговорных данных с помощью наших служб сбора аудио- и речевых данных.

Сбор аудиоданных

Откройте для себя конвейеры аудиоданных без узких мест

Избранные клиенты

Профессиональные услуги по сбору аудио/голосовых данных

Любая тема. Любой сценарий.

В Shaip наш опыт заключается в создании высококачественных наборов речевых данных, предназначенных для различных требований AI/ML. Мы предлагаем широкий выбор языков и ведем запись в различных условиях, что делает наши наборы данных всеобъемлющими и адаптируемыми. ОНаша цель — предоставить моделям наибольший объем пользовательских речевых данных в кратчайшие сроки. С нами на борту вы можете рассчитывать на: 

Сбор речи
  • Кураторские высококачественные многоязычные аудио/голосовые данные для повышения точности
  • Максимально возможный уровень доменной специфичности для tвыбрать разнообразный сценарий установка
  •  Масштабируйте свою модель машинного обучения, чтобы она соответствовала различным демографическим характеристикам и вертикалям
  • Среда записи: Студийное качество, кристально чистый звук с минимальным фоновым шумом и Природная среда, где записи включают окружающие звуки, имитирующие реальные ситуации.

100+

Страны

55К +

Данные о часах речи

250+

Проекты

60+

Языки (более 100 диалектов)

8 / 16 / 44 / 48 кГц

Частота выборки

Наша экспертиза

Согласуйте аудиоданные с более умными моделями НЛП

Shaip предлагает услуги по непрерывному сбору речевых / аудиоданных на более чем 100+ языках, чтобы позволить голосовым технологиям обслуживать самые разные аудитории по всему миру. Мы можем работать над проектами любого объема и размера; от лицензирования существующих готовых наборов аудиоданных до управления сбором пользовательских аудиоданных, транскрипции и аннотации аудиоданных. Независимо от того, насколько велик ваш проект по сбору речевых данных, мы можем настроить службы сбора аудиоданных в соответствии с вашими потребностями для создания высококачественных наборов данных НЛП, ориентированных на диалекты, тона и языки. Выбирайте из нашего широкого спектра наборов речевых данных и ресурсов для сбора аудиоданных для интеллектуальных настроек голосовой связи.

Монологическая речь

Сборник монологов

Он фокусируется на обработке речи одного говорящего. Используйте скриптовые подсказки для подачи в одноканальные аудиофайлы, обеспечивая запись уникальных речевых шаблонов, тонов и нюансов, характерных для конкретного человека.

Диалоговая речь

Диалог Речь
Транспортировка

Взаимодействие двух человек, воспроизводящее реальные разговоры и диалоги с многоязычным доступом через двухканальные файлы и расшифрованные ресурсы.

Multi-party conversations

Группа / Мути-пати
Диалоги

Обсуждения с участием нескольких человек, фиксирующие групповую динамику, совпадения и различные тона для точной тренировки речевых моделей.

Высказывание на естественном языке

Коллекция высказываний на естественном языке

Обучите ИИ распознавать фразы или слова со схожим значением, используя разнообразные, насыщенные и аутентичные высказывания для более глубокой обработки и понимания естественного языка.

Акустическая речь

Акустические данные
Транспортировка

Мы можем профессионально записывать аудиоданные студийного качества, будь то рестораны, офисы или дома, или из разных сред и на разных языках, охватывая при этом более широкий акустический диапазон (комплексные наборы звуковых данных).

Автоматическое распознавание речи

Автоматическое распознавание речи (ASR)

Повысьте точность своих систем автоматического распознавания речи (ASR), получив доступ к современным диверсифицированным наборам речевых/аудиоданных из широкого спектра демографических данных.

Высказывание на естественном языке

Многоязычная речь/аудиообучающие данные

Наши квалифицированные лингвисты по всему миру предлагают многоязычные аудио/речевые данные на разных языках и диалектах. Эти усилия способствуют глобальному общению и преодолению языковых барьеров, способствуя созданию более инклюзивных и эффективных решений в области искусственного интеллекта.

Digital virtual assistants

Преобразование текста в речь
(ТТС)

Создайте многоязычную модель преобразования текста в речь (TTS) с помощью наших специалистов по всему миру, которые помогут вам собирать речевые данные на более чем 150 языках и диалектах, чтобы усовершенствовать ваши модели искусственного интеллекта — от элементов управления в автомобиле до чат-ботов и обучающих решений с высокой эффективностью. качественные аудиоданные.

Call center recordings

Call Center
Записи

Настоящий обмен информацией между агентами и клиентами, поддерживающий множество языков, таких как испанский, немецкий, американский английский, бенгальский, японский, китайский и хинди.

случай

Наборы данных разговорного ИИ, содержащие более 3 тысяч часов данных на 8 языках.

Стремясь создать многоязычную платформу для индийских языков, клиент заключил партнерское соглашение с Shaip для сбора, сегментации и расшифровки больших наборов данных на нескольких индийских языках. Это поможет разработать эффективные речевые модели, которые могут стать основой новой инновационной платформы клиента.

Проблема: Более 3,000 часов аудиоданных, собранных на 8 индийских языках, сегментированных и расшифрованных для автоматического распознавания речи.

Решение: Мы обеспечили сбор данных, сегментацию, транскрипцию и доставили файлы JSON с метаданными. Мы собрали 3000 часов аудиоданных на 8 индийских языках в большом масштабе для проекта речевой технологии клиента.

Speech data collection case study

Причины выбрать Shaip в качестве надежного партнера по сбору речевых данных

Люди

Люди

Выделенные и обученные команды:

  • Более 30,000 сотрудников по созданию, маркировке и контролю качества данных
  • Аттестованная команда управления проектами
  • Опытная команда по разработке продуктов
  • Команда поиска и адаптации кадрового резерва
Обработка

Обработка

Наивысшая эффективность процесса обеспечивается:

  • Надежный 6-сигма-технологический процесс
  • Специальная команда «черных поясов 6 сигм» - владельцы ключевых процессов и соблюдение требований к качеству
  • Непрерывное совершенствование и обратная связь
Платформа

Платформа

Запатентованная платформа предлагает преимущества:

  • Сквозная веб-платформа
  • Безупречное качество
  • Быстрее ТАТ
  • Бесшовная доставка

Готовые наборы речевых/аудиоданных

ПодробнееЯзыковой набор данныхЧастота дискретизацииТип набора данныхВсего часов аудиоОписаниеОписание набора данныхАудиоканалаПлатформа записиВер (%)Аудио форматыФормат транскрипцииКейсыКоличество динамиковCTA
речьru_US_CC_8Афроамериканский диалектАфроамериканский диалектen_US8 кГцКолл-центр211Данные колл-центра для афроамериканцевСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 612, Мужчин: 1242, Неизвестно: 12
речьru_US_MA_16Афроамериканский диалектАфроамериканский диалектen_US16 кГцМедиа Аудио154Данные афроамериканских народных СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 151, Мужчин: 150, Неизвестно: 10
речьАфрикаанс_GC_8АфрикаансАфрикаансaf_ZA8 кГцОбщий разговор368Данные общего разговора на африкаансНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, африкаанс, на котором говорят в Африке.ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 502, Мужчин: 390, Неизвестно: 2
речьАфрикаанс_MA_16АфрикаансАфрикаансaf_ZA16 кГцМедиа Аудио658Медиафайлы на африкаансЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 750, Мужчин: 1278, Неизвестно: 52
речьарабский_GC_8арабском арабском ar_AE8 кГцОбщий разговор292Данные для общего разговора на арабском языкеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, арабский язык из стран Персидского заливаДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 171, Мужчин: 534, Неизвестно: 1
речьАрабский_SM_48арабском арабском ар-SA48 кГцМонолог по сценарию1,947Монолог на арабском языкеЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 838 Мужчина 1209 Неизвестно 78
речьАссамский язык_CC_8АссамскийАссамский (в разработке) как вCall-центр60Ассамский (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАссамский_GCАссамскийАссамский (в разработке) как вОбщий разговор100Ассамский (в разработке) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАссамский_MAАссамскийАссамский (в разработке) как вМедиа Аудио40Аудиоданные мультимедиа на ассамском языке (в разработке)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский_CC_8БенгальскийБенгальский (в разработке) bn_INCall-центр60Бенгальский (в разработке) данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский_GCБенгальскийБенгальский (в разработке) bn_INОбщий разговор100Бенгальский (In Pipeline) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский_MAБенгальскийБенгальский (в разработке) bn_INМедиа Аудио40Бенгальский (In Pipeline) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБостон_CC_8Бостонский английскийБостонский английскийen_US8 кГцCall-центр177Данные колл-центра БостонаСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 605, Мужчин: 711, Неизвестно: 0
речьБостон_GC_8Бостонский английскийБостонский английскийen_US8 кГцОбщий разговор32Данные общего разговора в БостонеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 53, Мужчин: 83, Неизвестно: 0
речьБостон_MA_16Бостонский английскийБостонский английскийen_US16 кГцМедиа Аудио93Аудиоданные Boston MediaЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 43, Мужчин: 181, Неизвестно: 2
речьКанадский_SM_48Канадский французскийКанадский французскийFR-CA48 кГцМонолог по сценарию1,222Канадский французскийЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 974 Мужчина 631 Неизвестно 1
речьКитайский_CC_8Китайский английскийКитайский английскийen_US8 кГцCall-центр169Данные китайского колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 1790, Мужчин: 523 и Неизвестно: 13
речьКитайский_MA_16Китайский английскийКитайский английскийen_US16 кГцМедиа Аудио249Аудиоданные китайских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 126, Мужчин: 346 и Неизвестно: 6
речьКитайский упрощенный_SM_48Китайский упрощенныйКитайский упрощенныйZH-CN48 кГцМонолог по сценарию2,762Китайский упрощенныйЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1920 Мужчина 1535 Неизвестно 270
речьКитайский традиционный_SM_48Традиционный китайскийТрадиционный китайскийzh-TW48 кГцМонолог по сценарию1,028Традиционный китайскийЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1069 Мужчина 262 Неизвестно 3
речьдатский_GC_8ДатскийДатскийда_ДК8 кГцОбщий разговор372Датские общие разговорные данныеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 311, Мужчин: 417, Неизвестно: 0
речьдатский_MA_16ДатскийДатскийда_ДК16 кГцМедиа Аудио664Аудиоданные датских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 369, Мужчин: 864, Неизвестно: 27
речьДатский_SM_48ДатскийДатскийда-DK48 кГцМонолог по сценарию2,579Монолог на датском языкеЗаписи с одним высказыванием, длительностью от 5 до 30 секунд, датский из Дании.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1551 Мужчина 1233 Неизвестно 42
речьАнглийский Deep South_CC_8Английский Deep SouthАнглийский Deep Southen_US8 кГцCall-центр151English Данные колл-центра Deep SouthСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 221, Мужчина 1004, Неизвестно 7
речьАнглийский Deep South_GC_8Английский Deep SouthАнглийский Deep Southen_US8 кГцОбщий разговор56Данные английского Deep South General ConversationНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 99, Мужчина 31, Неизвестно 0
речьАнглийский Deep South_MA_16Английский Deep SouthАнглийский Deep Southen_US16 кГцМедиа Аудио266Аудиоданные Deep South Media на английском языкеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 204, Мужчина 356, Неизвестно 21
речьнемецкий_CC_8НемецкийНемецкийде-де8 кГцCall-центр64Данные немецкого колл-центра Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,МоноДля ПК. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 478 Мужчина 1440 Неизвестно 0
речьнемецкий_IVR_8НемецкийНемецкийде-де8 кГц IVR200IVR-данные ГерманииЧеловек к машине. Тип потока IVR, в котором есть подсказка TTS (например, «Чем я могу вам помочь»), за которой следует спонтанный ответ человека.МоноДля ПК. Wav .jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование Женщина 10115 Мужчина 8750 Неизвестно 0
речьГуджарати_CC_8ГуджаратиГуджарати (в разработке) gu_INCall-центр60Гуджарати (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьГуджарати_GCГуджаратиГуджарати (в разработке) gu_INОбщий разговор100Гуджарати (в конвейере) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьГуджарати_MAГуджаратиГуджарати (в разработке) gu_INМедиа Аудио40Аудиоданные мультимедиа гуджарати (в конвейере)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьИврит_Общий разговор_8древнееврейскийдревнееврейскийон_ИЛ8 кГцОбщий разговор399Данные общего разговора на ивритеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, иврит в ИзраилеДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 414 , Мужчина 399 , Неизвестно 1
речьИврит_MA_16древнееврейскийдревнееврейскийон_ИЛ16 кГцМедиа Аудио427Аудиоданные на иврите MediaЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 361, Мужчина 513, Неизвестно 13
речьХинди_MA_16ХиндиХиндипривет_IN16 кГцМедиа Аудио219Аудиоданные хинди-медиаЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 83, Мужчина 309, Неизвестно 0
речьХинди_SM_48ХиндиХиндипривет-IN48 кГцМонолог по сценарию2,867Монолог по сценарию на хиндиЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1977 Мужчина 1864 Неизвестно 147
речьХИНГЛИШ_CC_8хинглишхинглишhg_IN8 кГцCall-центр208HINGLISH Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 822, Мужчина 1262, Неизвестно 0
речьХИНГЛИШ_МА_16хинглишхинглишhg_IN16 кГцМедиа Аудио216HINGLISH Мультимедийные аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 75, Мужчина 380, Неизвестно 0
речьЛатиноамериканец_CC_8Латиноамериканский английскийЛатиноамериканский английскийen_US8 кГцCall-центр212Данные колл-центра для латиноамериканцевСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 822, Мужчина 1262, Неизвестно 0
речьЛатиноамериканец_MA_16Латиноамериканский английскийЛатиноамериканский английскийen_US16 кГцМедиа Аудио155Аудио для латиноамериканского звонкаЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 140, Мужчина 219, Неизвестно 5
речьИндонезийский_GC_8ИндонезийскийИндонезийскийя сделал8 кГцОбщий разговор496Данные индонезийского общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, индонезийский индонезийскийДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 524, Мужчина 454, Неизвестно 2
речьИндонезийский_MA_16ИндонезийскийИндонезийскийя сделал16 кГцМедиа Аудио643Аудиоданные индонезийских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 746, Мужчина 1507, Неизвестно 129
речьИрландский_GC_8ирландскийирландскийru_IE8 кГцОбщий разговор192Данные ирландского общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 213 , Мужчина 153 , Неизвестно 0
речьЯпонский_SM_48ЯпонскийЯпонскийJA-JP48 кГцМонолог по сценарию2,335Монолог по японскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1460 Мужчина 1221 Неизвестно 194
речьканнада_CC_8каннадыКаннада (в разработке) кн_ИНCall-центр60Каннада (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКаннада_GCканнадыКаннада (в разработке) кн_ИНОбщий разговор100Каннада (в конвейере) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКаннада_MAканнадыКаннада (в разработке) кн_ИНМедиа Аудио40Каннада (в конвейере) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКорейский_CC_8КорейскийКорейскийko_KR8 кГцCall-центр107Данные корейского колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1086, Мужчина 210, Неизвестно 4
речьКорейский_MA_16КорейскийКорейскийko_KR16 кГцМедиа Аудио204Звуковые данные корейских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 70 Мужчина 303, Неизвестно 25
речьКорейский_SM_48КорейскийКорейскийко-KR48 кГцМонолог по сценарию1,955Монолог по корейскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1195 Мужчина 1134 Неизвестно 122
речьМалайский_GC_8MalayMalayмс_МГ8 кГцОбщий разговор266Данные малайского общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, малайский в Малайзии.ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 316, Мужчина 176, Неизвестно 0
речьМалайский_MA_16MalayMalayмс_МГ16 кГцМедиа Аудио344Аудиоданные малайских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 236, Мужчина 626, Неизвестно 47
речьмалаялам_CC_8МалайяламМалаялам (в разработке) мл_INCall-центр60Малаялам (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМалаялам_GCМалайяламМалаялам (в разработке) мл_INОбщий разговор100Малаялам (в конвейере) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМалаялам_MAМалайяламМалаялам (в разработке) мл_INМедиа Аудио40Малаялам (In Pipeline) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьмаратхи_CC_8МаратхиМаратхи (в разработке) г-н_INCall-центр60Данные колл-центра на языке маратхи (в разработке)Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьмаратхи_GCМаратхиМаратхи (в разработке) г-н_INОбщий разговор100Маратхи (в конвейере) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМаратхи_MAМаратхиМаратхи (в разработке) г-н_INМедиа Аудио40Аудиоданные мультимедиа маратхи (в конвейере)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМексиканский_SM_48Испанский (Мексика)Испанский (Мексика)эс-MX48 кГцМонолог по сценарию1,492Мексиканский монолог по испанскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1016 Мужчина 1069 Неизвестно 95
речьНидерланды_SM_48ГолландскийГолландскийNL-NL48 кГцМонолог по сценарию1,205Монолог по голландскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1285 Мужчина 531 Неизвестно 3
речьНью-Йорк английский_CC_8Нью-йоркский английскийНью-йоркский английскийen_US8 кГцCall-центр103Данные колл-центра New York EnglishСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 610, Мужчина 532, Неизвестно 0
речьНью-Йорк English_GC_8Нью-йоркский английскийНью-йоркский английскийen_US8 кГцОбщий разговор107Данные общего разговорного английского в Нью-ЙоркеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 118, Мужчина 114, Неизвестно 0
речьНью-Йорк английский_MA_16Нью-йоркский английскийНью-йоркский английскийen_US16 кГцМедиа Аудио140Аудиоданные New York English MediaЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 66, Мужчина 230, Неизвестно 11
речьНовая Зеландия_GC_8Новозеландский английский Новозеландский английский ru_NZ8 кГцОбщий разговор148Данные новозеландского английского для общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 167, мужчина 121, Неизвестно 4
речьНовая Зеландия_MA_16Новозеландский английский Новозеландский английский ru_NZ16 кГцМедиа Аудио400Новозеландский английский СМИ аудиоЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 367, мужчина 678, Неизвестно 26
речьОрия_CC_8ОрияОрия (в разработке) или_INCall-центр60Oriya (In Pipeline) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьОрия_GCОрияОрия (в разработке) или_INОбщий разговор100Oriya (In Pipeline) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьОрия_МАОрияОрия (в разработке) или_INМедиа Аудио40Аудиоданные мультимедиа Oriya (In Pipeline)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьПольский_MA_16ПольскийПольскийpl_PL16 кГцМедиа Аудио269Польские СМИ аудиоЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 173 Мужчина 354 Неизвестно 6
речьПольский Poland_SM_48Польский (польша)Польский (польша)PL-PL48 кГцМонолог по сценарию1,482Польская Польша - Монолог по сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1324 Мужчина 701 Неизвестно 24
речьПанджаби_CC_8панджабиПенджаби (в разработке) панджабиCall-центр60Панджаби (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьпанджаби_GCпанджабиПенджаби (в разработке) панджабиОбщий разговор100Панджаби (в разработке) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьПенджаби_MAпанджабиПенджаби (в разработке) панджаби Медиа Аудио40Пенджаби (в конвейере) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьРусский_SM_48РусскийРусскийRU-RU48 кГцМонолог по сценарию2,398Монолог по русскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1689 Мужчина 1937 Неизвестно 214
речьшотландский_GC_8Шотландский (английский акцент)Шотландский (английский акцент)ru_AB8 кГцОбщий разговор292Данные шотландского общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 285, Мужчина 260, Неизвестно 3
речьСингапур_CC_8Сингапурский английскийСингапурский английскийru_SG8 кГцCall-центр218Данные колл-центра СингапураСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 2139, Мужчина 884, Неизвестно 21
речьСингапур_MA_16Сингапурский английскийСингапурский английскийru_SG16 кГцМедиа Аудио247Аудиоданные Сингапурских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 160, Мужчина 455, Неизвестно 37
речьЮжноафриканский английский_CC_8Южноафриканский английскийЮжноафриканский английскийru_ZA8 кГцCall-центр261Данные южноафриканского английского колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1274 , Мужчина 935 , Неизвестно 1
речьЮжноафриканский английский_MA_16Южноафриканский английскийЮжноафриканский английскийru_ZA16 кГцМедиа Аудио251Звуковые данные южноафриканских английских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 235, Мужчина 432, Неизвестно 36
речьСуахили_CC_8суахилисуахилиsw_KE8 кГцCall-центр230Данные колл-центра на суахилиСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 611, Мужчина 833, Неизвестно 0
речьСуахили_MA_16суахилисуахилиsw_KE16 кГцМедиа Аудио265Аудиоданные СМИ суахилиЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 118, Мужчина 493, Неизвестно 25
речьШведский_CC_8ШведскийШведскийsv_SE8 кГцCall-центр250Данные шведского колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1581, мужчина 727, Неизвестно 2
речьШведский_MA_16ШведскийШведскийsv_SE16 кГцМедиа Аудио278Аудиоданные шведских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 195, мужчина 500, Неизвестно 21
речьТамильский_CC_8ТамильскийТамильский (в разработке) ta_INCall-центр60Тамильский (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТамильский_GCТамильскийТамильский (в разработке) ta_INОбщий разговор100Тамильский (в разработке) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТамил_MAТамильский Тамильский (в разработке) ta_INМедиа Аудио40Аудиоданные мультимедиа на тамильском языке (в разработке)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТелугу_GC_8ТелугуТелугуte_IN8 кГцОбщий разговор553Общие разговорные данные на телугуНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 574, Мужчина 564, Неизвестно 0
речьТелугу_MA_16ТелугуТелугуte_IN16 кГцМедиа Аудио648Аудиоданные телугу MediaЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 207, Мужчина 963, Неизвестно 2
речьТелугу_CC_8ТелугуТелугу (в разработке) te_INCall-центр30Телугу (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТелугу_GCТелугуТелугу (в разработке) te_INОбщий разговор50Телугу (в конвейере) Общие данные беседыСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТелугу_MAТелугуТелугу (в разработке) te_INМедиа Аудио20Телугу (в конвейере) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТайский_GC_8ТайскийТайскийth_TH8 кГцОбщий разговор183Тайский общий разговорНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, неформальная регистрация, используемая между друзьями.ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 338, Мужчина 96, Неизвестно 8
речьТайский_MA_8ТайскийТайскийth_TH16 кГцМедиа Аудио173Тайские СМИ аудиоЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 143, Мужчина 502, Неизвестно 26
речьТурецкая Турция_SM_48Турецкая ТурцияТурецкая ТурцияTR-TR48 кГцМонолог по сценарию2,027Турецкая ТурцияЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1561 Мужчина 1241 Неизвестно 31
речьВьетнамский_GC_8ВьетнамскийВьетнамскийvi_VN8 кГцОбщий разговор295Данные вьетнамского общего разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, северный (например, Ханой), центральный и южный (например, Хошимин).ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщины 400, мужчины 380, Неизвестные 2
речьВьетнамский_MA_16ВьетнамскийВьетнамскийvi_VN16 кГцМедиа Аудио257Аудиоданные вьетнамских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщины 249, мужчины 200, Неизвестные 45
речьУэльский_GC_8Валлийский (английский акцент)Валлийский (английский акцент)ru_WL8 кГцОбщий разговор278Данные валлийского общего разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 270, Мужчина 324, Неизвестно 0
речьВеликобритания английский_WW_16Великобритания АнглийскийВеликобритания Английскийru_uk16 кГцWake Word200 ВыступающиеWake Word (Великобритания) английскийсбор данных по ключевым фразам
  • 200 колонки
  • 4 уникальные ключевые фразы на каждого говорящего
  • 25-30 повторяющихся записей ключевых фраз на одну уникальную ключевую фразу
  • 25-30 аудиофайлов на уникальную ключевую фразу
  • Всего 120 записанных высказываний на говорящего
1 каналМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеПол: 50% мужчин, 50% женщин, +/- 10%.

Предлагаемые услуги

Экспертный сбор аудиоданных - это не все, что нужно для комплексных настроек ИИ. В Shaip вы даже можете рассмотреть следующие услуги, чтобы сделать модели более распространенными, чем обычно:

Сбор текстовых данных

Сбор текстовых данных
Услуги

Истинная ценность сервисов сбора когнитивных данных Shaip заключается в том, что они дают организациям ключ к разблокированию важной информации, содержащейся в неструктурированных данных.

Сбор данных изображений

Услуги по сбору данных об изображениях

Убедитесь, что ваша модель компьютерного зрения точно идентифицирует каждое изображение, чтобы беспрепятственно обучать модели искусственного интеллекта следующего поколения будущего.

Сбор видеоданных

Услуги по сбору видеоданных

Теперь сосредоточьтесь на компьютерном зрении вместе с НЛП, чтобы научить свои модели в совершенстве определять объекты, людей, сдерживающие факторы и другие визуальные элементы.

Свяжитесь с нами

Хотите создать свой собственный набор аудиоданных?

Свяжитесь с нашим штатным экспертом по сбору речевых данных, чтобы настроить репозиторий аудио, который наилучшим образом соответствует вашим требованиям.

  • Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.

Сбор речевых данных для модели машинного обучения — это процесс сбора аудиозаписей разговорной речи. Этот сборник помогает в обучении и совершенствовании алгоритмов машинного обучения, особенно тех, которые ориентированы на понимание и обработку человеческих голосов.

Если вы хотите собрать аудиоданные для автоматического распознавания речи (ASR), вам следует начать с определения конкретных потребностей вашего проекта, включая желаемый язык, акцент и тип речи. После установки этих параметров убедитесь, что вы получили все необходимые разрешения для соблюдения конфиденциальности пользователей. Затем используйте соответствующие записывающие устройства или программное обеспечение для записи четких аудиосэмплов. Каждая запись должна быть тщательно аннотирована ее транскрипцией или другими соответствующими метаданными и систематически храниться для облегчения доступа.

Набор речевых данных в машинном обучении имеет решающее значение для обучения, тестирования и проверки моделей, предназначенных для распознавания, транскрипции или интерпретации разговорной речи. Такие наборы данных открывают путь для множества приложений: от голосовых помощников и служб транскрипции до голосовой биометрии.

Для сбора точных данных о разных языках и акцентах жизненно важно сотрудничество с носителями языка желаемого языкового происхождения. Стремитесь к разнообразной и репрезентативной выборке, охватывающей широкий спектр демографических нюансов. Используйте стандартизированное записывающее оборудование в единых средах, чтобы обеспечить согласованность звука. И что немаловажно, аннотируйте каждый фрагмент данных подробными транскрипциями и метаданными, обозначая конкретный язык и акцент.