Самые надежные службы сбора речевых данных для ваших ИИ

Обучите свои модели НЛП, виртуальные помощники, прототипы TTS и многое другое с помощью качественных разговорных данных с помощью наших служб сбора аудио- и речевых данных.

Сбор аудиоданных

Откройте для себя конвейеры аудиоданных без узких мест.

Избранные клиенты

Зачем нужен набор данных для обучения речи для обработки естественного языка?

Вы когда-нибудь замечали, что ваш смартфон VA, то есть Siri, Bixby или что-то еще, взаимодействует? То, как они отвечают на каждый вопрос, анализируют и представляют результаты в соответствии с вашими требованиями!

Что ж, как бы нас ни интриговали эти виртуальные машины, эти интеллектуальные ресурсы и программы необходимо постепенно обучать, чтобы они могли реагировать так же точно. Именно по этой причине вам следует рассмотреть возможность аутсорсинга сбора речи/аудио и голосовых данных специализированным компаниям по сбору данных, обладающим подтвержденным профессиональным опытом.

Инвестирование в сбор аудиоданных подготавливает ваше предполагаемое НЛП для обслуживания многоязычной аудитории. Мало того, сбор речевых данных для НЛП, когда он обрабатывается экспертом, даже принимает во внимание сбор в полевых условиях, семантический анализ и аудиотранскрипцию. Используя профессиональные решения для сбора речевых данных, вы можете:

  • Приобретайте высококачественные наборы аудиоданных для повышения точности
  • Целевая настройка разнообразных сценариев
  • Сбор многоязычных обучающих данных ИИ
  • Масштабируйте свою модель машинного обучения, чтобы она соответствовала различным демографическим характеристикам и вертикалям

Профессиональные услуги по сбору аудио / голосовых данных для НЛП

Любая тема. Любой сценарий.

Интеллектуальные системы НЛП далеко не универсальны. В зависимости от функциональности программы вам, возможно, придется сосредоточиться на услугах пространственных и многоязычных аудиоданных, которые могут быть предложены только известными компаниями по сбору голосовых / аудиоданных. Именно здесь Shaip входит в схему вещей как высоконадежный поставщик услуг передачи данных, который гордится тем, что делает тяжелую работу для ваших якобы интеллектуальных ИИ.

В Shaip основное внимание уделяется кормлению моделей максимально возможным объемом пользовательских образцов речи в кратчайшие сроки. С нами на борту вы можете рассчитывать:

Сборник речей
  • Курируемый сбор аудио / голосовых данных для НЛП
  • Индивидуальные программы, отвечающие конкретным вариантам использования
  • Подготовка к интеллектуальному анализу аудиоданных
  • Индивидуальная и автоматизированная обработка данных
  • Максимально возможный уровень доменной специфики
  • Более быстрый выход на рынок с ускоренными моделями искусственного интеллекта

Наша экспертиза

Выровняйте аудиоданные для подготовки интеллектуальных моделей НЛП

Shaip предлагает услуги по непрерывному сбору речевых / аудиоданных на более чем 100+ языках, чтобы позволить голосовым технологиям обслуживать самые разные аудитории по всему миру. Мы можем работать над проектами любого объема и размера; от лицензирования существующих готовых наборов аудиоданных до управления сбором пользовательских аудиоданных, транскрипции и аннотации аудиоданных. Независимо от того, насколько велик ваш проект по сбору речевых данных, мы можем настроить службы сбора аудиоданных в соответствии с вашими потребностями для создания высококачественных наборов данных НЛП, ориентированных на диалекты, тона и языки. Выбирайте из нашего широкого спектра наборов речевых данных и ресурсов для сбора аудиоданных для интеллектуальных настроек голосовой связи.

Речь монолога

Сборник монологов

Выполняйте требования на основе речи, относящиеся к автономному динамику для ваших прототипов преобразования текста в скорость, и требования, связанные с транскрипцией, с помощью скриптовых подсказок через одноканальные файлы.

Диалог Речь

Диалог Речь
Коллекция

Настройте интеллектуальных виртуальных помощников, чат-ботов с заданной скоростью и модели автоматического распознавания речи с многоязычным представлением через двухканальные файлы и транскрибированные ресурсы.

Акустическая речь

Акустические данные
Коллекция

Мы можем профессионально записывать аудиоданные студийного качества, будь то рестораны, офисы или дома, или из различных сред и языков, через нашу глобальную сеть сотрудников, при этом охватывая более широкий акустический диапазон.

Высказывание на естественном языке

Коллекция высказываний на естественном языке

Обучите интеллектуальные коммерческие установки определять по-разному произносимые клиентские фразы со схожим значением, чтобы сделать ИИ более автономными во времени.

Цифровые виртуальные помощники

Цифровой / Виртуальный
Помощники

Сосредоточьтесь на создании своего будущего виртуального помощника, обучая модели с оговорками, касающимися человеческой речи, многоязычного взаимодействия, контекстного анализа и NLU.

Автоматическое распознавание речи

Автоматическое распознавание речи (ASR)

Повысьте точность своих систем автоматического распознавания речи (ASR), получив доступ к современным диверсифицированным наборам речевых/аудиоданных из широкого спектра демографических данных.

Высказывание на естественном языке

Многоязычная речь/аудиообучающие данные

Наши высококвалифицированные лингвисты по всему миру предлагают многоязычные аудио/речевые обучающие данные на нескольких языках и диалектах, включая арабский, датский, китайский, африкаанс, сингапурский, новозеландский, иврит, индонезийский, ирландский, корейский, малайский, польский, шотландский, шведский. , французский, немецкий, вьетнамский, тайский, итальянский, испанский и другие.

Цифровые виртуальные помощники

Преобразование текста в речь
(ТТС)

Чтобы предложить лучший пользовательский опыт с TTS, крайне важно разработать систему, которая будет звучать естественно. Создайте многоязычную модель преобразования текста в речь (TTS) с помощью наших сотрудников по всему миру, которые помогут вам собрать речевые данные на более чем 150 языках и диалектах, чтобы улучшить ваши модели искусственного интеллекта, от элементов управления в автомобиле до чат-ботов и обучающих решений с высокой точностью. качественные аудиоданные.

Причины выбрать Shaip в качестве надежного партнера по сбору речевых данных

Люди

Люди

Выделенные и обученные команды:

  • Более 30,000 сотрудников по созданию, маркировке и контролю качества данных
  • Аттестованная команда управления проектами
  • Опытная команда по разработке продуктов
  • Команда поиска и адаптации кадрового резерва
Обработка

Обработка

Наивысшая эффективность процесса обеспечивается:

  • Надежный 6-сигма-технологический процесс
  • Специальная команда «черных поясов 6 сигм» - владельцы ключевых процессов и соблюдение требований к качеству
  • Непрерывное совершенствование и обратная связь
Платформа

Платформа

Запатентованная платформа предлагает преимущества:

  • Сквозная веб-платформа
  • Безупречное качество
  • Быстрее ТАТ
  • Бесшовная доставка

Язык: собраны наборы аудиоданных

Готовые наборы речевых/аудиоданных

ПодробностиЯзыковой набор данныхЧастота дискретизацииТип набора данныхВсего часов аудиоОписаниеОписание набора данныхАудиоканалаПлатформа записиВер (%)Аудио форматыФормат транскрипцииКейсыКоличество динамиковCTA
речьen_US_CC_8Афроамериканский диалектАфроамериканский диалектen_US8 кГцКолл-центр211Данные колл-центра для афроамериканцевСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 612, Мужчин: 1242, Неизвестно: 12
речьen_US_MA_16Афроамериканский диалектАфроамериканский диалектen_US16 кГцМедиа Аудио154Данные афроамериканских народных СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 151, Мужчин: 150, Неизвестно: 10
речьАфрикаанс_GC_8АфрикаансАфрикаансaf_ZA8 кГцОбщий разговор368Данные общего разговора на африкаансНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, африкаанс, на котором говорят в Африке.ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 502, Мужчин: 390, Неизвестно: 2
речьАфрикаанс_MA_16АфрикаансАфрикаансaf_ZA16 кГцМедиа Аудио658Медиафайлы на африкаансЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 750, Мужчин: 1278, Неизвестно: 52
речьарабский_GC_8арабском арабском ar_AE8 кГцОбщий разговор292Данные для общего разговора на арабском языкеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, арабский язык из стран Персидского заливаДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 171, Мужчин: 534, Неизвестно: 1
речьАрабский_SM_48арабском арабском ар-SA48 кГцМонолог по сценарию1,947Монолог на арабском языкеЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 838 Мужчина 1209 Неизвестно 78
речьАссамский язык_CC_8АссамскийАссамский (в разработке) как вCall-центр60Ассамский (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАссамский_GCАссамскийАссамский (в разработке) как вОбщий разговор100Ассамский (в разработке) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАссамский_MAАссамскийАссамский (в разработке) как вМедиа Аудио40Аудиоданные мультимедиа на ассамском языке (в разработке)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский_CC_8БенгальскийБенгальский (в разработке) bn_INCall-центр60Бенгальский (в разработке) данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский_GCБенгальскийБенгальский (в разработке) bn_INОбщий разговор100Бенгальский (In Pipeline) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский_MAБенгальскийБенгальский (в разработке) bn_INМедиа Аудио40Бенгальский (In Pipeline) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБостон_CC_8Бостонский английскийБостонский английскийen_US8 кГцКолл-центр177Данные колл-центра БостонаСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 605, Мужчин: 711, Неизвестно: 0
речьБостон_GC_8Бостонский английскийБостонский английскийen_US8 кГцОбщий разговор32Данные общего разговора в БостонеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 53, Мужчин: 83, Неизвестно: 0
речьБостон_MA_16Бостонский английскийБостонский английскийen_US16 кГцМедиа Аудио93Аудиоданные Boston MediaЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 43, Мужчин: 181, Неизвестно: 2
речьКанадский_SM_48Канадский французскийКанадский французскийFR-CA48 кГцМонолог по сценарию1,222Канадский французскийЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 974 Мужчина 631 Неизвестно 1
речьКитайский_CC_8Китайский английскийКитайский английскийen_US8 кГцКолл-центр169Данные китайского колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 1790, Мужчин: 523 и Неизвестно: 13
речьКитайский_MA_16Китайский английскийКитайский английскийen_US16 кГцМедиа Аудио249Аудиоданные китайских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 126, Мужчин: 346 и Неизвестно: 6
речьКитайский упрощенный_SM_48Китайский упрощенныйКитайский упрощенныйZH-CN48 кГцМонолог по сценарию2,762Китайский упрощенныйЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1920 Мужчина 1535 Неизвестно 270
речьКитайский традиционный_SM_48Традиционный китайскийТрадиционный китайскийzh-TW48 кГцМонолог по сценарию1,028Традиционный китайскийЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1069 Мужчина 262 Неизвестно 3
речьдатский_GC_8датский языкдатский языкda_DK8 кГцОбщий разговор372Датские общие разговорные данныеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 311, Мужчин: 417, Неизвестно: 0
речьдатский_MA_16датский языкдатский языкda_DK16 кГцМедиа Аудио664Аудиоданные датских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 369, Мужчин: 864, Неизвестно: 27
речьДатский_SM_48датский языкдатский языкда-DK48 кГцМонолог по сценарию2,579Монолог на датском языкеЗаписи с одним высказыванием, длительностью от 5 до 30 секунд, датский из Дании.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1551 Мужчина 1233 Неизвестно 42
речьАнглийский Deep South_CC_8Английский Deep SouthАнглийский Deep Southen_US8 кГцКолл-центр151English Данные колл-центра Deep SouthСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 221, Мужчина 1004, Неизвестно 7
речьАнглийский Deep South_GC_8Английский Deep SouthАнглийский Deep Southen_US8 кГцОбщий разговор56Данные английского Deep South General ConversationНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 99, Мужчина 31, Неизвестно 0
речьАнглийский Deep South_MA_16Английский Deep SouthАнглийский Deep Southen_US16 кГцМедиа Аудио266Аудиоданные Deep South Media на английском языкеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 204, Мужчина 356, Неизвестно 21
речьнемецкий_CC_8НемецкийНемецкийде-де8 кГцКолл-центр64Данные немецкого колл-центра Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,МоноДля ПК. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 478 Мужчина 1440 Неизвестно 0
речьнемецкий_IVR_8НемецкийНемецкийде-де8 кГц IVR200IVR-данные ГерманииЧеловек к машине. Тип потока IVR, в котором есть подсказка TTS (например, «Чем я могу вам помочь»), за которой следует спонтанный ответ человека.МоноДля ПК. Wav .jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование Женщина 10115 Мужчина 8750 Неизвестно 0
речьГуджарати_CC_8гуджаратиГуджарати (в разработке) gu_INCall-центр60Гуджарати (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьГуджарати_GCгуджаратиГуджарати (в разработке) gu_INОбщий разговор100Гуджарати (в конвейере) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьГуджарати_MAгуджаратиГуджарати (в разработке) gu_INМедиа Аудио40Аудиоданные мультимедиа гуджарати (в конвейере)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьИврит_Общий разговор_8древнееврейскийдревнееврейскийон_ИЛ8 кГцОбщий разговор399Данные общего разговора на ивритеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, иврит в ИзраилеДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 414 , Мужчина 399 , Неизвестно 1
речьИврит_MA_16древнееврейскийдревнееврейскийон_ИЛ16 кГцМедиа Аудио427Аудиоданные на иврите MediaЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 361, Мужчина 513, Неизвестно 13
речьХинди_MA_16ХиндиХиндипривет_IN16 кГцМедиа Аудио219Аудиоданные хинди-медиаЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 83, Мужчина 309, Неизвестно 0
речьХинди_SM_48ХиндиХиндипривет-IN48 кГцМонолог по сценарию2,867Монолог по сценарию на хиндиЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1977 Мужчина 1864 Неизвестно 147
речьHINGLISH_CC_8хинглишхинглишhg_IN8 кГцКолл-центр208HINGLISH Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 822, Мужчина 1262, Неизвестно 0
речьHINGLISH_MA_16хинглишхинглишhg_IN16 кГцМедиа Аудио216HINGLISH Мультимедийные аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 75, Мужчина 380, Неизвестно 0
речьЛатиноамериканец_CC_8Латиноамериканский английскийЛатиноамериканский английскийen_US8 кГцКолл-центр212Данные колл-центра для латиноамериканцевСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 822, Мужчина 1262, Неизвестно 0
речьЛатиноамериканец_MA_16Латиноамериканский английскийЛатиноамериканский английскийen_US16 кГцМедиа Аудио155Аудио для латиноамериканского звонкаЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 140, Мужчина 219, Неизвестно 5
речьИндонезийский_GC_8IndonesianIndonesianя сделал8 кГцОбщий разговор496Данные индонезийского общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, индонезийский индонезийскийДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 524, Мужчина 454, Неизвестно 2
речьИндонезийский_MA_16IndonesianIndonesianя сделал16 кГцМедиа Аудио643Аудиоданные индонезийских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 746, Мужчина 1507, Неизвестно 129
речьИрландский_GC_8ирландскийирландскийen_IE8 кГцОбщий разговор192Данные ирландского общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 213 , Мужчина 153 , Неизвестно 0
речьЯпонский_SM_48ЯпонскийЯпонскийJA-JP48 кГцМонолог по сценарию2,335Монолог по японскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1460 Мужчина 1221 Неизвестно 194
речьканнада_CC_8каннадыКаннада (в разработке) kn_INCall-центр60Каннада (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКаннада_GCканнадыКаннада (в разработке) kn_INОбщий разговор100Каннада (в конвейере) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКаннада_MAканнадыКаннада (в разработке) kn_INМедиа Аудио40Каннада (в конвейере) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКорейский_CC_8KoreanKoreanko_KR8 кГцКолл-центр107Данные корейского колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1086, Мужчина 210, Неизвестно 4
речьКорейский_MA_16KoreanKoreanko_KR16 кГцМедиа Аудио204Звуковые данные корейских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 70 Мужчина 303, Неизвестно 25
речьКорейский_SM_48KoreanKoreanко-KR48 кГцМонолог по сценарию1,955Монолог по корейскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1195 Мужчина 1134 Неизвестно 122
речьМалайский_GC_8MalayMalayмс_МГ8 кГцОбщий разговор266Данные малайского общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, малайский в Малайзии.ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 316, Мужчина 176, Неизвестно 0
речьМалайский_MA_16MalayMalayмс_МГ16 кГцМедиа Аудио344Аудиоданные малайских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 236, Мужчина 626, Неизвестно 47
речьмалаялам_CC_8МалайяламМалаялам (в разработке) мл_INCall-центр60Малаялам (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМалаялам_GCМалайяламМалаялам (в разработке) мл_INОбщий разговор100Малаялам (в конвейере) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМалаялам_MAМалайяламМалаялам (в разработке) мл_INМедиа Аудио40Малаялам (In Pipeline) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьмаратхи_CC_8маратхиМаратхи (в разработке) г-н_INCall-центр60Данные колл-центра на языке маратхи (в разработке)Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьмаратхи_GCмаратхиМаратхи (в разработке) г-н_INОбщий разговор100Маратхи (в конвейере) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМаратхи_MAмаратхиМаратхи (в разработке) г-н_INМедиа Аудио40Аудиоданные мультимедиа маратхи (в конвейере)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМексиканский_SM_48Испанский (Мексика)Испанский (Мексика)эс-MX48 кГцМонолог по сценарию1,492Мексиканский монолог по испанскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1016 Мужчина 1069 Неизвестно 95
речьНидерланды_SM_48DutchDutchNL-NL48 кГцМонолог по сценарию1,205Монолог по голландскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1285 Мужчина 531 Неизвестно 3
речьНью-Йорк английский_CC_8Нью-йоркский английскийНью-йоркский английскийen_US8 кГцКолл-центр103Данные колл-центра New York EnglishСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 610, Мужчина 532, Неизвестно 0
речьНью-Йорк English_GC_8Нью-йоркский английскийНью-йоркский английскийen_US8 кГцОбщий разговор107Данные общего разговорного английского в Нью-ЙоркеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 118, Мужчина 114, Неизвестно 0
речьНью-Йорк английский_MA_16Нью-йоркский английскийНью-йоркский английскийen_US16 кГцМедиа Аудио140Аудиоданные New York English MediaЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 66, Мужчина 230, Неизвестно 11
речьНовая Зеландия_GC_8Новозеландский английский Новозеландский английский en_NZ8 кГцОбщий разговор148Данные новозеландского английского для общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 167, мужчина 121, Неизвестно 4
речьНовая Зеландия_MA_16Новозеландский английский Новозеландский английский en_NZ16 кГцМедиа Аудио400Новозеландский английский СМИ аудиоЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 367, мужчина 678, Неизвестно 26
речьОрия_CC_8ОрияОрия (в разработке) or_INCall-центр60Oriya (In Pipeline) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьОрия_GCОрияОрия (в разработке) or_INОбщий разговор100Oriya (In Pipeline) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьОрия_МАОрияОрия (в разработке) or_INМедиа Аудио40Аудиоданные мультимедиа Oriya (In Pipeline)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьПольский_MA_16ПольскийПольскийpl_PL16 кГцМедиа Аудио269Польские СМИ аудиоЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 173 Мужчина 354 Неизвестно 6
речьПольский Poland_SM_48Польский (польша)Польский (польша)PL-PL48 кГцМонолог по сценарию1,482Польская Польша - Монолог по сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1324 Мужчина 701 Неизвестно 24
речьПанджаби_CC_8панджабиПенджаби (в разработке) панджабиCall-центр60Панджаби (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьпанджаби_GCпанджабиПенджаби (в разработке) панджабиОбщий разговор100Панджаби (в разработке) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьПенджаби_MAпанджабиПенджаби (в разработке) панджаби Медиа Аудио40Пенджаби (в конвейере) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьРусский_SM_48РусскийРусскийRU-RU48 кГцМонолог по сценарию2,398Монолог по русскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1689 Мужчина 1937 Неизвестно 214
речьшотландский_GC_8Шотландский (английский акцент)Шотландский (английский акцент)en_AB8 кГцОбщий разговор292Данные шотландского общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 285, Мужчина 260, Неизвестно 3
речьСингапур_CC_8Сингапурский английскийСингапурский английскийen_SG8 кГцКолл-центр218Данные колл-центра СингапураСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 2139, Мужчина 884, Неизвестно 21
речьСингапур_MA_16Сингапурский английскийСингапурский английскийen_SG16 кГцМедиа Аудио247Аудиоданные Сингапурских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 160, Мужчина 455, Неизвестно 37
речьЮжноафриканский английский_CC_8Южноафриканский английскийЮжноафриканский английскийen_ZA8 кГцКолл-центр261Южноафриканский английский Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1274 , Мужчина 935 , Неизвестно 1
речьЮжноафриканский английский_MA_16Южноафриканский английскийЮжноафриканский английскийen_ZA16 кГцМедиа Аудио251Звуковые данные южноафриканских английских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 235, Мужчина 432, Неизвестно 36
речьСуахили_CC_8суахилисуахилиsw_KE8 кГцКолл-центр230Данные колл-центра на суахилиСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 611, Мужчина 833, Неизвестно 0
речьСуахили_MA_16суахилисуахилиsw_KE16 кГцМедиа Аудио265Аудиоданные СМИ суахилиЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 118, Мужчина 493, Неизвестно 25
речьШведский_CC_8SwedishSwedishsv_SE8 кГцКолл-центр250Данные шведского колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1581, мужчина 727, Неизвестно 2
речьШведский_MA_16SwedishSwedishsv_SE16 кГцМедиа Аудио278Аудиоданные шведских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 195, мужчина 500, Неизвестно 21
речьТамильский_CC_8тамильскийТамильский (в разработке) ta_INCall-центр60Тамильский (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТамильский_GCтамильскийТамильский (в разработке) ta_INОбщий разговор100Тамильский (в разработке) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТамил_MAтамильский Тамильский (в разработке) ta_INМедиа Аудио40Аудиоданные мультимедиа на тамильском языке (в разработке)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТелугу_GC_8телугутелугуte_IN8 кГцОбщий разговор553Общие разговорные данные на телугуНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 574, Мужчина 564, Неизвестно 0
речьТелугу_MA_16телугутелугуte_IN16 кГцМедиа Аудио648Аудиоданные телугу MediaЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 207, Мужчина 963, Неизвестно 2
речьТелугу_CC_8телугуТелугу (в разработке) te_INCall-центр30Телугу (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТелугу_GCтелугуТелугу (в разработке) te_INОбщий разговор50Телугу (в конвейере) Общие данные беседыСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТелугу_MAтелугуТелугу (в разработке) te_INМедиа Аудио20Телугу (в конвейере) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТайский_GC_8ThaiThaith_TH8 кГцОбщий разговор183Тайский общий разговорНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, неформальная регистрация, используемая между друзьями.ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 338, Мужчина 96, Неизвестно 8
речьТайский_MA_8ThaiThaith_TH16 кГцМедиа Аудио173Тайские СМИ аудиоЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 143, Мужчина 502, Неизвестно 26
речьТурецкая Турция_SM_48Турецкая ТурцияТурецкая ТурцияTR-TR48 кГцМонолог по сценарию2,027Турецкая ТурцияЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1561 Мужчина 1241 Неизвестно 31
речьВьетнамский_GC_8вьетнамскийвьетнамскийvi_VN8 кГцОбщий разговор295Данные вьетнамского общего разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, северный (например, Ханой), центральный и южный (например, Хошимин).ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщины 400, мужчины 380, Неизвестные 2
речьВьетнамский_MA_16вьетнамскийвьетнамскийvi_VN16 кГцМедиа Аудио257Аудиоданные вьетнамских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщины 249, мужчины 200, Неизвестные 45
речьУэльский_GC_8Валлийский (английский акцент)Валлийский (английский акцент)en_WL8 кГцОбщий разговор278Данные валлийского общего разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 270, Мужчина 324, Неизвестно 0
речьВеликобритания английский_WW_16Великобритания АнглийскийВеликобритания Английскийen_uk16 кГцWake Word200Wake Word (Великобритания) английскийсбор данных по ключевым фразам
  • 200 колонки
  • 4 уникальные ключевые фразы на каждого говорящего
  • 25-30 повторяющихся записей ключевых фраз на одну уникальную ключевую фразу
  • 25-30 аудиофайлов на уникальную ключевую фразу
  • Всего 120 записанных высказываний на говорящего
1 каналМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеПол: 50% мужчин, 50% женщин, +/- 10%.

Предлагаемые услуги

Экспертный сбор аудиоданных - это не все, что нужно для комплексных настроек ИИ. В Shaip вы даже можете рассмотреть следующие услуги, чтобы сделать модели более распространенными, чем обычно:

Сбор текстовых данных

Сбор текстовых данных
Услуги

Истинная ценность сервисов сбора когнитивных данных Shaip заключается в том, что они дают организациям ключ к разблокированию важной информации, содержащейся в неструктурированных данных.

Сбор данных изображения

Услуги по сбору данных об изображениях

Убедитесь, что ваша модель компьютерного зрения точно идентифицирует каждое изображение, чтобы беспрепятственно обучать модели искусственного интеллекта следующего поколения будущего.

Сбор видеоданных

Услуги по сбору видеоданных

Теперь сосредоточьтесь на компьютерном зрении вместе с НЛП, чтобы научить свои модели в совершенстве определять объекты, людей, сдерживающие факторы и другие визуальные элементы.

Свяжитесь с нами

Хотите создать свой собственный набор аудиоданных?

Свяжитесь с нашим штатным экспертом по сбору речевых данных, чтобы настроить репозиторий аудио, который наилучшим образом соответствует вашим требованиям.

  • Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.