Пользовательский сбор речевых/аудиоданных для интеллектуальных ИИ

Обучите свои модели НЛП, виртуальные помощники, прототипы TTS и многое другое с помощью качественных разговорных данных с помощью наших служб сбора аудио- и речевых данных.

Сбор аудиоданных

Откройте для себя конвейеры аудиоданных без узких мест.

Избранные клиенты

Зачем нужен набор данных для обучения речи для обработки естественного языка?

Вы когда-нибудь замечали, что ваш смартфон VA, то есть Siri, Bixby или что-то еще, взаимодействует? То, как они отвечают на каждый вопрос, анализируют и представляют результаты в соответствии с вашими требованиями!

Что ж, как бы нас ни интриговали эти виртуальные машины, эти интеллектуальные ресурсы и программы необходимо постепенно обучать, чтобы они могли реагировать так же точно. Именно по этой причине вам следует рассмотреть возможность аутсорсинга сбора речи/аудио и голосовых данных специализированным компаниям по сбору данных, обладающим подтвержденным профессиональным опытом.

Инвестирование в сбор аудиоданных подготавливает ваше предполагаемое НЛП для обслуживания многоязычной аудитории. Мало того, сбор речевых данных для НЛП, когда он обрабатывается экспертом, даже принимает во внимание сбор в полевых условиях, семантический анализ и аудиотранскрипцию. Используя профессиональные решения для сбора речевых данных, вы можете:

  • Приобретайте высококачественные наборы аудиоданных для повышения точности
  • Целевая настройка разнообразных сценариев
  • Сбор многоязычных обучающих данных ИИ
  • Масштабируйте свою модель машинного обучения, чтобы она соответствовала различным демографическим характеристикам и вертикалям

Профессиональные услуги по сбору аудио / голосовых данных для НЛП

Любая тема. Любой сценарий.

Интеллектуальные системы НЛП далеко не универсальны. В зависимости от функциональности программы вам, возможно, придется сосредоточиться на услугах пространственных и многоязычных аудиоданных, которые могут быть предложены только известными компаниями по сбору голосовых / аудиоданных. Именно здесь Shaip входит в схему вещей как высоконадежный поставщик услуг передачи данных, который гордится тем, что делает тяжелую работу для ваших якобы интеллектуальных ИИ.

В Shaip основное внимание уделяется кормлению моделей максимально возможным объемом пользовательских образцов речи в кратчайшие сроки. С нами на борту вы можете рассчитывать:

Сборник речей
  • Курируемый сбор аудио / голосовых данных для НЛП
  • Индивидуальные программы, отвечающие конкретным вариантам использования
  • Подготовка к интеллектуальному анализу аудиоданных
  • Индивидуальная и автоматизированная обработка данных
  • Максимально возможный уровень доменной специфики
  • Более быстрый выход на рынок с ускоренными моделями искусственного интеллекта

Наша экспертиза

Выровняйте аудиоданные для подготовки интеллектуальных моделей НЛП

Shaip предлагает услуги по непрерывному сбору речевых / аудиоданных на более чем 100+ языках, чтобы позволить голосовым технологиям обслуживать самые разные аудитории по всему миру. Мы можем работать над проектами любого объема и размера; от лицензирования существующих готовых наборов аудиоданных до управления сбором пользовательских аудиоданных, транскрипции и аннотации аудиоданных. Независимо от того, насколько велик ваш проект по сбору речевых данных, мы можем настроить службы сбора аудиоданных в соответствии с вашими потребностями для создания высококачественных наборов данных НЛП, ориентированных на диалекты, тона и языки. Выбирайте из нашего широкого спектра наборов речевых данных и ресурсов для сбора аудиоданных для интеллектуальных настроек голосовой связи.

Речь монолога

Сборник монологов

Выполняйте требования на основе речи, относящиеся к автономному динамику для ваших прототипов преобразования текста в скорость, и требования, связанные с транскрипцией, с помощью скриптовых подсказок через одноканальные файлы.

Диалог Речь

Диалог Речь
Коллекция

Настройте интеллектуальных виртуальных помощников, чат-ботов с заданной скоростью и модели автоматического распознавания речи с многоязычным представлением через двухканальные файлы и транскрибированные ресурсы.

Акустическая речь

Акустические данные
Коллекция

Мы можем профессионально записывать аудиоданные студийного качества, будь то рестораны, офисы или дома, или из различных сред и языков, через нашу глобальную сеть сотрудников, при этом охватывая более широкий акустический диапазон.

Высказывание на естественном языке

Коллекция высказываний на естественном языке

Обучите интеллектуальные коммерческие установки определять по-разному произносимые клиентские фразы со схожим значением, чтобы сделать ИИ более автономными во времени.

Цифровые виртуальные помощники

Цифровой / Виртуальный
Помощники

Сосредоточьтесь на создании своего будущего виртуального помощника, обучая модели с оговорками, касающимися человеческой речи, многоязычного взаимодействия, контекстного анализа и NLU.

Автоматическое распознавание речи

Автоматическое распознавание речи (ASR)

Повысьте точность своих систем автоматического распознавания речи (ASR), получив доступ к современным диверсифицированным наборам речевых/аудиоданных из широкого спектра демографических данных.

Высказывание на естественном языке

Многоязычная речь/аудиообучающие данные

Наши высококвалифицированные лингвисты по всему миру предлагают многоязычные аудио/речевые обучающие данные на нескольких языках и диалектах, включая арабский, датский, китайский, африкаанс, сингапурский, новозеландский, иврит, индонезийский, ирландский, корейский, малайский, польский, шотландский, шведский. , французский, немецкий, вьетнамский, тайский, итальянский, испанский и другие.

Цифровые виртуальные помощники

Преобразование текста в речь
(ТТС)

Чтобы предложить лучший пользовательский опыт с TTS, крайне важно разработать систему, которая будет звучать естественно. Создайте многоязычную модель преобразования текста в речь (TTS) с помощью наших сотрудников по всему миру, которые помогут вам собрать речевые данные на более чем 150 языках и диалектах, чтобы улучшить ваши модели искусственного интеллекта, от элементов управления в автомобиле до чат-ботов и обучающих решений с высокой точностью. качественные аудиоданные.

Причины выбрать Shaip в качестве надежного партнера по сбору речевых данных

Люди

Люди

Выделенные и обученные команды:

  • Более 30,000 сотрудников по созданию, маркировке и контролю качества данных
  • Аттестованная команда управления проектами
  • Опытная команда по разработке продуктов
  • Команда поиска и адаптации кадрового резерва
Процесс

Процесс

Наивысшая эффективность процесса обеспечивается:

  • Надежный 6-сигма-технологический процесс
  • Специальная команда «черных поясов 6 сигм» - владельцы ключевых процессов и соблюдение требований к качеству
  • Непрерывное совершенствование и обратная связь
Платформа

Платформа

Запатентованная платформа предлагает преимущества:

  • Сквозная веб-платформа
  • Безупречное качество
  • Быстрее ТАТ
  • Бесшовная доставка

Язык: собраны наборы аудиоданных

Готовые наборы речевых/аудиоданных

ПодробнееЯзыковой набор данныхЧастота дискретизацииТип набора данныхВсего часов аудиоВсего часов выступленияОписание набора данныхАудиоканалаПлатформа записиВер (%)Аудио форматыФормат транскрипцииКейсыCTA
речьАфро-американскойАфроамериканский диалект8 кГцCall-центр214211Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАфро-американскойАфроамериканский диалект16 кГцМедиа Аудио159149Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАфрикаансАфрикаанс8 кГцОбщий разговор368404Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, африкаанс, на котором говорят в Африке.Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАфрикаансАфрикаанс16 кГцМедиа Аудио658615Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьарабском арабском 8 кГцОбщий разговор293297Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, арабский язык из стран Персидского заливаДвойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБостонБостон8 кГцCall-центр177175Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБостонБостон8 кГцОбщий разговор3232Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБостонБостон16 кГцМедиа Аудио9393Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКитайский английскийКитайский английский8 кГцCall-центр169130Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКитайский английскийКитайский английский16 кГцМедиа Аудио249236Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьдатский языкдатский язык8 кГцОбщий разговор372395Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьдатский языкдатский язык16 кГцМедиа Аудио664603Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАнглийскийАнглийский16 кГцМедиа Аудио109Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАнглийский Deep SouthАнглийский Deep South8 кГцCall-центр151149Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАнглийский Deep SouthАнглийский Deep South8 кГцОбщий разговор5656Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАнглийский Deep SouthАнглийский Deep South16 кГцМедиа Аудио266248Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьдревнееврейскийдревнееврейский8 кГцОбщий разговор399397Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, иврит в ИзраилеДвойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьдревнееврейскийдревнееврейский16 кГцМедиа Аудио427400Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьхинглишхинглиш8 кГцCall-центр208185Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьхинглишхинглиш16 кГцМедиа Аудио216219Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьЛатиноамериканский английскийЛатиноамериканский английский8 кГцCall-центр212209Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьЛатиноамериканский английскийЛатиноамериканский английский16 кГцМедиа Аудио155150Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьИндийский английскийИндийский английский16 кГцМедиа Аудио13787Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьIndonesianIndonesian8 кГцОбщий разговор496598Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, индонезийский индонезийскийДвойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьIndonesianIndonesian16 кГцМедиа Аудио643610Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьирландскийирландский8 кГцОбщий разговор192180Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьKoreanKorean8 кГцCall-центр107103Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьKoreanKorean16 кГцМедиа Аудио204197Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьMalayMalay8 кГцОбщий разговор266302Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, малайский в Малайзии.Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьMalayMalay16 кГцМедиа Аудио344305Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНовозеландский английский Новозеландский английский 8 кГцОбщий разговор148142Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНовозеландский английский Новозеландский английский 16 кГцМедиа Аудио400400Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНью-йоркский английскийНью-йоркский английский8 кГцCall-центр103103Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНью-йоркский английскийНью-йоркский английский8 кГцОбщий разговор107106Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНью-йоркский английскийНью-йоркский английский16 кГцМедиа Аудио140140Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьПольскийПольский16 кГцМедиа Аудио269255Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьШотландскийШотландский8 кГцОбщий разговор292267Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьСингапурский английскийСингапурский английский8 кГцCall-центр218194Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьСингапурский английскийСингапурский английский16 кГцМедиа Аудио247240Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьЮжноафриканский английскийЮжноафриканский английский8 кГцCall-центр261204Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьЮжноафриканский английскийЮжноафриканский английский16 кГцМедиа Аудио251245Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьИспанскийИспанский16 кГцМедиа Аудио32Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьсуахилисуахили8 кГцCall-центр184165Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьсуахилисуахили8 кГцCall-центр4644Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьсуахилисуахили16 кГцМедиа Аудио203191Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьсуахилисуахили16 кГцМедиа Аудио6258Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьSwedishSwedish8 кГцCall-центр250224Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьSwedishSwedish16 кГцМедиа Аудио278255Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтелугутелугу8 кГцОбщий разговор553582Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтелугутелугу16 кГцМедиа Аудио648599Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьThaiThai8 кГцОбщий разговор183201Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, неформальная регистрация, используемая между друзьями.Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьThaiThai16 кГцМедиа Аудио173167Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьвьетнамскийвьетнамский8 кГцОбщий разговор295293Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, северный (например, Ханой), центральный и южный (например, Хошимин).Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьвьетнамскийвьетнамский16 кГцМедиа Аудио257248Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьваллийскийваллийский8 кГцОбщий разговор278299Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьИндийский английскийИндийский английский8 кГцCall-центр200200Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Монорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтелугу телугу NACall-центр3030Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтамильский тамильский NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьканнады каннады NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМалайялам Малайялам NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский Бенгальский NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьгуджарати гуджарати NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьмаратхи маратхи NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАссамский Ассамский NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьОрия Ория NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьпанджаби панджаби NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтелугу телугу NAОбщий разговор5050Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтамильский тамильский NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьканнады каннады NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМалайялам Малайялам NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский Бенгальский NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьгуджарати гуджарати NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьмаратхи маратхи NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАссамский Ассамский NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьОрия Ория NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьпанджаби панджаби NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтелугу телугу NAМедиа Аудио2020Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтамильский тамильский NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьканнады каннады NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМалайялам Малайялам NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский Бенгальский NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьгуджарати гуджарати NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьмаратхи маратхи NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАссамский Ассамский NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьОрия Ория NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьпанджабипанджабиNAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАнглийский СШААнглийский США48 кГцМонолог по сценарию54Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьИспанская ИспанияИспанская Испания48 кГцМонолог по сценарию108Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМексиканскийМексиканский48 кГцМонолог по сценарию1,4921,228Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьканадскомканадском48 кГцМонолог по сценарию1,2221,049Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНидерландыНидерланды48 кГцМонолог по сценарию1,2051,021Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьпольский Польшапольский Польша48 кГцМонолог по сценарию1,4821,266Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТурецкая ТурцияТурецкая Турция48 кГцМонолог по сценарию2,0271,735Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТрадиционный китайскийТрадиционный китайский48 кГцМонолог по сценарию1,028891Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьарабском арабском 48 кГцМонолог по сценарию1,9471,594Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьдатский языкдатский язык48 кГцМонолог по сценарию2,5792,041Записи с одним высказыванием, длительностью от 5 до 30 секунд, датский из Дании.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьХиндиХинди8 кГцКолл-центр122131Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьХиндиХинди16 кГцМедиа-аудио219202Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьХиндиХинди48 кГцМонолог по сценарию2,8672,105Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьЯпонскийЯпонский48 кГцМонолог по сценарию2,3352,029Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьKoreanKorean48 кГцМонолог по сценарию1,9551,548Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьРусскийРусский48 кГцМонолог по сценарию2,3982,046Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКитайский упрощенныйКитайский упрощенный48 кГцМонолог по сценарию2,7622,181Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНемецкийНемецкий8 кГцCall-центр640Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование

Предлагаемые услуги

Экспертный сбор аудиоданных - это не все, что нужно для комплексных настроек ИИ. В Shaip вы даже можете рассмотреть следующие услуги, чтобы сделать модели более распространенными, чем обычно:

Сбор текстовых данных

Сбор текстовых данных
Услуги

Истинная ценность сервисов сбора когнитивных данных Shaip заключается в том, что они дают организациям ключ к разблокированию важной информации, содержащейся в неструктурированных данных.

Сбор данных изображения

Услуги по сбору данных об изображениях

Убедитесь, что ваша модель компьютерного зрения точно идентифицирует каждое изображение, чтобы беспрепятственно обучать модели искусственного интеллекта следующего поколения будущего.

Сбор видеоданных

Услуги по сбору видеоданных

Теперь сосредоточьтесь на компьютерном зрении вместе с НЛП, чтобы научить свои модели в совершенстве определять объекты, людей, сдерживающие факторы и другие визуальные элементы.

Свяжитесь с нами

Хотите создать свой собственный набор аудиоданных?

Свяжитесь с нашим штатным экспертом по сбору речевых данных, чтобы настроить репозиторий аудио, который наилучшим образом соответствует вашим требованиям.

  • Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.