Самые надежные службы сбора речевых данных для вашего ИИ

Обучите свои модели НЛП, виртуальные помощники, прототипы TTS и многое другое с помощью качественных разговорных данных с помощью наших служб сбора аудио- и речевых данных.

Откройте для себя конвейеры аудиоданных без узких мест

Свяжитесь с нами

Избранные клиенты

Любая тема. Любой сценарий.

В Shaip наш опыт заключается в создании высококачественных наборов речевых данных, предназначенных для различных требований AI/ML. Мы предлагаем широкий выбор языков и ведем запись в различных условиях, что делает наши наборы данных всеобъемлющими и адаптируемыми. ОНаша цель — предоставить моделям наибольший объем пользовательских речевых данных в кратчайшие сроки. С нами на борту вы можете рассчитывать на:

Кураторские высококачественные многоязычные аудио/голосовые данные для повышения точности
Максимально возможный уровень доменной специфичности для tвыбрать разнообразный сценарий установка

Масштабируйте свою модель машинного обучения, чтобы она соответствовала различным демографическим характеристикам и вертикалям
Среда записи: Студийное качество, кристально чистый звук с минимальным фоновым шумом и Природная среда, где записи включают окружающие звуки, имитирующие реальные ситуации.

100+

Страны

55К +

Данные о часах речи

250+

Проекты

60+

Языки (более 100 диалектов)

8 / 16 / 44 / 48 кГц

Частота выборки

Наша экспертиза

Согласуйте аудиоданные с более умными моделями НЛП

Shaip предлагает услуги по непрерывному сбору речевых / аудиоданных на более чем 100+ языках, чтобы позволить голосовым технологиям обслуживать самые разные аудитории по всему миру. Мы можем работать над проектами любого объема и размера; от лицензирования существующих готовых наборов аудиоданных до управления сбором пользовательских аудиоданных, транскрипции и аннотации аудиоданных. Независимо от того, насколько велик ваш проект по сбору речевых данных, мы можем настроить службы сбора аудиоданных в соответствии с вашими потребностями для создания высококачественных наборов данных НЛП, ориентированных на диалекты, тона и языки. Выбирайте из нашего широкого спектра наборов речевых данных и ресурсов для сбора аудиоданных для интеллектуальных настроек голосовой связи.

Акустические данные
Транспортировка

Мы можем профессионально записывать аудиоданные студийного качества, будь то рестораны, офисы или дома, или из разных сред и на разных языках, охватывая при этом более широкий акустический диапазон (комплексные наборы звуковых данных).

Многоязычная речь/аудиообучающие данные

Наши квалифицированные лингвисты по всему миру предлагают многоязычные аудио/речевые данные на разных языках и диалектах. Эти усилия способствуют глобальному общению и преодолению языковых барьеров, способствуя созданию более инклюзивных и эффективных решений в области искусственного интеллекта.

Преобразование текста в речь
(ТТС)

Создайте многоязычную модель преобразования текста в речь (TTS) с помощью наших специалистов по всему миру, которые помогут вам собирать речевые данные на более чем 150 языках и диалектах, чтобы усовершенствовать ваши модели искусственного интеллекта — от элементов управления в автомобиле до чат-ботов и обучающих решений с высокой эффективностью. качественные аудиоданные.

случай

Наборы данных разговорного ИИ, содержащие более 3 тысяч часов данных на 8 языках.

Стремясь создать многоязычную платформу для индийских языков, клиент заключил партнерское соглашение с Shaip для сбора, сегментации и расшифровки больших наборов данных на нескольких индийских языках. Это поможет разработать эффективные речевые модели, которые могут стать основой новой инновационной платформы клиента.

Проблема: Более 3,000 часов аудиоданных, собранных на 8 индийских языках, сегментированных и расшифрованных для автоматического распознавания речи.

Решение: Мы обеспечили сбор данных, сегментацию, транскрипцию и доставили файлы JSON с метаданными. Мы собрали 3000 часов аудиоданных на 8 индийских языках в большом масштабе для проекта речевой технологии клиента.

Причины выбрать Shaip в качестве надежного партнера по сбору речевых данных

Люди

Выделенные и обученные команды:

Более 30,000 сотрудников по созданию, маркировке и контролю качества данных
Аттестованная команда управления проектами
Опытная команда по разработке продуктов
Команда поиска и адаптации кадрового резерва

Обработка

Наивысшая эффективность процесса обеспечивается:

Надежный 6-сигма-технологический процесс
Специальная команда «черных поясов 6 сигм» - владельцы ключевых процессов и соблюдение требований к качеству
Непрерывное совершенствование и обратная связь

Платформа

Запатентованная платформа предлагает преимущества:

Сквозная веб-платформа
Безупречное качество
Быстрее ТАТ
Бесшовная доставка

Люди

Выделенные и обученные команды:

Более 30,000 сотрудников по созданию, маркировке и контролю качества данных
Аттестованная команда управления проектами
Опытная команда по разработке продуктов
Команда поиска и адаптации кадрового резерва

Обработка

Наивысшая эффективность процесса обеспечивается:

Надежный 6-сигма-технологический процесс
Специальная команда «черных поясов 6 сигм» - владельцы ключевых процессов и соблюдение требований к качеству
Непрерывное совершенствование и обратная связь

Платформа

Запатентованная платформа предлагает преимущества:

Сквозная веб-платформа
Безупречное качество
Быстрее ТАТ
Бесшовная доставка

Готовые наборы речевых/аудиоданных

Идентификатор корпуса (уникальный)	Ключевое слово	Языковой набор данных	Код языка	Частота дискретизации	Тип набора данных	Всего часов аудио	Описание	Описание набора данных	Аудиоканала	Платформа записи	Вер (%)	Аудио форматы	Формат транскрипции	Кейсы	Количество динамиков	CTA
ru_US_CC_8	Афроамериканский диалект	Афроамериканский диалект	en_US	8 кГц	Колл-центр	211	Данные колл-центра для афроамериканцев	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщин: 612, Мужчин: 1242, Неизвестно: 12	Контакты
ru_US_MA_16	Афроамериканский диалект	Афроамериканский диалект	en_US	16 кГц	Медиа Аудио	154	Данные афроамериканских народных СМИ	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщин: 151, Мужчин: 150, Неизвестно: 10	Контакты
Африкаанс_GC_8	Африкаанс	Африкаанс	af_ZA	8 кГц	Общий разговор	368	Данные общего разговора на африкаанс	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, африкаанс, на котором говорят в Африке.	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщин: 502, Мужчин: 390, Неизвестно: 2	Контакты
Африкаанс_MA_16	Африкаанс	Африкаанс	af_ZA	16 кГц	Медиа Аудио	658	Медиафайлы на африкаанс	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщин: 750, Мужчин: 1278, Неизвестно: 52	Контакты
арабский_GC_8	арабском	арабском	ar_AE	8 кГц	Общий разговор	292	Данные для общего разговора на арабском языке	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, арабский язык из стран Персидского залива	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщин: 171, Мужчин: 534, Неизвестно: 1	Контакты
Арабский_SM_48	арабском	арабском	ар-SA	48 кГц	Монолог по сценарию	1,947	Монолог на арабском языке	Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.	Моно	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 838 Мужчина 1209 Неизвестно 78	Контакты
Ассамский язык_CC_8	Ассамский	Ассамский (в разработке)	как в		Call-центр	60	Ассамский (в разработке) Данные колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Ассамский_GC	Ассамский	Ассамский (в разработке)	как в		Общий разговор	100	Ассамский (в разработке) Общие данные разговора	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Ассамский_MA	Ассамский	Ассамский (в разработке)	как в		Медиа Аудио	40	Аудиоданные мультимедиа на ассамском языке (в разработке)	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут		Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Бенгальский_CC_8	Бенгальский	Бенгальский (в разработке)	bn_IN		Call-центр	60	Бенгальский (в разработке) данные колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Бенгальский_GC	Бенгальский	Бенгальский (в разработке)	bn_IN		Общий разговор	100	Бенгальский (In Pipeline) Общие данные разговора	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Бенгальский_MA	Бенгальский	Бенгальский (в разработке)	bn_IN		Медиа Аудио	40	Бенгальский (In Pipeline) Медиа-аудиоданные	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут		Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Бостон_CC_8	Бостонский английский	Бостонский английский	en_US	8 кГц	Call-центр	177	Данные колл-центра Бостона	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщин: 605, Мужчин: 711, Неизвестно: 0	Контакты
Бостон_GC_8	Бостонский английский	Бостонский английский	en_US	8 кГц	Общий разговор	32	Данные общего разговора в Бостоне	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщин: 53, Мужчин: 83, Неизвестно: 0	Контакты
Бостон_MA_16	Бостонский английский	Бостонский английский	en_US	16 кГц	Медиа Аудио	93	Аудиоданные Boston Media	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщин: 43, Мужчин: 181, Неизвестно: 2	Контакты
Канадский_SM_48	Канадский французский	Канадский французский	FR-CA	48 кГц	Монолог по сценарию	1,222	Канадский французский	Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.	Моно	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 974 Мужчина 631 Неизвестно 1	Контакты
Китайский_CC_8	Китайский английский	Китайский английский	en_US	8 кГц	Call-центр	169	Данные китайского колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщин: 1790, Мужчин: 523 и Неизвестно: 13	Контакты
Китайский_MA_16	Китайский английский	Китайский английский	en_US	16 кГц	Медиа Аудио	249	Аудиоданные китайских СМИ	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщин: 126, Мужчин: 346 и Неизвестно: 6	Контакты
Китайский упрощенный_SM_48	Китайский упрощенный	Китайский упрощенный	ZH-CN	48 кГц	Монолог по сценарию	2,762	Китайский упрощенный	Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.	Моно	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1920 Мужчина 1535 Неизвестно 270	Контакты
Китайский традиционный_SM_48	Традиционный китайский	Традиционный китайский	zh-TW	48 кГц	Монолог по сценарию	1,028	Традиционный китайский	Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.	Моно	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1069 Мужчина 262 Неизвестно 3	Контакты
датский_GC_8	Датский	Датский	да_ДК	8 кГц	Общий разговор	372	Датские общие разговорные данные	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщин: 311, Мужчин: 417, Неизвестно: 0	Контакты
датский_MA_16	Датский	Датский	да_ДК	16 кГц	Медиа Аудио	664	Аудиоданные датских СМИ	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщин: 369, Мужчин: 864, Неизвестно: 27	Контакты
Датский_SM_48	Датский	Датский	да-DK	48 кГц	Монолог по сценарию	2,579	Монолог на датском языке	Записи с одним высказыванием, длительностью от 5 до 30 секунд, датский из Дании.	Моно	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1551 Мужчина 1233 Неизвестно 42	Контакты
Английский Deep South_CC_8	Английский Deep South	Английский Deep South	en_US	8 кГц	Call-центр	151	English Данные колл-центра Deep South	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 221, Мужчина 1004, Неизвестно 7	Контакты
Английский Deep South_GC_8	Английский Deep South	Английский Deep South	en_US	8 кГц	Общий разговор	56	Данные английского Deep South General Conversation	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 99, Мужчина 31, Неизвестно 0	Контакты
Английский Deep South_MA_16	Английский Deep South	Английский Deep South	en_US	16 кГц	Медиа Аудио	266	Аудиоданные Deep South Media на английском языке	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 204, Мужчина 356, Неизвестно 21	Контакты
немецкий_CC_8	Немецкий	Немецкий	де-де	8 кГц	Call-центр	64	Данные немецкого колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Моно	Для ПК		. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 478 Мужчина 1440 Неизвестно 0	Контакты
немецкий_IVR_8	Немецкий	Немецкий	де-де	8 кГц	IVR	200	IVR-данные Германии	Человек к машине. Тип потока IVR, в котором есть подсказка TTS (например, «Чем я могу вам помочь»), за которой следует спонтанный ответ человека.	Моно	Для ПК		. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 10115 Мужчина 8750 Неизвестно 0	Контакты
Гуджарати_CC_8	Гуджарати	Гуджарати (в разработке)	gu_IN		Call-центр	60	Гуджарати (в разработке) Данные колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Гуджарати_GC	Гуджарати	Гуджарати (в разработке)	gu_IN		Общий разговор	100	Гуджарати (в конвейере) Общие данные разговора	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Гуджарати_MA	Гуджарати	Гуджарати (в разработке)	gu_IN		Медиа Аудио	40	Аудиоданные мультимедиа гуджарати (в конвейере)	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут		Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Иврит_Общий разговор_8	древнееврейский	древнееврейский	он_ИЛ	8 кГц	Общий разговор	399	Данные общего разговора на иврите	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, иврит в Израиле	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 414 , Мужчина 399 , Неизвестно 1	Контакты
Иврит_MA_16	древнееврейский	древнееврейский	он_ИЛ	16 кГц	Медиа Аудио	427	Аудиоданные на иврите Media	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 361, Мужчина 513, Неизвестно 13	Контакты
Хинди_MA_16	Хинди	Хинди	привет_IN	16 кГц	Медиа Аудио	219	Аудиоданные хинди-медиа	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 83, Мужчина 309, Неизвестно 0	Контакты
Хинди_SM_48	Хинди	Хинди	привет-IN	48 кГц	Монолог по сценарию	2,867	Монолог по сценарию на хинди	Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.	Моно	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1977 Мужчина 1864 Неизвестно 147	Контакты
ХИНГЛИШ_CC_8	хинглиш	хинглиш	hg_IN	8 кГц	Call-центр	208	HINGLISH Данные колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 822, Мужчина 1262, Неизвестно 0	Контакты
ХИНГЛИШ_МА_16	хинглиш	хинглиш	hg_IN	16 кГц	Медиа Аудио	216	HINGLISH Мультимедийные аудиоданные	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 75, Мужчина 380, Неизвестно 0	Контакты
Латиноамериканец_CC_8	Латиноамериканский английский	Латиноамериканский английский	en_US	8 кГц	Call-центр	212	Данные колл-центра для латиноамериканцев	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 822, Мужчина 1262, Неизвестно 0	Контакты
Латиноамериканец_MA_16	Латиноамериканский английский	Латиноамериканский английский	en_US	16 кГц	Медиа Аудио	155	Аудио для латиноамериканского звонка	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 140, Мужчина 219, Неизвестно 5	Контакты
Индонезийский_GC_8	Индонезийский	Индонезийский	я сделал	8 кГц	Общий разговор	496	Данные индонезийского общего разговора	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, индонезийский индонезийский	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 524, Мужчина 454, Неизвестно 2	Контакты
Индонезийский_MA_16	Индонезийский	Индонезийский	я сделал	16 кГц	Медиа Аудио	643	Аудиоданные индонезийских СМИ	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 746, Мужчина 1507, Неизвестно 129	Контакты
Ирландский_GC_8	ирландский	ирландский	ru_IE	8 кГц	Общий разговор	192	Данные ирландского общего разговора	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 213 , Мужчина 153 , Неизвестно 0	Контакты
Японский_SM_48	Японский	Японский	JA-JP	48 кГц	Монолог по сценарию	2,335	Монолог по японскому сценарию	Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.	Моно	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1460 Мужчина 1221 Неизвестно 194	Контакты
каннада_CC_8	каннады	Каннада (в разработке)	кн_ИН		Call-центр	60	Каннада (в разработке) Данные колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Каннада_GC	каннады	Каннада (в разработке)	кн_ИН		Общий разговор	100	Каннада (в конвейере) Общие данные разговора	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Каннада_MA	каннады	Каннада (в разработке)	кн_ИН		Медиа Аудио	40	Каннада (в конвейере) Медиа-аудиоданные	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут		Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Корейский_CC_8	Корейский	Корейский	ko_KR	8 кГц	Call-центр	107	Данные корейского колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1086, Мужчина 210, Неизвестно 4	Контакты
Корейский_MA_16	Корейский	Корейский	ko_KR	16 кГц	Медиа Аудио	204	Звуковые данные корейских СМИ	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 70 Мужчина 303, Неизвестно 25	Контакты
Корейский_SM_48	Корейский	Корейский	ко-KR	48 кГц	Монолог по сценарию	1,955	Монолог по корейскому сценарию	Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.	Моно	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1195 Мужчина 1134 Неизвестно 122	Контакты
Малайский_GC_8	Malay	Malay	мс_МГ	8 кГц	Общий разговор	266	Данные малайского общего разговора	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, малайский в Малайзии.	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 316, Мужчина 176, Неизвестно 0	Контакты
Малайский_MA_16	Malay	Malay	мс_МГ	16 кГц	Медиа Аудио	344	Аудиоданные малайских СМИ	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 236, Мужчина 626, Неизвестно 47	Контакты
малаялам_CC_8	Малайялам	Малаялам (в разработке)	мл_IN		Call-центр	60	Малаялам (в разработке) Данные колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Малаялам_GC	Малайялам	Малаялам (в разработке)	мл_IN		Общий разговор	100	Малаялам (в конвейере) Общие данные разговора	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Малаялам_MA	Малайялам	Малаялам (в разработке)	мл_IN		Медиа Аудио	40	Малаялам (In Pipeline) Медиа-аудиоданные	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут		Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
маратхи_CC_8	Маратхи	Маратхи (в разработке)	г-н_IN		Call-центр	60	Данные колл-центра на языке маратхи (в разработке)	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
маратхи_GC	Маратхи	Маратхи (в разработке)	г-н_IN		Общий разговор	100	Маратхи (в конвейере) Общие данные разговора	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Маратхи_MA	Маратхи	Маратхи (в разработке)	г-н_IN		Медиа Аудио	40	Аудиоданные мультимедиа маратхи (в конвейере)	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут		Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Мексиканский_SM_48	Испанский (Мексика)	Испанский (Мексика)	эс-MX	48 кГц	Монолог по сценарию	1,492	Мексиканский монолог по испанскому сценарию	Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.	Моно	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1016 Мужчина 1069 Неизвестно 95	Контакты
Нидерланды_SM_48	Голландский	Голландский	NL-NL	48 кГц	Монолог по сценарию	1,205	Монолог по голландскому сценарию	Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.	Моно	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1285 Мужчина 531 Неизвестно 3	Контакты
Нью-Йорк английский_CC_8	Нью-йоркский английский	Нью-йоркский английский	en_US	8 кГц	Call-центр	103	Данные колл-центра New York English	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 610, Мужчина 532, Неизвестно 0	Контакты
Нью-Йорк English_GC_8	Нью-йоркский английский	Нью-йоркский английский	en_US	8 кГц	Общий разговор	107	Данные общего разговорного английского в Нью-Йорке	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 118, Мужчина 114, Неизвестно 0	Контакты
Нью-Йорк английский_MA_16	Нью-йоркский английский	Нью-йоркский английский	en_US	16 кГц	Медиа Аудио	140	Аудиоданные New York English Media	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 66, Мужчина 230, Неизвестно 11	Контакты
Новая Зеландия_GC_8	Новозеландский английский	Новозеландский английский	ru_NZ	8 кГц	Общий разговор	148	Данные новозеландского английского для общего разговора	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 167, мужчина 121, Неизвестно 4	Контакты
Новая Зеландия_MA_16	Новозеландский английский	Новозеландский английский	ru_NZ	16 кГц	Медиа Аудио	400	Новозеландский английский СМИ аудио	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 367, мужчина 678, Неизвестно 26	Контакты
Ория_CC_8	Ория	Ория (в разработке)	или_IN		Call-центр	60	Oriya (In Pipeline) Данные колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Ория_GC	Ория	Ория (в разработке)	или_IN		Общий разговор	100	Oriya (In Pipeline) Общие данные разговора	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Ория_МА	Ория	Ория (в разработке)	или_IN		Медиа Аудио	40	Аудиоданные мультимедиа Oriya (In Pipeline)	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут		Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Польский_MA_16	Польский	Польский	pl_PL	16 кГц	Медиа Аудио	269	Польские СМИ аудио	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 173 Мужчина 354 Неизвестно 6	Контакты
Польский Poland_SM_48	Польский (польша)	Польский (польша)	PL-PL	48 кГц	Монолог по сценарию	1,482	Польская Польша - Монолог по сценарию	Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.	Моно	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1324 Мужчина 701 Неизвестно 24	Контакты
Панджаби_CC_8	панджаби	Пенджаби (в разработке)	панджаби		Call-центр	60	Панджаби (в разработке) Данные колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
панджаби_GC	панджаби	Пенджаби (в разработке)	панджаби		Общий разговор	100	Панджаби (в разработке) Общие данные разговора	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Пенджаби_MA	панджаби	Пенджаби (в разработке)	панджаби		Медиа Аудио	40	Пенджаби (в конвейере) Медиа-аудиоданные	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут		Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Русский_SM_48	Русский	Русский	RU-RU	48 кГц	Монолог по сценарию	2,398	Монолог по русскому сценарию	Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.	Моно	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1689 Мужчина 1937 Неизвестно 214	Контакты
шотландский_GC_8	Шотландский (английский акцент)	Шотландский (английский акцент)	ru_AB	8 кГц	Общий разговор	292	Данные шотландского общего разговора	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 285, Мужчина 260, Неизвестно 3	Контакты
Сингапур_CC_8	Сингапурский английский	Сингапурский английский	ru_SG	8 кГц	Call-центр	218	Данные колл-центра Сингапура	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 2139, Мужчина 884, Неизвестно 21	Контакты
Сингапур_MA_16	Сингапурский английский	Сингапурский английский	ru_SG	16 кГц	Медиа Аудио	247	Аудиоданные Сингапурских СМИ	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 160, Мужчина 455, Неизвестно 37	Контакты
Южноафриканский английский_CC_8	Южноафриканский английский	Южноафриканский английский	ru_ZA	8 кГц	Call-центр	261	Данные южноафриканского английского колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1274 , Мужчина 935 , Неизвестно 1	Контакты
Южноафриканский английский_MA_16	Южноафриканский английский	Южноафриканский английский	ru_ZA	16 кГц	Медиа Аудио	251	Звуковые данные южноафриканских английских СМИ	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 235, Мужчина 432, Неизвестно 36	Контакты
Суахили_CC_8	суахили	суахили	sw_KE	8 кГц	Call-центр	230	Данные колл-центра на суахили	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 611, Мужчина 833, Неизвестно 0	Контакты
Суахили_MA_16	суахили	суахили	sw_KE	16 кГц	Медиа Аудио	265	Аудиоданные СМИ суахили	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 118, Мужчина 493, Неизвестно 25	Контакты
Шведский_CC_8	Шведский	Шведский	sv_SE	8 кГц	Call-центр	250	Данные шведского колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1581, мужчина 727, Неизвестно 2	Контакты
Шведский_MA_16	Шведский	Шведский	sv_SE	16 кГц	Медиа Аудио	278	Аудиоданные шведских СМИ	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 195, мужчина 500, Неизвестно 21	Контакты
Тамильский_CC_8	Тамильский	Тамильский (в разработке)	ta_IN		Call-центр	60	Тамильский (в разработке) Данные колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Тамильский_GC	Тамильский	Тамильский (в разработке)	ta_IN		Общий разговор	100	Тамильский (в разработке) Общие данные разговора	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Тамил_MA	Тамильский	Тамильский (в разработке)	ta_IN		Медиа Аудио	40	Аудиоданные мультимедиа на тамильском языке (в разработке)	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут		Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Телугу_GC_8	Телугу	Телугу	te_IN	8 кГц	Общий разговор	553	Общие разговорные данные на телугу	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 574, Мужчина 564, Неизвестно 0	Контакты
Телугу_MA_16	Телугу	Телугу	te_IN	16 кГц	Медиа Аудио	648	Аудиоданные телугу Media	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 207, Мужчина 963, Неизвестно 2	Контакты
Телугу_CC_8	Телугу	Телугу (в разработке)	te_IN		Call-центр	30	Телугу (в разработке) Данные колл-центра	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Телугу_GC	Телугу	Телугу (в разработке)	te_IN		Общий разговор	50	Телугу (в конвейере) Общие данные беседы	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,		Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Телугу_MA	Телугу	Телугу (в разработке)	te_IN		Медиа Аудио	20	Телугу (в конвейере) Медиа-аудиоданные	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут		Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование		Контакты
Тайский_GC_8	Тайский	Тайский	th_TH	8 кГц	Общий разговор	183	Тайский общий разговор	Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, неформальная регистрация, используемая между друзьями.	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 338, Мужчина 96, Неизвестно 8	Контакты
Тайский_MA_8	Тайский	Тайский	th_TH	16 кГц	Медиа Аудио	173	Тайские СМИ аудио	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 143, Мужчина 502, Неизвестно 26	Контакты
Турецкая Турция_SM_48	Турецкая Турция	Турецкая Турция	TR-TR	48 кГц	Монолог по сценарию	2,027	Турецкая Турция	Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.	Моно	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 1561 Мужчина 1241 Неизвестно 31	Контакты
Вьетнамский_GC_8	Вьетнамский	Вьетнамский	vi_VN	8 кГц	Общий разговор	295	Данные вьетнамского общего разговора	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, северный (например, Ханой), центральный и южный (например, Хошимин).	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщины 400, мужчины 380, Неизвестные 2	Контакты
Вьетнамский_MA_16	Вьетнамский	Вьетнамский	vi_VN	16 кГц	Медиа Аудио	257	Аудиоданные вьетнамских СМИ	Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут	Моно	Веб-поиск	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщины 249, мужчины 200, Неизвестные 45	Контакты
Уэльский_GC_8	Валлийский (английский акцент)	Валлийский (английский акцент)	ru_WL	8 кГц	Общий разговор	278	Данные валлийского общего разговора	Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,	Двойной	Для ПК	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Женщина 270, Мужчина 324, Неизвестно 0	Контакты
Великобритания английский_WW_16	Великобритания Английский	Великобритания Английский	ru_uk	16 кГц	Wake Word	200 Выступающие	Wake Word (Великобритания) английский	сбор данных по ключевым фразам 200 колонки 4 уникальные ключевые фразы на каждого говорящего 25-30 повторяющихся записей ключевых фраз на одну уникальную ключевую фразу 25-30 аудиофайлов на уникальную ключевую фразу Всего 120 записанных высказываний на говорящего	1 канал	Мобильное приложение	5.0	. Wav	.json	ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование	Пол: 50% мужчин, 50% женщин, +/- 10%.	Контакты

Предлагаемые услуги

Экспертный сбор аудиоданных - это не все, что нужно для комплексных настроек ИИ. В Shaip вы даже можете рассмотреть следующие услуги, чтобы сделать модели более распространенными, чем обычно:

Хотите создать свой собственный набор аудиоданных?

Свяжитесь с нашим штатным экспертом по сбору речевых данных, чтобы настроить репозиторий аудио, который наилучшим образом соответствует вашим требованиям.

Имя*
Фамилия*
Эл. адрес*
Телефон*
Компания*
Страна*
Страна
Комментарии*
Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.
ЗАЩИТНЫЙ

Часто задаваемые вопросы (FAQ)

1. Что такое сбор речевых данных?

Сбор речевых данных для модели машинного обучения — это процесс сбора аудиозаписей разговорной речи. Этот сборник помогает в обучении и совершенствовании алгоритмов машинного обучения, особенно тех, которые ориентированы на понимание и обработку человеческих голосов.

2. Как собрать аудиоданные для ASR (автоматического распознавания речи)?

Если вы хотите собрать аудиоданные для автоматического распознавания речи (ASR), вам следует начать с определения конкретных потребностей вашего проекта, включая желаемый язык, акцент и тип речи. После установки этих параметров убедитесь, что вы получили все необходимые разрешения для соблюдения конфиденциальности пользователей. Затем используйте соответствующие записывающие устройства или программное обеспечение для записи четких аудиосэмплов. Каждая запись должна быть тщательно аннотирована ее транскрипцией или другими соответствующими метаданными и систематически храниться для облегчения доступа.

3. Использование набора речевых данных для машинного обучения

Набор речевых данных в машинном обучении имеет решающее значение для обучения, тестирования и проверки моделей, предназначенных для распознавания, транскрипции или интерпретации разговорной речи. Такие наборы данных открывают путь для множества приложений: от голосовых помощников и служб транскрипции до голосовой биометрии.

4. Как собрать точные данные по нескольким языкам и акцентам

Для сбора точных данных о разных языках и акцентах жизненно важно сотрудничество с носителями языка желаемого языкового происхождения. Стремитесь к разнообразной и репрезентативной выборке, охватывающей широкий спектр демографических нюансов. Используйте стандартизированное записывающее оборудование в единых средах, чтобы обеспечить согласованность звука. И что немаловажно, аннотируйте каждый фрагмент данных подробными транскрипциями и метаданными, обозначая конкретный язык и акцент.

Самые надежные службы сбора речевых данных для вашего ИИ

Откройте для себя конвейеры аудиоданных без узких мест

Избранные клиенты

Профессиональные услуги по сбору аудио/голосовых данных

Любая тема. Любой сценарий.

100+

55К +

250+

60+

8 / 16 / 44 / 48 кГц

Наша экспертиза

Согласуйте аудиоданные с более умными моделями НЛП

Сборник монологов

Диалог Речь Транспортировка

Группа / Мути-пати Диалоги

Коллекция высказываний на естественном языке

Акустические данные Транспортировка

Автоматическое распознавание речи (ASR)

Многоязычная речь/аудиообучающие данные

Преобразование текста в речь (ТТС)

Call Center Записи

случай

Причины выбрать Shaip в качестве надежного партнера по сбору речевых данных

Люди

Обработка

Платформа

Люди

Обработка

Платформа

Готовые наборы речевых/аудиоданных

Предлагаемые услуги

Сбор текстовых данных Услуги

Услуги по сбору данных об изображениях

Услуги по сбору видеоданных

Рекомендуемые ресурсы

Предлагающий

Аудиоаннотации для интеллектуальных ИИ

Руководство для покупателя

Руководство покупателя: полное руководство по диалоговому ИИ

Каталог данных

Готовый каталог речевых данных и лицензирование

Хотите создать свой собственный набор аудиоданных?

Часто задаваемые вопросы (FAQ)

Службы данных AI

Специальность

Промышленный дизайн

Продукция

Компания

Полезные ресурсы

Свяжитесь с нами

Диалог Речь
Транспортировка

Группа / Мути-пати
Диалоги

Акустические данные
Транспортировка

Преобразование текста в речь
(ТТС)

Call Center
Записи

Сбор текстовых данных
Услуги