Самые надежные службы сбора речевых данных для вашего ИИ
Обучите свои модели НЛП, виртуальные помощники, прототипы TTS и многое другое с помощью качественных разговорных данных с помощью наших служб сбора аудио- и речевых данных.
Откройте для себя конвейеры аудиоданных без узких мест
Избранные клиенты
Профессиональные услуги по сбору аудио/голосовых данных
Любая тема. Любой сценарий.
В Shaip наш опыт заключается в создании высококачественных наборов речевых данных, предназначенных для различных требований AI/ML. Мы предлагаем широкий выбор языков и ведем запись в различных условиях, что делает наши наборы данных всеобъемлющими и адаптируемыми. ОНаша цель — предоставить моделям наибольший объем пользовательских речевых данных в кратчайшие сроки. С нами на борту вы можете рассчитывать на:
- Кураторские высококачественные многоязычные аудио/голосовые данные для повышения точности
- Максимально возможный уровень доменной специфичности для tвыбрать разнообразный сценарий установка
- Масштабируйте свою модель машинного обучения, чтобы она соответствовала различным демографическим характеристикам и вертикалям
- Среда записи: Студийное качество, кристально чистый звук с минимальным фоновым шумом и Природная среда, где записи включают окружающие звуки, имитирующие реальные ситуации.
100+
55К +
Данные о часах речи
250+
Проекты
60+
Языки (более 100 диалектов)
8 / 16 / 44 / 48 кГц
Частота выборки
Наша экспертиза
Согласуйте аудиоданные с более умными моделями НЛП
Shaip предлагает услуги по непрерывному сбору речевых / аудиоданных на более чем 100+ языках, чтобы позволить голосовым технологиям обслуживать самые разные аудитории по всему миру. Мы можем работать над проектами любого объема и размера; от лицензирования существующих готовых наборов аудиоданных до управления сбором пользовательских аудиоданных, транскрипции и аннотации аудиоданных. Независимо от того, насколько велик ваш проект по сбору речевых данных, мы можем настроить службы сбора аудиоданных в соответствии с вашими потребностями для создания высококачественных наборов данных НЛП, ориентированных на диалекты, тона и языки. Выбирайте из нашего широкого спектра наборов речевых данных и ресурсов для сбора аудиоданных для интеллектуальных настроек голосовой связи.
Монологическая и спонтанная речь
Он фокусируется на обработке речи одного говорящего. Используйте скриптовые подсказки для подачи в одноканальные аудиофайлы, обеспечивая запись уникальных речевых шаблонов, тонов и нюансов, характерных для конкретного человека.
Диалог по сценарию и спонтанная речь
Взаимодействие двух человек, воспроизводящее реальные разговоры и диалоги с многоязычным доступом через двухканальные файлы и расшифрованные ресурсы.
Группа / Мути-пати
Conversations
Обсуждения с участием нескольких человек, фиксирующие групповую динамику, совпадения и различные тона для точной тренировки речевых моделей.
Сборник пробуждающих слов/ключевых фраз/высказываний
Обучите ИИ распознавать ключевые фразы или пробуждать слова или высказывания со схожим значением, используя разнообразные, насыщенные и аутентичные высказывания для расширенной обработки и понимания естественного языка.
Акустические данные
Транспортировка
Мы можем профессионально записывать аудиоданные студийного качества, будь то рестораны, офисы или дома, или из разных сред и на разных языках, охватывая при этом более широкий акустический диапазон (комплексные наборы звуковых данных).
Автоматическое распознавание речи (ASR)
Повысьте точность своих систем автоматического распознавания речи (ASR), получив доступ к современным диверсифицированным наборам речевых/аудиоданных из широкого спектра демографических данных.
Многоязычная речь/аудиообучающие данные
Наши квалифицированные лингвисты по всему миру предлагают многоязычные аудио/речевые данные на разных языках и диалектах. Эти усилия способствуют глобальному общению и преодолению языковых барьеров, способствуя созданию более инклюзивных и эффективных решений в области искусственного интеллекта.
Преобразование текста в речь
(ТТС)
Создайте многоязычную модель преобразования текста в речь (TTS) с помощью наших специалистов по всему миру, которые помогут вам собирать речевые данные на более чем 150 языках и диалектах, чтобы усовершенствовать ваши модели искусственного интеллекта — от элементов управления в автомобиле до чат-ботов и обучающих решений с высокой эффективностью. качественные аудиоданные.
Call Center
Conversations
Настоящий обмен информацией между агентами и клиентами, поддерживающий множество языков, таких как испанский, немецкий, американский английский, бенгальский, японский, китайский и хинди.
случай
Наборы данных разговорного ИИ, содержащие более 3 тысяч часов данных на 8 языках.
Стремясь создать многоязычную платформу для индийских языков, клиент заключил партнерское соглашение с Shaip для сбора, сегментации и расшифровки больших наборов данных на нескольких индийских языках. Это поможет разработать эффективные речевые модели, которые могут стать основой новой инновационной платформы клиента.
Проблема: Более 3,000 часов аудиоданных, собранных на 8 индийских языках, сегментированных и расшифрованных для автоматического распознавания речи.
Решение: Мы обеспечили сбор данных, сегментацию, транскрипцию и доставили файлы JSON с метаданными. Мы собрали 3000 часов аудиоданных на 8 индийских языках в большом масштабе для проекта речевой технологии клиента.
Причины выбрать Shaip в качестве надежного партнера по сбору речевых данных
Люди
Выделенные и обученные команды:
- Более 30,000 сотрудников по созданию, маркировке и контролю качества данных
- Аттестованная команда управления проектами
- Опытная команда по разработке продуктов
- Команда поиска и адаптации кадрового резерва
Обработка
Наивысшая эффективность процесса обеспечивается:
- Надежный 6-сигма-технологический процесс
- Специальная команда «черных поясов 6 сигм» - владельцы ключевых процессов и соблюдение требований к качеству
- Непрерывное совершенствование и обратная связь
Платформа
Запатентованная платформа предлагает преимущества:
- Сквозная веб-платформа
- Безупречное качество
- Быстрее ТАТ
- Бесшовная доставка
Люди
Выделенные и обученные команды:
- Более 30,000 сотрудников по созданию, маркировке и контролю качества данных
- Аттестованная команда управления проектами
- Опытная команда по разработке продуктов
- Команда поиска и адаптации кадрового резерва
Обработка
Наивысшая эффективность процесса обеспечивается:
- Надежный 6-сигма-технологический процесс
- Специальная команда «черных поясов 6 сигм» - владельцы ключевых процессов и соблюдение требований к качеству
- Непрерывное совершенствование и обратная связь
Платформа
Запатентованная платформа предлагает преимущества:
- Сквозная веб-платформа
- Безупречное качество
- Быстрее ТАТ
- Бесшовная доставка
Готовые наборы речевых/аудиоданных
Подробнее | Идентификатор корпуса (уникальный) | Ключевое слово | Языковой набор данных | Код языка | Частота дискретизации | Тип набора данных | Всего часов аудио | Описание | Описание набора данных | Аудиоканала | Платформа записи | Вер (%) | Аудио форматы | Формат транскрипции | Кейсы | Количество динамиков | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Нью-Йорк English_GC_8 | Нью-йоркский английский | Нью-йоркский английский | en_US | 8 кГц | Общий разговор | 107 | Данные общего разговорного английского в Нью-Йорке | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 118, Мужчина 114, Неизвестно 0 | Контакты | |
Русский_SM_48 | Русский | Русский | RU-RU | 48 кГц | Монолог по сценарию | 2,398 | Монолог по русскому сценарию | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1689 Мужчина 1937 Неизвестно 214 | Контакты | |
Пенджаби_MA | панджаби | Пенджаби (в разработке) | панджаби | Медиа Аудио | 40 | Пенджаби (в конвейере) Медиа-аудиоданные | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
панджаби_GC | панджаби | Пенджаби (в разработке) | панджаби | Общий разговор | 100 | Панджаби (в разработке) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Панджаби_CC_8 | панджаби | Пенджаби (в разработке) | панджаби | Call-центр | 60 | Панджаби (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Польский Poland_SM_48 | Польский (польша) | Польский (польша) | PL-PL | 48 кГц | Монолог по сценарию | 1,482 | Польская Польша - Монолог по сценарию | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1324 Мужчина 701 Неизвестно 24 | Контакты | |
Польский_MA_16 | Польский | Польский | pl_PL | 16 кГц | Медиа Аудио | 269 | Польские СМИ аудио | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 173 Мужчина 354 Неизвестно 6 | Контакты | |
Ория_МА | Ория | Ория (в разработке) | или_IN | Медиа Аудио | 40 | Аудиоданные мультимедиа Oriya (In Pipeline) | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Ория_GC | Ория | Ория (в разработке) | или_IN | Общий разговор | 100 | Oriya (In Pipeline) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Ория_CC_8 | Ория | Ория (в разработке) | или_IN | Call-центр | 60 | Oriya (In Pipeline) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Новая Зеландия_MA_16 | Новозеландский английский | Новозеландский английский | ru_NZ | 16 кГц | Медиа Аудио | 400 | Новозеландский английский СМИ аудио | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 367, мужчина 678, Неизвестно 26 | Контакты | |
Новая Зеландия_GC_8 | Новозеландский английский | Новозеландский английский | ru_NZ | 8 кГц | Общий разговор | 148 | Данные новозеландского английского для общего разговора | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 167, мужчина 121, Неизвестно 4 | Контакты | |
Нью-Йорк английский_MA_16 | Нью-йоркский английский | Нью-йоркский английский | en_US | 16 кГц | Медиа Аудио | 140 | Аудиоданные New York English Media | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 66, Мужчина 230, Неизвестно 11 | Контакты | |
шотландский_GC_8 | Шотландский (английский акцент) | Шотландский (английский акцент) | ru_AB | 8 кГц | Общий разговор | 292 | Данные шотландского общего разговора | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 285, Мужчина 260, Неизвестно 3 | Контакты | |
Нью-Йорк английский_CC_8 | Нью-йоркский английский | Нью-йоркский английский | en_US | 8 кГц | Call-центр | 103 | Данные колл-центра New York English | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 610, Мужчина 532, Неизвестно 0 | Контакты | |
Нидерланды_SM_48 | Голландский | Голландский | NL-NL | 48 кГц | Монолог по сценарию | 1,205 | Монолог по голландскому сценарию | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1285 Мужчина 531 Неизвестно 3 | Контакты | |
Мексиканский_SM_48 | Испанский (Мексика) | Испанский (Мексика) | эс-MX | 48 кГц | Монолог по сценарию | 1,492 | Мексиканский монолог по испанскому сценарию | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1016 Мужчина 1069 Неизвестно 95 | Контакты | |
Маратхи_MA | Маратхи | Маратхи (в разработке) | г-н_IN | Медиа Аудио | 40 | Аудиоданные мультимедиа маратхи (в конвейере) | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
маратхи_GC | Маратхи | Маратхи (в разработке) | г-н_IN | Общий разговор | 100 | Маратхи (в конвейере) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
маратхи_CC_8 | Маратхи | Маратхи (в разработке) | г-н_IN | Call-центр | 60 | Данные колл-центра на языке маратхи (в разработке) | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Малаялам_MA | Малайялам | Малаялам (в разработке) | мл_IN | Медиа Аудио | 40 | Малаялам (In Pipeline) Медиа-аудиоданные | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Малаялам_GC | Малайялам | Малаялам (в разработке) | мл_IN | Общий разговор | 100 | Малаялам (в конвейере) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
малаялам_CC_8 | Малайялам | Малаялам (в разработке) | мл_IN | Call-центр | 60 | Малаялам (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Малайский_MA_16 | Malay | Malay | мс_МГ | 16 кГц | Медиа Аудио | 344 | Аудиоданные малайских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 236, Мужчина 626, Неизвестно 47 | Контакты | |
Малайский_GC_8 | Malay | Malay | мс_МГ | 8 кГц | Общий разговор | 266 | Данные малайского общего разговора | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, малайский в Малайзии. | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 316, Мужчина 176, Неизвестно 0 | Контакты | |
Телугу_GC_8 | Телугу | Телугу | te_IN | 8 кГц | Общий разговор | 553 | Общие разговорные данные на телугу | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 574, Мужчина 564, Неизвестно 0 | Контакты | |
Великобритания английский_WW_16 | Великобритания Английский | Великобритания Английский | ru_uk | 16 кГц | Wake Word | 200 Выступающие | Wake Word (Великобритания) английский | сбор данных по ключевым фразам
| 1 канал | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Пол: 50% мужчин, 50% женщин, +/- 10%. | Контакты | |
Уэльский_GC_8 | Валлийский (английский акцент) | Валлийский (английский акцент) | ru_WL | 8 кГц | Общий разговор | 278 | Данные валлийского общего разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 270, Мужчина 324, Неизвестно 0 | Контакты | |
Вьетнамский_MA_16 | Вьетнамский | Вьетнамский | vi_VN | 16 кГц | Медиа Аудио | 257 | Аудиоданные вьетнамских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщины 249, мужчины 200, Неизвестные 45 | Контакты | |
Вьетнамский_GC_8 | Вьетнамский | Вьетнамский | vi_VN | 8 кГц | Общий разговор | 295 | Данные вьетнамского общего разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, северный (например, Ханой), центральный и южный (например, Хошимин). | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщины 400, мужчины 380, Неизвестные 2 | Контакты | |
Турецкая Турция_SM_48 | Турецкая Турция | Турецкая Турция | TR-TR | 48 кГц | Монолог по сценарию | 2,027 | Турецкая Турция | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1561 Мужчина 1241 Неизвестно 31 | Контакты | |
Тайский_MA_8 | Тайский | Тайский | th_TH | 16 кГц | Медиа Аудио | 173 | Тайские СМИ аудио | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 143, Мужчина 502, Неизвестно 26 | Контакты | |
Тайский_GC_8 | Тайский | Тайский | th_TH | 8 кГц | Общий разговор | 183 | Тайский общий разговор | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, неформальная регистрация, используемая между друзьями. | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 338, Мужчина 96, Неизвестно 8 | Контакты | |
Телугу_MA | Телугу | Телугу (в разработке) | te_IN | Медиа Аудио | 20 | Телугу (в конвейере) Медиа-аудиоданные | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Телугу_GC | Телугу | Телугу (в разработке) | te_IN | Общий разговор | 50 | Телугу (в конвейере) Общие данные беседы | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Телугу_CC_8 | Телугу | Телугу (в разработке) | te_IN | Call-центр | 30 | Телугу (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Телугу_MA_16 | Телугу | Телугу | te_IN | 16 кГц | Медиа Аудио | 648 | Аудиоданные телугу Media | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 207, Мужчина 963, Неизвестно 2 | Контакты | |
Корейский_SM_48 | Корейский | Корейский | ко-KR | 48 кГц | Монолог по сценарию | 1,955 | Монолог по корейскому сценарию | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1195 Мужчина 1134 Неизвестно 122 | Контакты | |
Тамил_MA | Тамильский | Тамильский (в разработке) | ta_IN | Медиа Аудио | 40 | Аудиоданные мультимедиа на тамильском языке (в разработке) | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Тамильский_GC | Тамильский | Тамильский (в разработке) | ta_IN | Общий разговор | 100 | Тамильский (в разработке) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Тамильский_CC_8 | Тамильский | Тамильский (в разработке) | ta_IN | Call-центр | 60 | Тамильский (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Шведский_MA_16 | Шведский | Шведский | sv_SE | 16 кГц | Медиа Аудио | 278 | Аудиоданные шведских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 195, мужчина 500, Неизвестно 21 | Контакты | |
Шведский_CC_8 | Шведский | Шведский | sv_SE | 8 кГц | Call-центр | 250 | Данные шведского колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1581, мужчина 727, Неизвестно 2 | Контакты | |
Суахили_MA_16 | суахили | суахили | sw_KE | 16 кГц | Медиа Аудио | 265 | Аудиоданные СМИ суахили | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 118, Мужчина 493, Неизвестно 25 | Контакты | |
Суахили_CC_8 | суахили | суахили | sw_KE | 8 кГц | Call-центр | 230 | Данные колл-центра на суахили | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 611, Мужчина 833, Неизвестно 0 | Контакты | |
Южноафриканский английский_MA_16 | Южноафриканский английский | Южноафриканский английский | ru_ZA | 16 кГц | Медиа Аудио | 251 | Звуковые данные южноафриканских английских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 235, Мужчина 432, Неизвестно 36 | Контакты | |
Южноафриканский английский_CC_8 | Южноафриканский английский | Южноафриканский английский | ru_ZA | 8 кГц | Call-центр | 261 | Данные южноафриканского английского колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1274 , Мужчина 935 , Неизвестно 1 | Контакты | |
Сингапур_MA_16 | Сингапурский английский | Сингапурский английский | ru_SG | 16 кГц | Медиа Аудио | 247 | Аудиоданные Сингапурских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 160, Мужчина 455, Неизвестно 37 | Контакты | |
Сингапур_CC_8 | Сингапурский английский | Сингапурский английский | ru_SG | 8 кГц | Call-центр | 218 | Данные колл-центра Сингапура | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 2139, Мужчина 884, Неизвестно 21 | Контакты | |
Бостон_CC_8 | Бостонский английский | Бостонский английский | en_US | 8 кГц | Call-центр | 177 | Данные колл-центра Бостона | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 605, Мужчин: 711, Неизвестно: 0 | Контакты | |
Английский Deep South_CC_8 | Английский Deep South | Английский Deep South | en_US | 8 кГц | Call-центр | 151 | English Данные колл-центра Deep South | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 221, Мужчина 1004, Неизвестно 7 | Контакты | |
Датский_SM_48 | Датский | Датский | да-DK | 48 кГц | Монолог по сценарию | 2,579 | Монолог на датском языке | Записи с одним высказыванием, длительностью от 5 до 30 секунд, датский из Дании. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1551 Мужчина 1233 Неизвестно 42 | Контакты | |
датский_MA_16 | Датский | Датский | да_ДК | 16 кГц | Медиа Аудио | 664 | Аудиоданные датских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 369, Мужчин: 864, Неизвестно: 27 | Контакты | |
датский_GC_8 | Датский | Датский | да_ДК | 8 кГц | Общий разговор | 372 | Датские общие разговорные данные | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 311, Мужчин: 417, Неизвестно: 0 | Контакты | |
Китайский традиционный_SM_48 | Традиционный китайский | Традиционный китайский | zh-TW | 48 кГц | Монолог по сценарию | 1,028 | Традиционный китайский | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1069 Мужчина 262 Неизвестно 3 | Контакты | |
Китайский упрощенный_SM_48 | Китайский упрощенный | Китайский упрощенный | ZH-CN | 48 кГц | Монолог по сценарию | 2,762 | Китайский упрощенный | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1920 Мужчина 1535 Неизвестно 270 | Контакты | |
Китайский_MA_16 | Китайский английский | Китайский английский | en_US | 16 кГц | Медиа Аудио | 249 | Аудиоданные китайских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 126, Мужчин: 346 и Неизвестно: 6 | Контакты | |
Китайский_CC_8 | Китайский английский | Китайский английский | en_US | 8 кГц | Call-центр | 169 | Данные китайского колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 1790, Мужчин: 523 и Неизвестно: 13 | Контакты | |
Канадский_SM_48 | Канадский французский | Канадский французский | FR-CA | 48 кГц | Монолог по сценарию | 1,222 | Канадский французский | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 974 Мужчина 631 Неизвестно 1 | Контакты | |
Бостон_MA_16 | Бостонский английский | Бостонский английский | en_US | 16 кГц | Медиа Аудио | 93 | Аудиоданные Boston Media | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 43, Мужчин: 181, Неизвестно: 2 | Контакты | |
Бостон_GC_8 | Бостонский английский | Бостонский английский | en_US | 8 кГц | Общий разговор | 32 | Данные общего разговора в Бостоне | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 53, Мужчин: 83, Неизвестно: 0 | Контакты | |
Английский Deep South_GC_8 | Английский Deep South | Английский Deep South | en_US | 8 кГц | Общий разговор | 56 | Данные английского Deep South General Conversation | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 99, Мужчина 31, Неизвестно 0 | Контакты | |
Бенгальский_MA | Бенгальский | Бенгальский (в разработке) | bn_IN | Медиа Аудио | 40 | Бенгальский (In Pipeline) Медиа-аудиоданные | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Бенгальский_GC | Бенгальский | Бенгальский (в разработке) | bn_IN | Общий разговор | 100 | Бенгальский (In Pipeline) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Бенгальский_CC_8 | Бенгальский | Бенгальский (в разработке) | bn_IN | Call-центр | 60 | Бенгальский (в разработке) данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Ассамский_MA | Ассамский | Ассамский (в разработке) | как в | Медиа Аудио | 40 | Аудиоданные мультимедиа на ассамском языке (в разработке) | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Ассамский_GC | Ассамский | Ассамский (в разработке) | как в | Общий разговор | 100 | Ассамский (в разработке) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Ассамский язык_CC_8 | Ассамский | Ассамский (в разработке) | как в | Call-центр | 60 | Ассамский (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Арабский_SM_48 | арабском | арабском | ар-SA | 48 кГц | Монолог по сценарию | 1,947 | Монолог на арабском языке | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 838 Мужчина 1209 Неизвестно 78 | Контакты | |
арабский_GC_8 | арабском | арабском | ar_AE | 8 кГц | Общий разговор | 292 | Данные для общего разговора на арабском языке | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, арабский язык из стран Персидского залива | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 171, Мужчин: 534, Неизвестно: 1 | Контакты | |
Африкаанс_MA_16 | Африкаанс | Африкаанс | af_ZA | 16 кГц | Медиа Аудио | 658 | Медиафайлы на африкаанс | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 750, Мужчин: 1278, Неизвестно: 52 | Контакты | |
Африкаанс_GC_8 | Африкаанс | Африкаанс | af_ZA | 8 кГц | Общий разговор | 368 | Данные общего разговора на африкаанс | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, африкаанс, на котором говорят в Африке. | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 502, Мужчин: 390, Неизвестно: 2 | Контакты | |
ru_US_MA_16 | Афроамериканский диалект | Афроамериканский диалект | en_US | 16 кГц | Медиа Аудио | 154 | Данные афроамериканских народных СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 151, Мужчин: 150, Неизвестно: 10 | Контакты | |
ХИНГЛИШ_МА_16 | хинглиш | хинглиш | hg_IN | 16 кГц | Медиа Аудио | 216 | HINGLISH Мультимедийные аудиоданные | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 75, Мужчина 380, Неизвестно 0 | Контакты | |
Корейский_MA_16 | Корейский | Корейский | ko_KR | 16 кГц | Медиа Аудио | 204 | Звуковые данные корейских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 70 Мужчина 303, Неизвестно 25 | Контакты | |
Корейский_CC_8 | Корейский | Корейский | ko_KR | 8 кГц | Call-центр | 107 | Данные корейского колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1086, Мужчина 210, Неизвестно 4 | Контакты | |
Каннада_MA | каннады | Каннада (в разработке) | кн_ИН | Медиа Аудио | 40 | Каннада (в конвейере) Медиа-аудиоданные | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Каннада_GC | каннады | Каннада (в разработке) | кн_ИН | Общий разговор | 100 | Каннада (в конвейере) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
каннада_CC_8 | каннады | Каннада (в разработке) | кн_ИН | Call-центр | 60 | Каннада (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Японский_SM_48 | Японский | Японский | JA-JP | 48 кГц | Монолог по сценарию | 2,335 | Монолог по японскому сценарию | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1460 Мужчина 1221 Неизвестно 194 | Контакты | |
Ирландский_GC_8 | ирландский | ирландский | ru_IE | 8 кГц | Общий разговор | 192 | Данные ирландского общего разговора | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 213 , Мужчина 153 , Неизвестно 0 | Контакты | |
Индонезийский_MA_16 | Индонезийский | Индонезийский | я сделал | 16 кГц | Медиа Аудио | 643 | Аудиоданные индонезийских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 746, Мужчина 1507, Неизвестно 129 | Контакты | |
Индонезийский_GC_8 | Индонезийский | Индонезийский | я сделал | 8 кГц | Общий разговор | 496 | Данные индонезийского общего разговора | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, индонезийский индонезийский | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 524, Мужчина 454, Неизвестно 2 | Контакты | |
Латиноамериканец_MA_16 | Латиноамериканский английский | Латиноамериканский английский | en_US | 16 кГц | Медиа Аудио | 155 | Аудио для латиноамериканского звонка | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 140, Мужчина 219, Неизвестно 5 | Контакты | |
Латиноамериканец_CC_8 | Латиноамериканский английский | Латиноамериканский английский | en_US | 8 кГц | Call-центр | 212 | Данные колл-центра для латиноамериканцев | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 822, Мужчина 1262, Неизвестно 0 | Контакты | |
ru_US_CC_8 | Афроамериканский диалект | Афроамериканский диалект | en_US | 8 кГц | Колл-центр | 211 | Данные колл-центра для афроамериканцев | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 612, Мужчин: 1242, Неизвестно: 12 | Контакты | |
ХИНГЛИШ_CC_8 | хинглиш | хинглиш | hg_IN | 8 кГц | Call-центр | 208 | HINGLISH Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 822, Мужчина 1262, Неизвестно 0 | Контакты | |
Хинди_SM_48 | Хинди | Хинди | привет-IN | 48 кГц | Монолог по сценарию | 2,867 | Монолог по сценарию на хинди | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1977 Мужчина 1864 Неизвестно 147 | Контакты | |
Хинди_MA_16 | Хинди | Хинди | привет_IN | 16 кГц | Медиа Аудио | 219 | Аудиоданные хинди-медиа | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 83, Мужчина 309, Неизвестно 0 | Контакты | |
Иврит_MA_16 | древнееврейский | древнееврейский | он_ИЛ | 16 кГц | Медиа Аудио | 427 | Аудиоданные на иврите Media | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 361, Мужчина 513, Неизвестно 13 | Контакты | |
Иврит_Общий разговор_8 | древнееврейский | древнееврейский | он_ИЛ | 8 кГц | Общий разговор | 399 | Данные общего разговора на иврите | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, иврит в Израиле | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 414 , Мужчина 399 , Неизвестно 1 | Контакты | |
Гуджарати_MA | Гуджарати | Гуджарати (в разработке) | gu_IN | Медиа Аудио | 40 | Аудиоданные мультимедиа гуджарати (в конвейере) | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Гуджарати_GC | Гуджарати | Гуджарати (в разработке) | gu_IN | Общий разговор | 100 | Гуджарати (в конвейере) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Гуджарати_CC_8 | Гуджарати | Гуджарати (в разработке) | gu_IN | Call-центр | 60 | Гуджарати (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
немецкий_IVR_8 | Немецкий | Немецкий | де-де | 8 кГц | IVR | 200 | IVR-данные Германии | Человек к машине. Тип потока IVR, в котором есть подсказка TTS (например, «Чем я могу вам помочь»), за которой следует спонтанный ответ человека. | Моно | Для ПК | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 10115 Мужчина 8750 Неизвестно 0 | Контакты | ||
немецкий_CC_8 | Немецкий | Немецкий | де-де | 8 кГц | Call-центр | 64 | Данные немецкого колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Моно | Для ПК | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 478 Мужчина 1440 Неизвестно 0 | Контакты | ||
Английский Deep South_MA_16 | Английский Deep South | Английский Deep South | en_US | 16 кГц | Медиа Аудио | 266 | Аудиоданные Deep South Media на английском языке | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 204, Мужчина 356, Неизвестно 21 | Контакты |
Предлагаемые услуги
Экспертный сбор аудиоданных - это не все, что нужно для комплексных настроек ИИ. В Shaip вы даже можете рассмотреть следующие услуги, чтобы сделать модели более распространенными, чем обычно:
Сбор текстовых данных
Услуги
Истинная ценность сервисов сбора когнитивных данных Shaip заключается в том, что они дают организациям ключ к разблокированию важной информации, содержащейся в неструктурированных данных.
Услуги по сбору данных об изображениях
Убедитесь, что ваша модель компьютерного зрения точно идентифицирует каждое изображение, чтобы беспрепятственно обучать модели искусственного интеллекта следующего поколения будущего.
Услуги по сбору видеоданных
Теперь сосредоточьтесь на компьютерном зрении вместе с НЛП, чтобы научить свои модели в совершенстве определять объекты, людей, сдерживающие факторы и другие визуальные элементы.
Рекомендуемые ресурсы
Предлагающий
Аудиоаннотации для интеллектуальных ИИ
Службы аудиоаннотации были сильной стороной Shaip с самого начала. Разрабатывайте, обучайте и улучшайте диалоговый ИИ, чат-боты и механизмы распознавания речи с помощью наших современных сервисов аудиоаннотации.
Руководство для покупателя
Руководство покупателя: полное руководство по диалоговому ИИ
Чат-бот, с которым вы разговаривали, работает на продвинутой системе искусственного интеллекта, которая обучена, протестирована и построена с использованием множества наборов данных для распознавания речи.
Каталог данных
Готовый каталог речевых данных и лицензирование
Существует множество распространенных приложений для речевых данных в проектах ИИ. Мы предлагаем вам огромное количество высококачественных данных, готовых для распознавания вашего голоса.
Хотите создать свой собственный набор аудиоданных?
Свяжитесь с нашим штатным экспертом по сбору речевых данных, чтобы настроить репозиторий аудио, который наилучшим образом соответствует вашим требованиям.
Часто задаваемые вопросы (FAQ)
Сбор речевых данных для модели машинного обучения — это процесс сбора аудиозаписей разговорной речи. Этот сборник помогает в обучении и совершенствовании алгоритмов машинного обучения, особенно тех, которые ориентированы на понимание и обработку человеческих голосов.
Если вы хотите собрать аудиоданные для автоматического распознавания речи (ASR), вам следует начать с определения конкретных потребностей вашего проекта, включая желаемый язык, акцент и тип речи. После установки этих параметров убедитесь, что вы получили все необходимые разрешения для соблюдения конфиденциальности пользователей. Затем используйте соответствующие записывающие устройства или программное обеспечение для записи четких аудиосэмплов. Каждая запись должна быть тщательно аннотирована ее транскрипцией или другими соответствующими метаданными и систематически храниться для облегчения доступа.
Набор речевых данных в машинном обучении имеет решающее значение для обучения, тестирования и проверки моделей, предназначенных для распознавания, транскрипции или интерпретации разговорной речи. Такие наборы данных открывают путь для множества приложений: от голосовых помощников и служб транскрипции до голосовой биометрии.
Для сбора точных данных о разных языках и акцентах жизненно важно сотрудничество с носителями языка желаемого языкового происхождения. Стремитесь к разнообразной и репрезентативной выборке, охватывающей широкий спектр демографических нюансов. Используйте стандартизированное записывающее оборудование в единых средах, чтобы обеспечить согласованность звука. И что немаловажно, аннотируйте каждый фрагмент данных подробными транскрипциями и метаданными, обозначая конкретный язык и акцент.