Самые надежные службы сбора речевых данных для вашего ИИ
Обучите свои модели НЛП, виртуальные помощники, прототипы TTS и многое другое с помощью качественных разговорных данных с помощью наших служб сбора аудио- и речевых данных.
Откройте для себя конвейеры аудиоданных без узких мест.
Избранные клиенты
Зачем нужен набор данных для обучения речи для обработки естественного языка?
Вы когда-нибудь замечали, что ваш смартфон VA, то есть Siri, Bixby или что-то еще, взаимодействует? То, как они отвечают на каждый вопрос, анализируют и представляют результаты в соответствии с вашими требованиями!
Что ж, как бы нас ни интриговали эти виртуальные машины, эти интеллектуальные ресурсы и программы необходимо постепенно обучать, чтобы они могли реагировать так же точно. Именно по этой причине вам следует рассмотреть возможность аутсорсинга сбора речи/аудио и голосовых данных специализированным компаниям по сбору данных, обладающим подтвержденным профессиональным опытом.
Инвестирование в сбор аудиоданных подготавливает ваше предполагаемое НЛП для обслуживания многоязычной аудитории. Мало того, сбор речевых данных для НЛП, когда он обрабатывается экспертом, даже принимает во внимание сбор в полевых условиях, семантический анализ и аудиотранскрипцию. Используя профессиональные решения для сбора речевых данных, вы можете:
- Приобретайте высококачественные наборы аудиоданных для повышения точности
- Целевая настройка разнообразных сценариев
- Сбор многоязычных обучающих данных ИИ
- Масштабируйте свою модель машинного обучения, чтобы она соответствовала различным демографическим характеристикам и вертикалям
Профессиональные услуги по сбору аудио / голосовых данных для НЛП
Любая тема. Любой сценарий.
Интеллектуальные системы НЛП далеко не универсальны. В зависимости от функциональности программы вам, возможно, придется сосредоточиться на услугах пространственных и многоязычных аудиоданных, которые могут быть предложены только известными компаниями по сбору голосовых / аудиоданных. Именно здесь Shaip входит в схему вещей как высоконадежный поставщик услуг передачи данных, который гордится тем, что делает тяжелую работу для ваших якобы интеллектуальных ИИ.
В Shaip основное внимание уделяется кормлению моделей максимально возможным объемом пользовательских образцов речи в кратчайшие сроки. С нами на борту вы можете рассчитывать:
- Курируемый сбор аудио / голосовых данных для НЛП
- Индивидуальные программы, отвечающие конкретным вариантам использования
- Подготовка к интеллектуальному анализу аудиоданных
- Индивидуальная и автоматизированная обработка данных
- Максимально возможный уровень доменной специфики
- Более быстрый выход на рынок с ускоренными моделями искусственного интеллекта
Наша экспертиза
Выровняйте аудиоданные для подготовки интеллектуальных моделей НЛП
Shaip предлагает услуги по непрерывному сбору речевых / аудиоданных на более чем 100+ языках, чтобы позволить голосовым технологиям обслуживать самые разные аудитории по всему миру. Мы можем работать над проектами любого объема и размера; от лицензирования существующих готовых наборов аудиоданных до управления сбором пользовательских аудиоданных, транскрипции и аннотации аудиоданных. Независимо от того, насколько велик ваш проект по сбору речевых данных, мы можем настроить службы сбора аудиоданных в соответствии с вашими потребностями для создания высококачественных наборов данных НЛП, ориентированных на диалекты, тона и языки. Выбирайте из нашего широкого спектра наборов речевых данных и ресурсов для сбора аудиоданных для интеллектуальных настроек голосовой связи.
Сборник монологов
Выполняйте требования на основе речи, относящиеся к автономному динамику для ваших прототипов преобразования текста в скорость, и требования, связанные с транскрипцией, с помощью скриптовых подсказок через одноканальные файлы.
Диалог Речь
Коллекция
Настройте интеллектуальных виртуальных помощников, чат-ботов с заданной скоростью и модели автоматического распознавания речи с многоязычным представлением через двухканальные файлы и транскрибированные ресурсы.
Акустические данные
Коллекция
Мы можем профессионально записывать аудиоданные студийного качества, будь то рестораны, офисы или дома, или из различных сред и языков, через нашу глобальную сеть сотрудников, при этом охватывая более широкий акустический диапазон.
Коллекция высказываний на естественном языке
Обучите интеллектуальные коммерческие установки определять по-разному произносимые клиентские фразы со схожим значением, чтобы сделать ИИ более автономными во времени.
Цифровой / Виртуальный
Помощники
Сосредоточьтесь на создании своего будущего виртуального помощника, обучая модели с оговорками, касающимися человеческой речи, многоязычного взаимодействия, контекстного анализа и NLU.
Автоматическое распознавание речи (ASR)
Повысьте точность своих систем автоматического распознавания речи (ASR), получив доступ к современным диверсифицированным наборам речевых/аудиоданных из широкого спектра демографических данных.
Многоязычная речь/аудиообучающие данные
Наши высококвалифицированные лингвисты по всему миру предлагают многоязычные аудио/речевые обучающие данные на нескольких языках и диалектах, включая арабский, датский, китайский, африкаанс, сингапурский, новозеландский, иврит, индонезийский, ирландский, корейский, малайский, польский, шотландский, шведский. , французский, немецкий, вьетнамский, тайский, итальянский, испанский и другие.
Преобразование текста в речь
(ТТС)
Чтобы предложить лучший пользовательский опыт с TTS, крайне важно разработать систему, которая будет звучать естественно. Создайте многоязычную модель преобразования текста в речь (TTS) с помощью наших сотрудников по всему миру, которые помогут вам собрать речевые данные на более чем 150 языках и диалектах, чтобы улучшить ваши модели искусственного интеллекта, от элементов управления в автомобиле до чат-ботов и обучающих решений с высокой точностью. качественные аудиоданные.
Причины выбрать Shaip в качестве надежного партнера по сбору речевых данных
Люди
Выделенные и обученные команды:
- Более 30,000 сотрудников по созданию, маркировке и контролю качества данных
- Аттестованная команда управления проектами
- Опытная команда по разработке продуктов
- Команда поиска и адаптации кадрового резерва
Обработка
Наивысшая эффективность процесса обеспечивается:
- Надежный 6-сигма-технологический процесс
- Специальная команда «черных поясов 6 сигм» - владельцы ключевых процессов и соблюдение требований к качеству
- Непрерывное совершенствование и обратная связь
Платформа
Запатентованная платформа предлагает преимущества:
- Сквозная веб-платформа
- Безупречное качество
- Быстрее ТАТ
- Бесшовная доставка
Люди
Выделенные и обученные команды:
- Более 30,000 сотрудников по созданию, маркировке и контролю качества данных
- Аттестованная команда управления проектами
- Опытная команда по разработке продуктов
- Команда поиска и адаптации кадрового резерва
Обработка
Наивысшая эффективность процесса обеспечивается:
- Надежный 6-сигма-технологический процесс
- Специальная команда «черных поясов 6 сигм» - владельцы ключевых процессов и соблюдение требований к качеству
- Непрерывное совершенствование и обратная связь
Платформа
Запатентованная платформа предлагает преимущества:
- Сквозная веб-платформа
- Безупречное качество
- Быстрее ТАТ
- Бесшовная доставка
Язык: собраны наборы аудиоданных
Готовые наборы речевых/аудиоданных
Подробнее | Идентификатор корпуса (уникальный) | Ключевое слово | Языковой набор данных | Код языка | Частота дискретизации | Тип набора данных | Всего часов аудио | Описание | Описание набора данных | Аудиоканала | Платформа записи | Вер (%) | Аудио форматы | Формат транскрипции | Кейсы | Количество динамиков | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
en_US_CC_8 | Афроамериканский диалект | Афроамериканский диалект | en_US | 8 кГц | Колл-центр | 211 | Данные колл-центра для афроамериканцев | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 612, Мужчин: 1242, Неизвестно: 12 | Контакты | |
en_US_MA_16 | Афроамериканский диалект | Афроамериканский диалект | en_US | 16 кГц | Медиа Аудио | 154 | Данные афроамериканских народных СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 151, Мужчин: 150, Неизвестно: 10 | Контакты | |
Африкаанс_GC_8 | Африкаанс | Африкаанс | af_ZA | 8 кГц | Общий разговор | 368 | Данные общего разговора на африкаанс | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, африкаанс, на котором говорят в Африке. | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 502, Мужчин: 390, Неизвестно: 2 | Контакты | |
Африкаанс_MA_16 | Африкаанс | Африкаанс | af_ZA | 16 кГц | Медиа Аудио | 658 | Медиафайлы на африкаанс | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 750, Мужчин: 1278, Неизвестно: 52 | Контакты | |
арабский_GC_8 | арабском | арабском | ar_AE | 8 кГц | Общий разговор | 292 | Данные для общего разговора на арабском языке | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, арабский язык из стран Персидского залива | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 171, Мужчин: 534, Неизвестно: 1 | Контакты | |
Арабский_SM_48 | арабском | арабском | ар-SA | 48 кГц | Монолог по сценарию | 1,947 | Монолог на арабском языке | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 838 Мужчина 1209 Неизвестно 78 | Контакты | |
Ассамский язык_CC_8 | Ассамский | Ассамский (в разработке) | как в | Call-центр | 60 | Ассамский (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Ассамский_GC | Ассамский | Ассамский (в разработке) | как в | Общий разговор | 100 | Ассамский (в разработке) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Ассамский_MA | Ассамский | Ассамский (в разработке) | как в | Медиа Аудио | 40 | Аудиоданные мультимедиа на ассамском языке (в разработке) | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Бенгальский_CC_8 | Бенгальский | Бенгальский (в разработке) | bn_IN | Call-центр | 60 | Бенгальский (в разработке) данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Бенгальский_GC | Бенгальский | Бенгальский (в разработке) | bn_IN | Общий разговор | 100 | Бенгальский (In Pipeline) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Бенгальский_MA | Бенгальский | Бенгальский (в разработке) | bn_IN | Медиа Аудио | 40 | Бенгальский (In Pipeline) Медиа-аудиоданные | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Бостон_CC_8 | Бостонский английский | Бостонский английский | en_US | 8 кГц | Call-центр | 177 | Данные колл-центра Бостона | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 605, Мужчин: 711, Неизвестно: 0 | Контакты | |
Бостон_GC_8 | Бостонский английский | Бостонский английский | en_US | 8 кГц | Общий разговор | 32 | Данные общего разговора в Бостоне | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 53, Мужчин: 83, Неизвестно: 0 | Контакты | |
Бостон_MA_16 | Бостонский английский | Бостонский английский | en_US | 16 кГц | Медиа Аудио | 93 | Аудиоданные Boston Media | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 43, Мужчин: 181, Неизвестно: 2 | Контакты | |
Канадский_SM_48 | Канадский французский | Канадский французский | FR-CA | 48 кГц | Монолог по сценарию | 1,222 | Канадский французский | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 974 Мужчина 631 Неизвестно 1 | Контакты | |
Китайский_CC_8 | Китайский английский | Китайский английский | en_US | 8 кГц | Call-центр | 169 | Данные китайского колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 1790, Мужчин: 523 и Неизвестно: 13 | Контакты | |
Китайский_MA_16 | Китайский английский | Китайский английский | en_US | 16 кГц | Медиа Аудио | 249 | Аудиоданные китайских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 126, Мужчин: 346 и Неизвестно: 6 | Контакты | |
Китайский упрощенный_SM_48 | Китайский упрощенный | Китайский упрощенный | ZH-CN | 48 кГц | Монолог по сценарию | 2,762 | Китайский упрощенный | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1920 Мужчина 1535 Неизвестно 270 | Контакты | |
Китайский традиционный_SM_48 | Традиционный китайский | Традиционный китайский | zh-TW | 48 кГц | Монолог по сценарию | 1,028 | Традиционный китайский | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1069 Мужчина 262 Неизвестно 3 | Контакты | |
датский_GC_8 | датский язык | датский язык | da_DK | 8 кГц | Общий разговор | 372 | Датские общие разговорные данные | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 311, Мужчин: 417, Неизвестно: 0 | Контакты | |
датский_MA_16 | датский язык | датский язык | da_DK | 16 кГц | Медиа Аудио | 664 | Аудиоданные датских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщин: 369, Мужчин: 864, Неизвестно: 27 | Контакты | |
Датский_SM_48 | датский язык | датский язык | да-DK | 48 кГц | Монолог по сценарию | 2,579 | Монолог на датском языке | Записи с одним высказыванием, длительностью от 5 до 30 секунд, датский из Дании. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1551 Мужчина 1233 Неизвестно 42 | Контакты | |
Английский Deep South_CC_8 | Английский Deep South | Английский Deep South | en_US | 8 кГц | Call-центр | 151 | English Данные колл-центра Deep South | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 221, Мужчина 1004, Неизвестно 7 | Контакты | |
Английский Deep South_GC_8 | Английский Deep South | Английский Deep South | en_US | 8 кГц | Общий разговор | 56 | Данные английского Deep South General Conversation | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 99, Мужчина 31, Неизвестно 0 | Контакты | |
Английский Deep South_MA_16 | Английский Deep South | Английский Deep South | en_US | 16 кГц | Медиа Аудио | 266 | Аудиоданные Deep South Media на английском языке | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 204, Мужчина 356, Неизвестно 21 | Контакты | |
немецкий_CC_8 | Немецкий | Немецкий | де-де | 8 кГц | Call-центр | 64 | Данные немецкого колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Моно | Для ПК | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 478 Мужчина 1440 Неизвестно 0 | Контакты | ||
немецкий_IVR_8 | Немецкий | Немецкий | де-де | 8 кГц | IVR | 200 | IVR-данные Германии | Человек к машине. Тип потока IVR, в котором есть подсказка TTS (например, «Чем я могу вам помочь»), за которой следует спонтанный ответ человека. | Моно | Для ПК | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 10115 Мужчина 8750 Неизвестно 0 | Контакты | ||
Гуджарати_CC_8 | гуджарати | Гуджарати (в разработке) | gu_IN | Call-центр | 60 | Гуджарати (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Гуджарати_GC | гуджарати | Гуджарати (в разработке) | gu_IN | Общий разговор | 100 | Гуджарати (в конвейере) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Гуджарати_MA | гуджарати | Гуджарати (в разработке) | gu_IN | Медиа Аудио | 40 | Аудиоданные мультимедиа гуджарати (в конвейере) | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Иврит_Общий разговор_8 | древнееврейский | древнееврейский | он_ИЛ | 8 кГц | Общий разговор | 399 | Данные общего разговора на иврите | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, иврит в Израиле | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 414 , Мужчина 399 , Неизвестно 1 | Контакты | |
Иврит_MA_16 | древнееврейский | древнееврейский | он_ИЛ | 16 кГц | Медиа Аудио | 427 | Аудиоданные на иврите Media | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 361, Мужчина 513, Неизвестно 13 | Контакты | |
Хинди_MA_16 | Хинди | Хинди | привет_IN | 16 кГц | Медиа Аудио | 219 | Аудиоданные хинди-медиа | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 83, Мужчина 309, Неизвестно 0 | Контакты | |
Хинди_SM_48 | Хинди | Хинди | привет-IN | 48 кГц | Монолог по сценарию | 2,867 | Монолог по сценарию на хинди | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1977 Мужчина 1864 Неизвестно 147 | Контакты | |
HINGLISH_CC_8 | хинглиш | хинглиш | hg_IN | 8 кГц | Call-центр | 208 | HINGLISH Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 822, Мужчина 1262, Неизвестно 0 | Контакты | |
HINGLISH_MA_16 | хинглиш | хинглиш | hg_IN | 16 кГц | Медиа Аудио | 216 | HINGLISH Мультимедийные аудиоданные | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 75, Мужчина 380, Неизвестно 0 | Контакты | |
Латиноамериканец_CC_8 | Латиноамериканский английский | Латиноамериканский английский | en_US | 8 кГц | Call-центр | 212 | Данные колл-центра для латиноамериканцев | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 822, Мужчина 1262, Неизвестно 0 | Контакты | |
Латиноамериканец_MA_16 | Латиноамериканский английский | Латиноамериканский английский | en_US | 16 кГц | Медиа Аудио | 155 | Аудио для латиноамериканского звонка | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 140, Мужчина 219, Неизвестно 5 | Контакты | |
Индонезийский_GC_8 | Indonesian | Indonesian | я сделал | 8 кГц | Общий разговор | 496 | Данные индонезийского общего разговора | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, индонезийский индонезийский | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 524, Мужчина 454, Неизвестно 2 | Контакты | |
Индонезийский_MA_16 | Indonesian | Indonesian | я сделал | 16 кГц | Медиа Аудио | 643 | Аудиоданные индонезийских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 746, Мужчина 1507, Неизвестно 129 | Контакты | |
Ирландский_GC_8 | ирландский | ирландский | en_IE | 8 кГц | Общий разговор | 192 | Данные ирландского общего разговора | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 213 , Мужчина 153 , Неизвестно 0 | Контакты | |
Японский_SM_48 | Японский | Японский | JA-JP | 48 кГц | Монолог по сценарию | 2,335 | Монолог по японскому сценарию | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1460 Мужчина 1221 Неизвестно 194 | Контакты | |
каннада_CC_8 | каннады | Каннада (в разработке) | kn_IN | Call-центр | 60 | Каннада (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Каннада_GC | каннады | Каннада (в разработке) | kn_IN | Общий разговор | 100 | Каннада (в конвейере) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Каннада_MA | каннады | Каннада (в разработке) | kn_IN | Медиа Аудио | 40 | Каннада (в конвейере) Медиа-аудиоданные | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Корейский_CC_8 | Korean | Korean | ko_KR | 8 кГц | Call-центр | 107 | Данные корейского колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1086, Мужчина 210, Неизвестно 4 | Контакты | |
Корейский_MA_16 | Korean | Korean | ko_KR | 16 кГц | Медиа Аудио | 204 | Звуковые данные корейских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 70 Мужчина 303, Неизвестно 25 | Контакты | |
Корейский_SM_48 | Korean | Korean | ко-KR | 48 кГц | Монолог по сценарию | 1,955 | Монолог по корейскому сценарию | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1195 Мужчина 1134 Неизвестно 122 | Контакты | |
Малайский_GC_8 | Malay | Malay | мс_МГ | 8 кГц | Общий разговор | 266 | Данные малайского общего разговора | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, малайский в Малайзии. | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 316, Мужчина 176, Неизвестно 0 | Контакты | |
Малайский_MA_16 | Malay | Malay | мс_МГ | 16 кГц | Медиа Аудио | 344 | Аудиоданные малайских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 236, Мужчина 626, Неизвестно 47 | Контакты | |
малаялам_CC_8 | Малайялам | Малаялам (в разработке) | мл_IN | Call-центр | 60 | Малаялам (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Малаялам_GC | Малайялам | Малаялам (в разработке) | мл_IN | Общий разговор | 100 | Малаялам (в конвейере) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Малаялам_MA | Малайялам | Малаялам (в разработке) | мл_IN | Медиа Аудио | 40 | Малаялам (In Pipeline) Медиа-аудиоданные | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
маратхи_CC_8 | маратхи | Маратхи (в разработке) | г-н_IN | Call-центр | 60 | Данные колл-центра на языке маратхи (в разработке) | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
маратхи_GC | маратхи | Маратхи (в разработке) | г-н_IN | Общий разговор | 100 | Маратхи (в конвейере) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Маратхи_MA | маратхи | Маратхи (в разработке) | г-н_IN | Медиа Аудио | 40 | Аудиоданные мультимедиа маратхи (в конвейере) | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Мексиканский_SM_48 | Испанский (Мексика) | Испанский (Мексика) | эс-MX | 48 кГц | Монолог по сценарию | 1,492 | Мексиканский монолог по испанскому сценарию | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1016 Мужчина 1069 Неизвестно 95 | Контакты | |
Нидерланды_SM_48 | Dutch | Dutch | NL-NL | 48 кГц | Монолог по сценарию | 1,205 | Монолог по голландскому сценарию | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1285 Мужчина 531 Неизвестно 3 | Контакты | |
Нью-Йорк английский_CC_8 | Нью-йоркский английский | Нью-йоркский английский | en_US | 8 кГц | Call-центр | 103 | Данные колл-центра New York English | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 610, Мужчина 532, Неизвестно 0 | Контакты | |
Нью-Йорк English_GC_8 | Нью-йоркский английский | Нью-йоркский английский | en_US | 8 кГц | Общий разговор | 107 | Данные общего разговорного английского в Нью-Йорке | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 118, Мужчина 114, Неизвестно 0 | Контакты | |
Нью-Йорк английский_MA_16 | Нью-йоркский английский | Нью-йоркский английский | en_US | 16 кГц | Медиа Аудио | 140 | Аудиоданные New York English Media | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 66, Мужчина 230, Неизвестно 11 | Контакты | |
Новая Зеландия_GC_8 | Новозеландский английский | Новозеландский английский | en_NZ | 8 кГц | Общий разговор | 148 | Данные новозеландского английского для общего разговора | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 167, мужчина 121, Неизвестно 4 | Контакты | |
Новая Зеландия_MA_16 | Новозеландский английский | Новозеландский английский | en_NZ | 16 кГц | Медиа Аудио | 400 | Новозеландский английский СМИ аудио | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 367, мужчина 678, Неизвестно 26 | Контакты | |
Ория_CC_8 | Ория | Ория (в разработке) | or_IN | Call-центр | 60 | Oriya (In Pipeline) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Ория_GC | Ория | Ория (в разработке) | or_IN | Общий разговор | 100 | Oriya (In Pipeline) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Ория_МА | Ория | Ория (в разработке) | or_IN | Медиа Аудио | 40 | Аудиоданные мультимедиа Oriya (In Pipeline) | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Польский_MA_16 | Польский | Польский | pl_PL | 16 кГц | Медиа Аудио | 269 | Польские СМИ аудио | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 173 Мужчина 354 Неизвестно 6 | Контакты | |
Польский Poland_SM_48 | Польский (польша) | Польский (польша) | PL-PL | 48 кГц | Монолог по сценарию | 1,482 | Польская Польша - Монолог по сценарию | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1324 Мужчина 701 Неизвестно 24 | Контакты | |
Панджаби_CC_8 | панджаби | Пенджаби (в разработке) | панджаби | Call-центр | 60 | Панджаби (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
панджаби_GC | панджаби | Пенджаби (в разработке) | панджаби | Общий разговор | 100 | Панджаби (в разработке) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Пенджаби_MA | панджаби | Пенджаби (в разработке) | панджаби | Медиа Аудио | 40 | Пенджаби (в конвейере) Медиа-аудиоданные | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Русский_SM_48 | Русский | Русский | RU-RU | 48 кГц | Монолог по сценарию | 2,398 | Монолог по русскому сценарию | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1689 Мужчина 1937 Неизвестно 214 | Контакты | |
шотландский_GC_8 | Шотландский (английский акцент) | Шотландский (английский акцент) | en_AB | 8 кГц | Общий разговор | 292 | Данные шотландского общего разговора | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 285, Мужчина 260, Неизвестно 3 | Контакты | |
Сингапур_CC_8 | Сингапурский английский | Сингапурский английский | en_SG | 8 кГц | Call-центр | 218 | Данные колл-центра Сингапура | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 2139, Мужчина 884, Неизвестно 21 | Контакты | |
Сингапур_MA_16 | Сингапурский английский | Сингапурский английский | en_SG | 16 кГц | Медиа Аудио | 247 | Аудиоданные Сингапурских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 160, Мужчина 455, Неизвестно 37 | Контакты | |
Южноафриканский английский_CC_8 | Южноафриканский английский | Южноафриканский английский | en_ZA | 8 кГц | Call-центр | 261 | Данные южноафриканского английского колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1274 , Мужчина 935 , Неизвестно 1 | Контакты | |
Южноафриканский английский_MA_16 | Южноафриканский английский | Южноафриканский английский | en_ZA | 16 кГц | Медиа Аудио | 251 | Звуковые данные южноафриканских английских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 235, Мужчина 432, Неизвестно 36 | Контакты | |
Суахили_CC_8 | суахили | суахили | sw_KE | 8 кГц | Call-центр | 230 | Данные колл-центра на суахили | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 611, Мужчина 833, Неизвестно 0 | Контакты | |
Суахили_MA_16 | суахили | суахили | sw_KE | 16 кГц | Медиа Аудио | 265 | Аудиоданные СМИ суахили | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 118, Мужчина 493, Неизвестно 25 | Контакты | |
Шведский_CC_8 | Swedish | Swedish | sv_SE | 8 кГц | Call-центр | 250 | Данные шведского колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1581, мужчина 727, Неизвестно 2 | Контакты | |
Шведский_MA_16 | Swedish | Swedish | sv_SE | 16 кГц | Медиа Аудио | 278 | Аудиоданные шведских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 195, мужчина 500, Неизвестно 21 | Контакты | |
Тамильский_CC_8 | тамильский | Тамильский (в разработке) | ta_IN | Call-центр | 60 | Тамильский (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Тамильский_GC | тамильский | Тамильский (в разработке) | ta_IN | Общий разговор | 100 | Тамильский (в разработке) Общие данные разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Тамил_MA | тамильский | Тамильский (в разработке) | ta_IN | Медиа Аудио | 40 | Аудиоданные мультимедиа на тамильском языке (в разработке) | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Телугу_GC_8 | телугу | телугу | te_IN | 8 кГц | Общий разговор | 553 | Общие разговорные данные на телугу | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 574, Мужчина 564, Неизвестно 0 | Контакты | |
Телугу_MA_16 | телугу | телугу | te_IN | 16 кГц | Медиа Аудио | 648 | Аудиоданные телугу Media | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 207, Мужчина 963, Неизвестно 2 | Контакты | |
Телугу_CC_8 | телугу | Телугу (в разработке) | te_IN | Call-центр | 30 | Телугу (в разработке) Данные колл-центра | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Телугу_GC | телугу | Телугу (в разработке) | te_IN | Общий разговор | 50 | Телугу (в конвейере) Общие данные беседы | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Телугу_MA | телугу | Телугу (в разработке) | te_IN | Медиа Аудио | 20 | Телугу (в конвейере) Медиа-аудиоданные | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Контакты | ||||
Тайский_GC_8 | Thai | Thai | th_TH | 8 кГц | Общий разговор | 183 | Тайский общий разговор | Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, неформальная регистрация, используемая между друзьями. | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 338, Мужчина 96, Неизвестно 8 | Контакты | |
Тайский_MA_8 | Thai | Thai | th_TH | 16 кГц | Медиа Аудио | 173 | Тайские СМИ аудио | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 143, Мужчина 502, Неизвестно 26 | Контакты | |
Турецкая Турция_SM_48 | Турецкая Турция | Турецкая Турция | TR-TR | 48 кГц | Монолог по сценарию | 2,027 | Турецкая Турция | Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд. | Моно | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 1561 Мужчина 1241 Неизвестно 31 | Контакты | |
Вьетнамский_GC_8 | вьетнамский | вьетнамский | vi_VN | 8 кГц | Общий разговор | 295 | Данные вьетнамского общего разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, северный (например, Ханой), центральный и южный (например, Хошимин). | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщины 400, мужчины 380, Неизвестные 2 | Контакты | |
Вьетнамский_MA_16 | вьетнамский | вьетнамский | vi_VN | 16 кГц | Медиа Аудио | 257 | Аудиоданные вьетнамских СМИ | Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минут | Моно | Веб-поиск | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщины 249, мужчины 200, Неизвестные 45 | Контакты | |
Уэльский_GC_8 | Валлийский (английский акцент) | Валлийский (английский акцент) | en_WL | 8 кГц | Общий разговор | 278 | Данные валлийского общего разговора | Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, | Двойной | Для ПК | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Женщина 270, Мужчина 324, Неизвестно 0 | Контакты | |
Великобритания английский_WW_16 | Великобритания Английский | Великобритания Английский | en_uk | 16 кГц | Wake Word | 200 Выступающие | Wake Word (Великобритания) английский | сбор данных по ключевым фразам
| 1 канал | Мобильное приложение | 5.0 | . Wav | .json | ASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование | Пол: 50% мужчин, 50% женщин, +/- 10%. | Контакты |
Предлагаемые услуги
Экспертный сбор аудиоданных - это не все, что нужно для комплексных настроек ИИ. В Shaip вы даже можете рассмотреть следующие услуги, чтобы сделать модели более распространенными, чем обычно:
Сбор текстовых данных
Услуги
Истинная ценность сервисов сбора когнитивных данных Shaip заключается в том, что они дают организациям ключ к разблокированию важной информации, содержащейся в неструктурированных данных.
Услуги по сбору данных об изображениях
Убедитесь, что ваша модель компьютерного зрения точно идентифицирует каждое изображение, чтобы беспрепятственно обучать модели искусственного интеллекта следующего поколения будущего.
Услуги по сбору видеоданных
Теперь сосредоточьтесь на компьютерном зрении вместе с НЛП, чтобы научить свои модели в совершенстве определять объекты, людей, сдерживающие факторы и другие визуальные элементы.
Рекомендуемые ресурсы
Предлагающий
Аудиоаннотации для интеллектуальных ИИ
Службы аудиоаннотации были сильной стороной Shaip с самого начала. Разрабатывайте, обучайте и улучшайте диалоговый ИИ, чат-боты и механизмы распознавания речи с помощью наших современных сервисов аудиоаннотации.
Руководство для покупателя
Руководство покупателя: полное руководство по диалоговому ИИ
Чат-бот, с которым вы разговаривали, работает на продвинутой системе искусственного интеллекта, которая обучена, протестирована и построена с использованием множества наборов данных для распознавания речи.
Каталог данных
Готовый каталог речевых данных и лицензирование
Существует множество распространенных приложений для речевых данных в проектах ИИ. Мы предлагаем вам огромное количество высококачественных данных, готовых для распознавания вашего голоса.
Хотите создать свой собственный набор аудиоданных?
Свяжитесь с нашим штатным экспертом по сбору речевых данных, чтобы настроить репозиторий аудио, который наилучшим образом соответствует вашим требованиям.