Высококачественные аудио / речевые / голосовые наборы данных для обучения вашей модели разговорного ИИ 

Готовые наборы голосовых/речевых/аудиоданных на нескольких языках для запуска моделей автоматического распознавания речи (ASR)

Речевые наборы данных

Подключите каталог аудиоданных, которого вам сегодня не хватало

ПодробнееЯзыковой набор данныхЧастота дискретизацииТип набора данныхВсего часов аудиоВсего часов выступленияОписание набора данныхАудиоканалаПлатформа записиВер (%)Аудио форматыФормат транскрипцииКейсыCTA
речьАфро-американскойАфроамериканский диалект8 кГцCall-центр214211Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАфро-американскойАфроамериканский диалект16 кГцМедиа Аудио159149Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАфрикаансАфрикаанс8 кГцОбщий разговор368404Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, африкаанс, на котором говорят в Африке.Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАфрикаансАфрикаанс16 кГцМедиа Аудио658615Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьарабском арабском 8 кГцОбщий разговор293297Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, арабский язык из стран Персидского заливаДвойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБостонБостон8 кГцCall-центр177175Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБостонБостон8 кГцОбщий разговор3232Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБостонБостон16 кГцМедиа Аудио9393Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКитайский английскийКитайский английский8 кГцCall-центр169130Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКитайский английскийКитайский английский16 кГцМедиа Аудио249236Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьдатский языкдатский язык8 кГцОбщий разговор372395Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьдатский языкдатский язык16 кГцМедиа Аудио664603Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАнглийскийАнглийский16 кГцМедиа Аудио109Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАнглийский Deep SouthАнглийский Deep South8 кГцCall-центр151149Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАнглийский Deep SouthАнглийский Deep South8 кГцОбщий разговор5656Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАнглийский Deep SouthАнглийский Deep South16 кГцМедиа Аудио266248Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьдревнееврейскийдревнееврейский8 кГцОбщий разговор399397Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, иврит в ИзраилеДвойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьдревнееврейскийдревнееврейский16 кГцМедиа Аудио427400Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьхинглишхинглиш8 кГцCall-центр208185Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьхинглишхинглиш16 кГцМедиа Аудио216219Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьЛатиноамериканский английскийЛатиноамериканский английский8 кГцCall-центр212209Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьЛатиноамериканский английскийЛатиноамериканский английский16 кГцМедиа Аудио155150Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьИндийский английскийИндийский английский16 кГцМедиа Аудио13787Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьIndonesianIndonesian8 кГцОбщий разговор496598Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, индонезийский индонезийскийДвойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьIndonesianIndonesian16 кГцМедиа Аудио643610Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьирландскийирландский8 кГцОбщий разговор192180Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьKoreanKorean8 кГцCall-центр107103Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьKoreanKorean16 кГцМедиа Аудио204197Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьMalayMalay8 кГцОбщий разговор266302Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, малайский в Малайзии.Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьMalayMalay16 кГцМедиа Аудио344305Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНовозеландский английский Новозеландский английский 8 кГцОбщий разговор148142Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНовозеландский английский Новозеландский английский 16 кГцМедиа Аудио400400Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНью-йоркский английскийНью-йоркский английский8 кГцCall-центр103103Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНью-йоркский английскийНью-йоркский английский8 кГцОбщий разговор107106Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНью-йоркский английскийНью-йоркский английский16 кГцМедиа Аудио140140Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьПольскийПольский16 кГцМедиа Аудио269255Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьШотландскийШотландский8 кГцОбщий разговор292267Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьСингапурский английскийСингапурский английский8 кГцCall-центр218194Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьСингапурский английскийСингапурский английский16 кГцМедиа Аудио247240Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьЮжноафриканский английскийЮжноафриканский английский8 кГцCall-центр261204Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьЮжноафриканский английскийЮжноафриканский английский16 кГцМедиа Аудио251245Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьИспанскийИспанский16 кГцМедиа Аудио32Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьсуахилисуахили8 кГцCall-центр184165Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьсуахилисуахили8 кГцCall-центр4644Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьсуахилисуахили16 кГцМедиа Аудио203191Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьсуахилисуахили16 кГцМедиа Аудио6258Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьSwedishSwedish8 кГцCall-центр250224Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьSwedishSwedish16 кГцМедиа Аудио278255Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтелугутелугу8 кГцОбщий разговор553582Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтелугутелугу16 кГцМедиа Аудио648599Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьThaiThai8 кГцОбщий разговор183201Незаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, неформальная регистрация, используемая между друзьями.Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьThaiThai16 кГцМедиа Аудио173167Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьвьетнамскийвьетнамский8 кГцОбщий разговор295293Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, северный (например, Ханой), центральный и южный (например, Хошимин).Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьвьетнамскийвьетнамский16 кГцМедиа Аудио257248Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьваллийскийваллийский8 кГцОбщий разговор278299Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьИндийский английскийИндийский английский8 кГцCall-центр200200Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Монорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтелугу телугу NACall-центр3030Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтамильский тамильский NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьканнады каннады NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМалайялам Малайялам NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский Бенгальский NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьгуджарати гуджарати NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьмаратхи маратхи NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАссамский Ассамский NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьОрия Ория NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьпанджаби панджаби NACall-центр6060Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтелугу телугу NAОбщий разговор5050Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтамильский тамильский NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьканнады каннады NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМалайялам Малайялам NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский Бенгальский NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьгуджарати гуджарати NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьмаратхи маратхи NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАссамский Ассамский NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьОрия Ория NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьпанджаби панджаби NAОбщий разговор100100Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,NAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтелугу телугу NAМедиа Аудио2020Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьтамильский тамильский NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьканнады каннады NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМалайялам Малайялам NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский Бенгальский NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьгуджарати гуджарати NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьмаратхи маратхи NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАссамский Ассамский NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьОрия Ория NAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьпанджабипанджабиNAМедиа Аудио4040Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутNAрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАнглийский СШААнглийский США48 кГцМонолог по сценарию54Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьИспанская ИспанияИспанская Испания48 кГцМонолог по сценарию108Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМексиканскийМексиканский48 кГцМонолог по сценарию1,4921,228Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьканадскомканадском48 кГцМонолог по сценарию1,2221,049Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНидерландыНидерланды48 кГцМонолог по сценарию1,2051,021Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьпольский Польшапольский Польша48 кГцМонолог по сценарию1,4821,266Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТурецкая ТурцияТурецкая Турция48 кГцМонолог по сценарию2,0271,735Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТрадиционный китайскийТрадиционный китайский48 кГцМонолог по сценарию1,028891Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьарабском арабском 48 кГцМонолог по сценарию1,9471,594Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьдатский языкдатский язык48 кГцМонолог по сценарию2,5792,041Записи с одним высказыванием, длительностью от 5 до 30 секунд, датский из Дании.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьХиндиХинди8 кГцКолл-центр122131Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьХиндиХинди16 кГцМедиа-аудио219202Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМонорабочий стол5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьХиндиХинди48 кГцМонолог по сценарию2,8672,105Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьЯпонскийЯпонский48 кГцМонолог по сценарию2,3352,029Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьKoreanKorean48 кГцМонолог по сценарию1,9551,548Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьРусскийРусский48 кГцМонолог по сценарию2,3982,046Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКитайский упрощенныйКитайский упрощенный48 кГцМонолог по сценарию2,7622,181Записи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьНемецкийНемецкий8 кГцCall-центр640Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Двойнойрабочий стол. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование

Описание

Разговоры с колл-центром 8 кГц: Синтетический телефонный разговор без сценария: «агент» и «клиент».

Общие разговоры 8 кГц: Незаписанный телефонный разговор между двумя людьми

Медиа и подкасты 16 кГц: Общедоступные аудио/видео интервью, подкасты и т. д. 1–5 человек

Высказывание/монолог по сценарию 16 кГц: Запись на основе подсказки 

Свяжитесь с нами

Не можете найти то, что ищете?

Новые готовые аудио- и речевые наборы данных собираются для всех типов данных. 

Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи

  • Регистрируясь, я соглашаюсь с Shaip Политика конфиденциальности и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.