Высококачественные аудио / речевые / голосовые наборы данных для обучения вашей модели разговорного ИИ 

Готовые наборы голосовых/речевых/аудиоданных на нескольких языках для запуска моделей автоматического распознавания речи (ASR)

Речевые наборы данных

Подключите каталог аудиоданных, которого вам сегодня не хватало

ПодробностиЯзыковой набор данныхЧастота дискретизацииТип набора данныхВсего часов аудиоОписаниеОписание набора данныхАудиоканалаПлатформа записиВер (%)Аудио форматыФормат транскрипцииКейсыКоличество динамиковCTA
речьen_US_CC_8Афроамериканский диалектАфроамериканский диалектen_US8 кГцКолл-центр211Данные колл-центра для афроамериканцевСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 612, Мужчин: 1242, Неизвестно: 12
речьen_US_MA_16Афроамериканский диалектАфроамериканский диалектen_US16 кГцМедиа Аудио154Данные афроамериканских народных СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 151, Мужчин: 150, Неизвестно: 10
речьАфрикаанс_GC_8АфрикаансАфрикаансaf_ZA8 кГцОбщий разговор368Данные общего разговора на африкаансНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, африкаанс, на котором говорят в Африке.ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 502, Мужчин: 390, Неизвестно: 2
речьАфрикаанс_MA_16АфрикаансАфрикаансaf_ZA16 кГцМедиа Аудио658Медиафайлы на африкаансЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 750, Мужчин: 1278, Неизвестно: 52
речьарабский_GC_8арабском арабском ar_AE8 кГцОбщий разговор292Данные для общего разговора на арабском языкеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, арабский язык из стран Персидского заливаДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 171, Мужчин: 534, Неизвестно: 1
речьАрабский_SM_48арабском арабском ар-SA48 кГцМонолог по сценарию1,947Монолог на арабском языкеЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 838 Мужчина 1209 Неизвестно 78
речьАссамский язык_CC_8АссамскийАссамский (в разработке) как вCall-центр60Ассамский (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАссамский_GCАссамскийАссамский (в разработке) как вОбщий разговор100Ассамский (в разработке) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьАссамский_MAАссамскийАссамский (в разработке) как вМедиа Аудио40Аудиоданные мультимедиа на ассамском языке (в разработке)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский_CC_8БенгальскийБенгальский (в разработке) bn_INCall-центр60Бенгальский (в разработке) данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский_GCБенгальскийБенгальский (в разработке) bn_INОбщий разговор100Бенгальский (In Pipeline) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБенгальский_MAБенгальскийБенгальский (в разработке) bn_INМедиа Аудио40Бенгальский (In Pipeline) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьБостон_CC_8Бостонский английскийБостонский английскийen_US8 кГцCall-центр177Данные колл-центра БостонаСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 605, Мужчин: 711, Неизвестно: 0
речьБостон_GC_8Бостонский английскийБостонский английскийen_US8 кГцОбщий разговор32Данные общего разговора в БостонеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 53, Мужчин: 83, Неизвестно: 0
речьБостон_MA_16Бостонский английскийБостонский английскийen_US16 кГцМедиа Аудио93Аудиоданные Boston MediaЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 43, Мужчин: 181, Неизвестно: 2
речьКанадский_SM_48Канадский французскийКанадский французскийFR-CA48 кГцМонолог по сценарию1,222Канадский французскийЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 974 Мужчина 631 Неизвестно 1
речьКитайский_CC_8Китайский английскийКитайский английскийen_US8 кГцCall-центр169Данные китайского колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 1790, Мужчин: 523 и Неизвестно: 13
речьКитайский_MA_16Китайский английскийКитайский английскийen_US16 кГцМедиа Аудио249Аудиоданные китайских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 126, Мужчин: 346 и Неизвестно: 6
речьКитайский упрощенный_SM_48Китайский упрощенныйКитайский упрощенныйZH-CN48 кГцМонолог по сценарию2,762Китайский упрощенныйЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1920 Мужчина 1535 Неизвестно 270
речьКитайский традиционный_SM_48Традиционный китайскийТрадиционный китайскийzh-TW48 кГцМонолог по сценарию1,028Традиционный китайскийЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1069 Мужчина 262 Неизвестно 3
речьдатский_GC_8датский языкдатский языкda_DK8 кГцОбщий разговор372Датские общие разговорные данныеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 311, Мужчин: 417, Неизвестно: 0
речьдатский_MA_16датский языкдатский языкda_DK16 кГцМедиа Аудио664Аудиоданные датских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщин: 369, Мужчин: 864, Неизвестно: 27
речьДатский_SM_48датский языкдатский языкда-DK48 кГцМонолог по сценарию2,579Монолог на датском языкеЗаписи с одним высказыванием, длительностью от 5 до 30 секунд, датский из Дании.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1551 Мужчина 1233 Неизвестно 42
речьАнглийский Deep South_CC_8Английский Deep SouthАнглийский Deep Southen_US8 кГцCall-центр151English Данные колл-центра Deep SouthСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 221, Мужчина 1004, Неизвестно 7
речьАнглийский Deep South_GC_8Английский Deep SouthАнглийский Deep Southen_US8 кГцОбщий разговор56Данные английского Deep South General ConversationНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 99, Мужчина 31, Неизвестно 0
речьАнглийский Deep South_MA_16Английский Deep SouthАнглийский Deep Southen_US16 кГцМедиа Аудио266Аудиоданные Deep South Media на английском языкеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 204, Мужчина 356, Неизвестно 21
речьнемецкий_CC_8НемецкийНемецкийде-де8 кГцCall-центр64Данные немецкого колл-центра Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,МоноДля ПК. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 478 Мужчина 1440 Неизвестно 0
речьнемецкий_IVR_8НемецкийНемецкийде-де8 кГц IVR200IVR-данные ГерманииЧеловек к машине. Тип потока IVR, в котором есть подсказка TTS (например, «Чем я могу вам помочь»), за которой следует спонтанный ответ человека.МоноДля ПК. Wav .jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование Женщина 10115 Мужчина 8750 Неизвестно 0
речьГуджарати_CC_8гуджаратиГуджарати (в разработке) gu_INCall-центр60Гуджарати (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьГуджарати_GCгуджаратиГуджарати (в разработке) gu_INОбщий разговор100Гуджарати (в конвейере) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьГуджарати_MAгуджаратиГуджарати (в разработке) gu_INМедиа Аудио40Аудиоданные мультимедиа гуджарати (в конвейере)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьИврит_Общий разговор_8древнееврейскийдревнееврейскийон_ИЛ8 кГцОбщий разговор399Данные общего разговора на ивритеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, иврит в ИзраилеДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 414 , Мужчина 399 , Неизвестно 1
речьИврит_MA_16древнееврейскийдревнееврейскийон_ИЛ16 кГцМедиа Аудио427Аудиоданные на иврите MediaЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 361, Мужчина 513, Неизвестно 13
речьХинди_MA_16ХиндиХиндипривет_IN16 кГцМедиа Аудио219Аудиоданные хинди-медиаЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 83, Мужчина 309, Неизвестно 0
речьХинди_SM_48ХиндиХиндипривет-IN48 кГцМонолог по сценарию2,867Монолог по сценарию на хиндиЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1977 Мужчина 1864 Неизвестно 147
речьHINGLISH_CC_8хинглишхинглишhg_IN8 кГцCall-центр208HINGLISH Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 822, Мужчина 1262, Неизвестно 0
речьHINGLISH_MA_16хинглишхинглишhg_IN16 кГцМедиа Аудио216HINGLISH Мультимедийные аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 75, Мужчина 380, Неизвестно 0
речьЛатиноамериканец_CC_8Латиноамериканский английскийЛатиноамериканский английскийen_US8 кГцCall-центр212Данные колл-центра для латиноамериканцевСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 822, Мужчина 1262, Неизвестно 0
речьЛатиноамериканец_MA_16Латиноамериканский английскийЛатиноамериканский английскийen_US16 кГцМедиа Аудио155Аудио для латиноамериканского звонкаЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 140, Мужчина 219, Неизвестно 5
речьИндонезийский_GC_8IndonesianIndonesianя сделал8 кГцОбщий разговор496Данные индонезийского общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, индонезийский индонезийскийДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 524, Мужчина 454, Неизвестно 2
речьИндонезийский_MA_16IndonesianIndonesianя сделал16 кГцМедиа Аудио643Аудиоданные индонезийских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 746, Мужчина 1507, Неизвестно 129
речьИрландский_GC_8ирландскийирландскийen_IE8 кГцОбщий разговор192Данные ирландского общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 213 , Мужчина 153 , Неизвестно 0
речьЯпонский_SM_48ЯпонскийЯпонскийJA-JP48 кГцМонолог по сценарию2,335Монолог по японскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1460 Мужчина 1221 Неизвестно 194
речьканнада_CC_8каннадыКаннада (в разработке) kn_INCall-центр60Каннада (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКаннада_GCканнадыКаннада (в разработке) kn_INОбщий разговор100Каннада (в конвейере) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКаннада_MAканнадыКаннада (в разработке) kn_INМедиа Аудио40Каннада (в конвейере) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьКорейский_CC_8KoreanKoreanko_KR8 кГцCall-центр107Данные корейского колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1086, Мужчина 210, Неизвестно 4
речьКорейский_MA_16KoreanKoreanko_KR16 кГцМедиа Аудио204Звуковые данные корейских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 70 Мужчина 303, Неизвестно 25
речьКорейский_SM_48KoreanKoreanко-KR48 кГцМонолог по сценарию1,955Монолог по корейскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1195 Мужчина 1134 Неизвестно 122
речьМалайский_GC_8MalayMalayмс_МГ8 кГцОбщий разговор266Данные малайского общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, малайский в Малайзии.ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 316, Мужчина 176, Неизвестно 0
речьМалайский_MA_16MalayMalayмс_МГ16 кГцМедиа Аудио344Аудиоданные малайских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 236, Мужчина 626, Неизвестно 47
речьмалаялам_CC_8МалайяламМалаялам (в разработке) мл_INCall-центр60Малаялам (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМалаялам_GCМалайяламМалаялам (в разработке) мл_INОбщий разговор100Малаялам (в конвейере) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМалаялам_MAМалайяламМалаялам (в разработке) мл_INМедиа Аудио40Малаялам (In Pipeline) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьмаратхи_CC_8маратхиМаратхи (в разработке) г-н_INCall-центр60Данные колл-центра на языке маратхи (в разработке)Синтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьмаратхи_GCмаратхиМаратхи (в разработке) г-н_INОбщий разговор100Маратхи (в конвейере) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМаратхи_MAмаратхиМаратхи (в разработке) г-н_INМедиа Аудио40Аудиоданные мультимедиа маратхи (в конвейере)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьМексиканский_SM_48Испанский (Мексика)Испанский (Мексика)эс-MX48 кГцМонолог по сценарию1,492Мексиканский монолог по испанскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1016 Мужчина 1069 Неизвестно 95
речьНидерланды_SM_48DutchDutchNL-NL48 кГцМонолог по сценарию1,205Монолог по голландскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1285 Мужчина 531 Неизвестно 3
речьНью-Йорк английский_CC_8Нью-йоркский английскийНью-йоркский английскийen_US8 кГцCall-центр103Данные колл-центра New York EnglishСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 610, Мужчина 532, Неизвестно 0
речьНью-Йорк English_GC_8Нью-йоркский английскийНью-йоркский английскийen_US8 кГцОбщий разговор107Данные общего разговорного английского в Нью-ЙоркеНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 118, Мужчина 114, Неизвестно 0
речьНью-Йорк английский_MA_16Нью-йоркский английскийНью-йоркский английскийen_US16 кГцМедиа Аудио140Аудиоданные New York English MediaЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 66, Мужчина 230, Неизвестно 11
речьНовая Зеландия_GC_8Новозеландский английский Новозеландский английский en_NZ8 кГцОбщий разговор148Данные новозеландского английского для общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 167, мужчина 121, Неизвестно 4
речьНовая Зеландия_MA_16Новозеландский английский Новозеландский английский en_NZ16 кГцМедиа Аудио400Новозеландский английский СМИ аудиоЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 367, мужчина 678, Неизвестно 26
речьОрия_CC_8ОрияОрия (в разработке) or_INCall-центр60Oriya (In Pipeline) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьОрия_GCОрияОрия (в разработке) or_INОбщий разговор100Oriya (In Pipeline) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьОрия_МАОрияОрия (в разработке) or_INМедиа Аудио40Аудиоданные мультимедиа Oriya (In Pipeline)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьПольский_MA_16ПольскийПольскийpl_PL16 кГцМедиа Аудио269Польские СМИ аудиоЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 173 Мужчина 354 Неизвестно 6
речьПольский Poland_SM_48Польский (польша)Польский (польша)PL-PL48 кГцМонолог по сценарию1,482Польская Польша - Монолог по сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1324 Мужчина 701 Неизвестно 24
речьПанджаби_CC_8панджабиПенджаби (в разработке) панджабиCall-центр60Панджаби (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьпанджаби_GCпанджабиПенджаби (в разработке) панджабиОбщий разговор100Панджаби (в разработке) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьПенджаби_MAпанджабиПенджаби (в разработке) панджаби Медиа Аудио40Пенджаби (в конвейере) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьРусский_SM_48РусскийРусскийRU-RU48 кГцМонолог по сценарию2,398Монолог по русскому сценариюЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1689 Мужчина 1937 Неизвестно 214
речьшотландский_GC_8Шотландский (английский акцент)Шотландский (английский акцент)en_AB8 кГцОбщий разговор292Данные шотландского общего разговораНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 285, Мужчина 260, Неизвестно 3
речьСингапур_CC_8Сингапурский английскийСингапурский английскийen_SG8 кГцCall-центр218Данные колл-центра СингапураСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 2139, Мужчина 884, Неизвестно 21
речьСингапур_MA_16Сингапурский английскийСингапурский английскийen_SG16 кГцМедиа Аудио247Аудиоданные Сингапурских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 160, Мужчина 455, Неизвестно 37
речьЮжноафриканский английский_CC_8Южноафриканский английскийЮжноафриканский английскийen_ZA8 кГцCall-центр261Данные южноафриканского английского колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1274 , Мужчина 935 , Неизвестно 1
речьЮжноафриканский английский_MA_16Южноафриканский английскийЮжноафриканский английскийen_ZA16 кГцМедиа Аудио251Звуковые данные южноафриканских английских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 235, Мужчина 432, Неизвестно 36
речьСуахили_CC_8суахилисуахилиsw_KE8 кГцCall-центр230Данные колл-центра на суахилиСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 611, Мужчина 833, Неизвестно 0
речьСуахили_MA_16суахилисуахилиsw_KE16 кГцМедиа Аудио265Аудиоданные СМИ суахилиЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 118, Мужчина 493, Неизвестно 25
речьШведский_CC_8SwedishSwedishsv_SE8 кГцCall-центр250Данные шведского колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1581, мужчина 727, Неизвестно 2
речьШведский_MA_16SwedishSwedishsv_SE16 кГцМедиа Аудио278Аудиоданные шведских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 195, мужчина 500, Неизвестно 21
речьТамильский_CC_8тамильскийТамильский (в разработке) ta_INCall-центр60Тамильский (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТамильский_GCтамильскийТамильский (в разработке) ta_INОбщий разговор100Тамильский (в разработке) Общие данные разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТамил_MAтамильский Тамильский (в разработке) ta_INМедиа Аудио40Аудиоданные мультимедиа на тамильском языке (в разработке)Лицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТелугу_GC_8телугутелугуte_IN8 кГцОбщий разговор553Общие разговорные данные на телугуНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) - 15-60 минут, ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 574, Мужчина 564, Неизвестно 0
речьТелугу_MA_16телугутелугуte_IN16 кГцМедиа Аудио648Аудиоданные телугу MediaЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 207, Мужчина 963, Неизвестно 2
речьТелугу_CC_8телугуТелугу (в разработке) te_INCall-центр30Телугу (в разработке) Данные колл-центраСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТелугу_GCтелугуТелугу (в разработке) te_INОбщий разговор50Телугу (в конвейере) Общие данные беседыСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,Для ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТелугу_MAтелугуТелугу (в разработке) te_INМедиа Аудио20Телугу (в конвейере) Медиа-аудиоданныеЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделирование
речьТайский_GC_8ThaiThaith_TH8 кГцОбщий разговор183Тайский общий разговорНезаписанный телефонный разговор между двумя людьми. прибл. Продолжительность аудио (диапазон) — 15–60 минут, неформальная регистрация, используемая между друзьями.ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 338, Мужчина 96, Неизвестно 8
речьТайский_MA_8ThaiThaith_TH16 кГцМедиа Аудио173Тайские СМИ аудиоЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 143, Мужчина 502, Неизвестно 26
речьТурецкая Турция_SM_48Турецкая ТурцияТурецкая ТурцияTR-TR48 кГцМонолог по сценарию2,027Турецкая ТурцияЗаписи одного высказывания, которые, как правило, попадают в диапазон от 5 до 30 секунд.МоноМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 1561 Мужчина 1241 Неизвестно 31
речьВьетнамский_GC_8вьетнамскийвьетнамскийvi_VN8 кГцОбщий разговор295Данные вьетнамского общего разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут, северный (например, Ханой), центральный и южный (например, Хошимин).ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщины 400, мужчины 380, Неизвестные 2
речьВьетнамский_MA_16вьетнамскийвьетнамскийvi_VN16 кГцМедиа Аудио257Аудиоданные вьетнамских СМИЛицензируемые общедоступные аудио/видеофайлы, такие как интервью, подкасты и т. д. — от 1 до 5 человек. прибл. Продолжительность аудио (диапазон) 15-60 минутМоноВеб-поиск5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщины 249, мужчины 200, Неизвестные 45
речьУэльский_GC_8Валлийский (английский акцент)Валлийский (английский акцент)en_WL8 кГцОбщий разговор278Данные валлийского общего разговораСинтетический телефонный разговор без сценария между «агентом» и «клиентом», прибл. Продолжительность звука (диапазон) 5-15 минут,ДвойнойДля ПК5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеЖенщина 270, Мужчина 324, Неизвестно 0
речьВеликобритания английский_WW_16Великобритания АнглийскийВеликобритания Английскийen_uk16 кГцWake Word200 ВыступающиеWake Word (Великобритания) английскийсбор данных по ключевым фразам
  • 200 колонки
  • 4 уникальные ключевые фразы на каждого говорящего
  • 25-30 повторяющихся записей ключевых фраз на одну уникальную ключевую фразу
  • 25-30 аудиофайлов на уникальную ключевую фразу
  • Всего 120 записанных высказываний на говорящего
1 каналМобильное приложение5.0. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеПол: 50% мужчин, 50% женщин, +/- 10%.

Аудио и речевые данные Ground Truth для ускорения разработки разговорного ИИ

Имея более 40 XNUMX часов аудио-/голосовых наборов данных, Shaip может помочь вам масштабировать ваши модели разговорного ИИ с помощью высококачественных наборов речевых данных. Золотые стандартные наборы голосовых данных собираются на нескольких языках и диалектах, демографических данных, характеристиках говорящих, типах диалогов, средах и сценариях. Если вы не можете найти то, что ищете? – Shaip может помочь вам с любым набором голосовых данных для любого пола, возраста, языка и настроек.

Мы поддерживаем несколько языковых наборов данных: У нас есть наборы данных по всем основным языкам и диалектам. Некоторые из наших самых популярных языков включают в себя:

Африканские голосовые наборы данных

Арабские наборы голосовых данных

Канадские голосовые наборы данных

Китайские голосовые наборы данных

Датские голосовые наборы данных

Английские голосовые наборы данных

Немецкие голосовые наборы данных

Наборы голосовых данных иврита

Индонезийские голосовые наборы данных

Наборы данных ирландского голоса

Японские голосовые наборы данных

Наборы корейских голосовых данных

Мексиканские голосовые наборы данных

Польские голосовые наборы данных

Русские голосовые наборы данных

Наборы данных шотландского голоса

Испанские голосовые наборы данных

Шведские голосовые наборы данных

Тайские голосовые наборы данных

Турецкие голосовые наборы данных

Вьетнамские голосовые наборы данных

Описание набора данных

Разговоры с колл-центром 8 кГц: Синтетический телефонный разговор без сценария: «агент» и «клиент».

Общие разговоры 8 кГц: Незаписанный телефонный разговор между двумя людьми

Медиа и подкасты 16 кГц: Общедоступные аудио/видео интервью, подкасты и т. д. 1–5 человек

Высказывание/монолог по сценарию 16 кГц: Запись на основе подсказки 

Свяжитесь с нами

Не можете найти то, что ищете?

Новые готовые аудио- и речевые наборы данных собираются для всех типов данных. 

Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных для обучения аудио/речи

  • Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.