Теперь получите 50% СКИДКА* на готовых наборах данных разговорного ИИ

Набор данных Speech & Audio для чат-ботов, голосовых помощников, устройств с поддержкой речи.

* Предложение на ограниченный период

  • Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.

Нам доверяют лидеры отрасли

ПодробнееГотовый набор языковых данныхРазговоры в колл-центре 8 кГц*Общие диалоги 8 кГц*Медиа и подкасты 16 кГц*Высказывание/монолог по сценарию 16 кГц*Общий объем в часахОхваченные диалектыАудио форматыФормат транскрипции текстаКейсыИсточникCTA
речьАфрикаансНабор аудиоданных для африкаанс6009001500Африкаанс, на котором говорят в Африке. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьарабском Арабский аудио набор данных80015002300Арабский из стран Персидского залива. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьКитайскиеКитайский аудио набор данных20002000китайцы из китая. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьДатскийДатский аудио набор данных40060020003000Датский из Дании. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьГолландскийГолландский набор аудиоданных20002000Голландец из Нидерландов. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьАнглийский – акцент AAVEАнглийский — набор аудиоданных AAVE (афроамериканский разговорный английский)5005001000Народный вариант (иногда известный как AAVE, на котором обычно говорит подавляющее большинство афроамериканцев из рабочего и среднего класса) и более стандартный вариант (на котором обычно говорят афроамериканцы из среднего класса в формальных и общественных ситуациях), но с более сильным акцентом на просторечии.. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьАнглийский – Бостонский/Нью-Йоркский акцентАнглийский — Бостон/Нью-Йорк, набор аудиоданных225225350800Это коллекция нескольких региональных акцентов, на которых говорят в городах Бостон, Нью-Йорк и Филадельфия и их окрестностях. Эти акценты могут звучать похоже на неместные, но отличаться от других американских акцентов. Несмотря на некоторую местную лексику, которая отличается от других частей англоязычного мира, эти акценты взаимно понятны с английским языком, на котором говорят в других местах.. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьАнглийский – китайский акцентНабор аудиоданных с английским и китайским акцентом150300450Носители, которые говорят на китайском как на своем родном языке и которые переехали/иммигрировали в Соединенные Штаты в подростковом/взрослом возрасте и выучили английский как второй язык.. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьАнглийский с глубоким южным акцентомАнглийский - Deep South Audio Dataset2752754501000Спикеры из (i) Техаса; (ii) Северная Каролина, Южная Каролина, Джорджия; (iii) Новый Орлеан; (iv) Флорида попрошайничать; (v) Теннесси, Арканзас, Мичиган.. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьАнглийский – латиноамериканский акцентАнглийский – набор аудиоданных с латиноамериканским акцентом400400800Латиноамериканский английский относится к разновидностям американского английского, на котором говорят латиноамериканцы с разнообразным национальным наследием. Основное внимание уделялось американцам мексиканского происхождения, представителям разных национальностей (например, Мексики, Пуэрто-Рико, Доминиканской Республики, Эквадора, Кубы и т. д.), а также из разных регионов (например, Калифорнии, Нью-Йорка, Флориды). Среди спикеров были те, кто говорит на испанском как на родном языке, а также носители латиноамериканского происхождения, которые говорят, что испанский язык имеет наследие.. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьАнглийский - новозеландский акцентАнглийский – набор аудиоданных Новой Зеландии2507501000Говорящие на обоих островах, в том числе молодые носители (младше 40 лет) и пожилые носители (старше 40 лет) в равных пропорциях.. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьАнглийский – сингапурский акцентАнглийский — Сингапурский набор аудиоданных4006001000И стандартный сингапурский английский, и разговорный сингапурский английский. Сингапурцы разного этнического происхождения (например, китайцы, малайцы, индийцы и т. д.) и разного уровня образования.. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьАнглийский - южноафриканский акцентАнглийский – Южная Африка, набор аудиоданных4006001000Представители различных социально-экономических классов и этнического происхождения (например, южноафриканцы европейского, африканского, индийского или смешанного происхождения).. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьанглийский – ирландский акцентАнглийский — ирландский набор аудиоданных500500Английский, на котором говорят в Ирландии. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьанглийский - шотландский акцентАнглийский – шотландский набор аудиоданных800800Английский, на котором говорят шотландцы. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьанглийский - валлийский акцентАнглийский – валлийский набор аудиоданных800800Валлийский английский. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьфранцузский канадецФранцузско-канадский набор аудиоданных10001000Канадский французский. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьдревнееврейскийНабор аудиоданных на иврите7507501500Иврит в Израиле. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьИндонезийскийИндонезийский аудио набор данных100010002000Индонезийский бахаса. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьЯпонскийЯпонский аудио набор данных20002000Японец из Японии. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьКорейскийКорейский аудио набор данных10020015001800Ораторы распространились по всей Южной Корее.. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьMalayМалайский аудио набор данных5005001000Малайский в Малайзии. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьМексиканский испанскийМексиканский испанский набор аудиоданных12501250Мексиканец из Мексики. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьПольскийПольский аудио набор данных25020002250Польский из Польши. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьРусскийРусский аудио набор данных20002000Русский из России. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьсуахилиНабор аудиоданных на суахили3506501000Южноафриканский и кенийский суахили. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьШведскийШведский набор аудиоданных3506501000Шведский в Швеции. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьТайваньский китайскийТайваньский китайский набор аудиоданных10001000Китайцы из Тайваня. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьТайскийТайский аудио набор данных350450800Неофициальный регистр, используемый между друзьями,. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьТурецкийТурецкий набор аудиоданных20002000Турецкий из Турции. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьВьетнамскийВьетнамский набор аудиоданных6004001000Северный (например, Ханой), Центральный и Южный (например, Хошимин).. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьХиндиХинди аудио набор данных80020002800Хинди в Индии, особенно в северном, восточном и западном регионах.. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьхинглишИндийский английский аудио набор данных300500800Собраны из городских городов Индии, которые являются финансовыми центрами страны из-за растущих экономических возможностей. Такими местами могут быть Нойда, Дели, Дехрадун, Чандигарх, Мумбаи, Калькутта, Бангалор, Пуна, Ченнаи, Хайдарабад и т. д.. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьАнглийскийАнглийский аудио набор данных700700. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьканнадыНабор аудиоданных каннада6010040200Каннада из Карнатаки, Индия. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьМалайяламНабор аудиоданных малаялам6010040200Малаялам из Кералы, Лакшадвипа и Пудучерри. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьОрияНабор аудиоданных Ория6010040200Ория из частей Одиши, Западной Бенгалии, Джаркханда и Чхаттисгарха.. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьпанджабиПенджабский аудио набор данных6010040200Пенджаби из Пенджаба, Индия. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьТамильскийТамил аудио набор данных60100240400Тамильский из Тамил Наду, Индия. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьТелугуНабор аудиоданных телугу1009509502000Телугу из Андхра-Прадеша, Индия. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьБенгальскийБенгальский набор аудиоданных6010040200Бенгалец из Западной Бенгалии, Индия. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьГуджаратиНабор аудиоданных гуджарати6010040200Гуджарати из Гуджарата, Индия. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьМаратхиНабор аудиоданных маратхи6010040200Маратхи из Махараштры, Индия. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип
речьАссамскийАссамский аудио набор данных6010040200Ассамец из Ассама, Индия. Wav.jsonASR, виртуальный помощник, чат-бот, разговорный ИИ, речевая аналитика, TTS, языковое моделированиеШаип

Глубокий опыт в разговорном ИИ

Разговорный ИИ, чат-боты или виртуальные/цифровые помощники настолько умны, насколько умны технологии и данные, стоящие за ними. В Shaip мы предлагаем вам широкий набор диверсифицированных наборов аудиоданных для обработки естественного языка (NLP), которые имитируют разговоры с реальными людьми, что позволяет вам воплотить в жизнь свой ИИ. Благодаря нашему глубокому пониманию, мы помогаем вам создавать и локализовать речевые модели с поддержкой ИИ с максимальной точностью, используя обширные и структурированные наборы данных на нескольких языках со всего мира. Мы предлагаем услуги по сбору многоязычных аудиофайлов, аудиотранскрипции и аудиоаннотации в соответствии с вашими требованиями, полностью настраивая желаемое намерение, высказывания и демографическое распределение.

Сборник сценариев речи

Коллекция спонтанной речи

Транскрипция аудиоданных

Маркировка данных и аннотации

Shaip позволяет точно обучить вашу платформу разговорного ИИ, чтобы она могла:

  • Беспрепятственно разговаривайте, отправляйте текстовые сообщения и общайтесь в чате по нескольким каналам.
  • Учитесь на основе существующих взаимодействий в форме чата, голосовых расшифровок, транзакций и т. д. и предлагайте и общайтесь на основе этих знаний.
  • Поймите намерение, стоящее за человеческой речью, и устраните двусмысленность в понимании человеческого языка.
  • Взаимодействуйте с вами один на один и можете быть обучены идентифицировать пользователей и запоминать прошлые разговоры.

Мировой лидер в области разговорных данных для обучения искусственному интеллекту

Часы аудиоданных на более чем 100 языках - исходные, расшифрованные и аннотированные

Лицензирование речевых данных

Более 20 тысяч часов речевых данных на 40+ языках и диалектах, охватывающих более 55 тем из разных областей, например, колл-центр, дебаты, общие разговоры, выступления, подкасты и т. Д.

Сбор речевых данных

Собирайте аудио- и речевые данные (монолог, разговор между двумя людьми, чат между человеком и ботом) на более чем 2 языках со всего мира в соответствии с вашими требованиями к ИИ.

Транскрипция речевых данных

Экономичная транскрипция аудиозаписей или аннотации с помощью сильной команды из 30,000 сотрудников с гарантированным TAT, точностью и экономией

Ускорьте разработку разговорного AI-приложения с помощью Audio Collection и Audio Annotation Services

Преимущество Shaip

Масштаб​

Мы можем создавать, масштабировать и доставлять аудиоданные со всего мира на нескольких языках и диалектах в соответствии с вашими требованиями.

Эксперты в своем деле

У нас есть необходимый опыт в области сбора точных и непредвзятых данных, транскрипции и аннотаций золотого стандарта.

Cеть

Сеть из 30,000+ квалифицированных участников, которым можно быстро назначить задачи по сбору данных для создания модели обучения ИИ и масштабируемых услуг.

Технологии

У нас есть полностью основанная на ИИ платформа с запатентованными инструментами и процессами для круглосуточного круглосуточного управления рабочим процессом.

проворство

Мы очень быстро адаптируемся к изменениям требований клиентов и помогаем ускорить разработку ИИ с помощью качественных речевых данных в 5-10 раз быстрее, чем у конкурентов.

Безопасность

Мы придаем первостепенное значение безопасности и конфиденциальности данных, а также имеем сертификаты для работы с конфиденциальными данными, которые строго регулируются.

Что мы делаем лучше всего

Данные обучения

Получите данные высочайшего качества за очень короткое время. Это золотой стандарт, надежность и готовность обучить ваши модели искусственного интеллекта и машинного обучения достижению высочайшего уровня производительности.

Подробнее

Сбор данных, маркировка и аннотации

С Shaip вы получите более 15 лет проверенного опыта в сборе, расшифровке и аннотировании качественных данных. Благодаря нашей глобальной рабочей силе мы можем собирать данные со всего мира, а затем предоставлять услуги маркировки и аннотации с идеальным уровнем навыков и знаний, необходимых для ваших данных.

Подробнее

Каталоги данных и лицензирование

Благодаря нашему обширному инвентарю из миллионов наборов данных вы можете собирать и систематизировать их по мере необходимости. Затем мы можем лицензировать эти качественные данные для ваших конкретных требований к использованию AI и ML. Кроме того, эти данные доступны за небольшую часть стоимости, если вы создадите их самостоятельно.

Подробнее

Хотите создать свой собственный набор данных?

Свяжитесь с нами сейчас, чтобы узнать, как мы можем собрать пользовательский набор данных для вашего уникального решения ИИ.