Набор данных по арабскому, тайскому, вьетнамскому, хинди, английскому и китайскому языкам
Вариант использования: OCR
Формат: Фото товара
Граф: 150k
Аннотация: Да
Описание: Набор данных по арабскому, тайскому, вьетнамскому, хинди, английскому и китайскому языкам
Набор данных арабского текста
Вариант использования: OCR
Формат: Фото товара
Граф: 1k
Аннотация: Да
Описание: Набор данных арабских текстов содержит коллекцию текстовых образцов, написанных на арабском языке. Он включает различные формы контента, такие как новостные статьи, сообщения в социальных сетях, литературу и диалоги, охватывающие различные темы и стили письма. Этот набор данных используется для таких задач, как обработка естественного языка (NLP), классификация текста, анализ настроений и машинный перевод в приложениях на арабском языке.
Набор данных по китайскому, английскому, тибетскому и уйгурскому языкам
Вариант использования: OCR
Формат: Фото товара
Граф: 38k
Аннотация: Да
Описание: Набор данных по китайскому, английскому, тибетскому и уйгурскому языкам
Набор данных меню на китайском и английском языках

Вариант использования: OCR
Формат: Фото товара
Граф: 60k
Аннотация: Да
Описание: Набор данных меню Chinese and English содержит изображения или текстовые образцы меню ресторанов, которые содержат как китайский, так и английский языки. Он включает в себя различные шрифты, макеты и структуры меню, представляющие двуязычные названия блюд, описания и цены. Этот набор данных полезен для таких задач, как оптическое распознавание символов (OCR), машинный перевод и оцифровка меню в многоязычных настройках.
Набор данных по рукописным композициям на китайском языке

Вариант использования: OCR
Формат: Фото товара
Граф: 3k
Аннотация: Да
Описание: Набор данных рукописных китайских сочинений содержит образцы рукописного китайского текста, включая сочинения, эссе и другие длинные тексты. Он содержит различные стили почерка и уровни сложности и используется для таких задач, как распознавание рукописного текста, анализ текста и обучение модели машинного обучения.
Набор данных для китайского WIFI-подсказок

Вариант использования: OCR
Формат: Фото товара
Граф: 1k
Аннотация: Да
Описание: Набор данных Chinese WIFI Prompt состоит из текстовых образцов, найденных в запросах WIFI и экранах входа, написанных на китайском языке. Обычно он включает в себя различные запросы, инструкции и сообщения об ошибках, связанные с подключением к сетям WIFI или управлением ими. Этот набор данных используется для таких задач, как распознавание текста, обработка естественного языка и улучшение пользовательских интерфейсов для сетевого подключения.
Набор данных почерка на английском и китайском языках

Вариант использования: OCR
Формат: Фото товара
Граф: 12k
Аннотация: Да
Описание: Набор данных по рукописному тексту на английском и китайском языках содержит образцы рукописного текста на английском и китайском языках, демонстрирующие различные стили письма и сложность символов. Обычно он используется для обучения и оценки моделей распознавания рукописного текста, поддержки многоязычного анализа текста и других связанных исследований. Набор данных включает в себя разнообразный набор символов, цифр, слов и предложений на обоих языках.
Набор данных Shopsign на английском и китайском языках

Вариант использования: OCR
Формат: Фото товара
Граф: 30k
Аннотация: Да
Описание: Набор данных Shopsign на английском и китайском языках включает изображения вывесок магазинов, которые содержат текст как на английском, так и на китайском языках. Он фиксирует различные элементы вывесок, такие как названия магазинов, реклама, акции и указания, отображаемые различными шрифтами, стилями и форматами. Этот набор данных используется для таких задач, как обнаружение и распознавание текста, понимание многоязычных сцен и улучшение моделей компьютерного зрения для интерпретации двуязычных вывесок.
Набор данных специального текста на английском и китайском языках

Вариант использования: OCR
Формат: Фото товара
Граф: 50k
Аннотация: Да
Описание: Набор данных English & Chinese Special Angle Text Dataset содержит изображения текста, отображаемого под разными углами и в разных ориентациях на английском и китайском языках. Он включает текст из таких источников, как знаки, реклама и документы, которые не представлены в стандартных горизонтальных форматах. Этот набор данных используется для обучения и оценки моделей обнаружения и распознавания текста, в частности тех, которые способны обрабатывать текст в нетрадиционных ориентациях и перспективах.
Набор данных меню на английском языке

Вариант использования: OCR
Формат: Фото товара
Граф: 20k
Аннотация: Да
Описание: English Menu Dataset включает изображения или текстовые образцы меню ресторанов, написанные на английском языке. Он содержит множество шрифтов, макетов и стилей форматирования, с содержимым, варьирующимся от названий блюд до описаний и цен. Этот набор данных часто используется для таких задач, как оптическое распознавание символов (OCR), извлечение текста и оцифровка меню в приложениях, связанных с едой.
Текстовый набор данных английских сцен

Вариант использования: OCR
Формат: Фото товара
Граф: 33k
Аннотация: Да
Описание: Набор данных English Scenes Text состоит из изображений, содержащих естественные сцены со встроенным английским текстом. Текст появляется в различных формах, таких как знаки, рекламные щиты и плакаты, часто с различными шрифтами, размерами и ориентацией. Этот набор данных обычно используется для обучения и тестирования моделей в задачах обнаружения текста, распознавания и понимания сцен.
Набор данных рукописного текста

Вариант использования: Документ ИИ
Формат: HEIC (изображения) и .mov (видео)
Граф: 94053
Аннотация: Нет
Описание: Живые фотографии с рукописным текстом для японского, корейского и русского языков
Записывающее устройство: Камера iPhone и iPad
Условия записи: - Агрессивное освещение/блики - Вспышка камеры включена - Цветной свет - Слабое освещение, без вспышки камеры - Нормальный
Набор данных на японском и корейском языках

Вариант использования: OCR
Формат: Фото товара
Граф: 40k
Аннотация: Да
Описание: Набор данных по японскому и корейскому языкам включает образцы текстов на японском и корейском языках. Он содержит разнообразный контент, такой как предложения, фразы и слова, охватывающие различные контексты и стили. Этот набор данных используется для таких задач, как обработка естественного языка (NLP), машинный перевод и анализ текста в многоязычных приложениях.
Печатный набор данных обычного/курсивного текста (документ AI)

Вариант использования: Документ ИИ
Формат: HEIC (изображения) и .mov (видео)
Граф: 23930
Аннотация: Нет
Описание: Живые фотографии с рукописным текстом для японского, корейского и русского языков
Записывающее устройство: Камера iPhone и iPad
Условия записи: - Агрессивное освещение/блики - Вспышка камеры включена - Цветной свет - Слабое освещение, без вспышки камеры - Нормальный
Текст + Аудиовизуальные материалы (Многоязычные/OCR/NLP) – Книги, журналы, Аудио + Текст
Вариант использования: Текст + Аудиовизуальные материалы (Многоязычный / OCR / NLP)
Формат: Видео
Граф: Более 100 тыс. видеолекций + длинные видеоматериалы PPT
Аннотация: Нет
Описание: Китайские книги, английские книги, журналы, государственная политика, романы, книги для детей, аудио и текст на кантонском диалекте, видеолекции и презентации, длинноформатные видео. Полмиллиарда книг, пары вопросов и ответов, статьи.
