Определение
Распознавание текста — это идентификация текстовых символов на изображениях или отсканированных документах. Оно включает в себя распознавание печатных и рукописных текстов.
Цель
Цель — сделать текст в визуальных форматах доступным и пригодным для поиска.
Значение
- Позволяет оцифровывать архивы.
- Критически важно для доступности и автоматизации.
- Точность зависит от качества изображения.
- Относится к технологиям OCR.
Как это работает
- Сохраняйте отсканированные или сфотографированные документы.
- Предварительно обработайте изображения для повышения четкости.
- Определить текстовые области.
- Применяйте модели распознавания.
- Вывод машиночитаемого текста.
Примеры (реальный мир)
- Google Lens: распознает текст на фотографиях.
- ABBYY FineReader: оцифровывает отсканированные документы.
- Tesseract OCR: движок распознавания текста с открытым исходным кодом.
Ссылки/Дополнительная литература
- Смит, Р. «Обзор OCR-движка Tesseract». ICDAR.
- Стандарт ИСО/МЭК 15938-4.
- Труды IEEE по анализу образов и машинному интеллекту.