¿Cómo subir libros antiguos tomando fotografías?
¿El software de reconocimiento de texto OCR se refiere al uso de OCR? Tecnología de reconocimiento óptico de caracteres (OCR), un software que convierte directamente el contenido de texto en imágenes y fotografías en texto editable. El software puede convertir imágenes en texto editable. Admite JPG, PNG, GIF, BMP, DOC y otros formatos de imagen.
Datos ampliados:
Debido a la popularidad y la amplia aplicación de los escáneres, el software OCR solo necesita proporcionar una interfaz con el escáner y utilizar el software del controlador del escáner. Por lo tanto, el software OCR consta principalmente de las siguientes partes.
1. Entrada de imagen, preprocesamiento:
Entrada de imagen: para diferentes formatos de imagen, existen diferentes formatos de almacenamiento y diferentes métodos de compresión. Preprocesamiento: incluye principalmente binarización, eliminación de ruido, corrección de inclinación, etc.
2. Binarización:
La mayoría de las fotografías tomadas por las cámaras son imágenes en color, que contienen una gran cantidad de información. Para el contenido de la imagen, simplemente podemos dividirla en primer plano y fondo. Para que la computadora reconozca los caracteres más rápido y mejor, primero debemos procesar la imagen en color para que la imagen solo tenga información de primer plano e información de fondo. Simplemente podemos definir la información de primer plano como negra y la información de fondo como blanca, que es. una imagen binaria.
3. Eliminación de ruido:
Para diferentes documentos, podemos definir el ruido de manera diferente según las características del ruido se denomina eliminación de ruido.
4. Incline más activamente:
Debido a que los usuarios normales son más informales al tomar fotografías de documentos, las imágenes capturadas inevitablemente se inclinarán, lo que requiere un software de reconocimiento de texto para su corrección.
5. El proceso de dividir imágenes de documentos en párrafos y líneas se llama análisis de diseño. Debido a la diversidad y complejidad de los documentos reales, no existe un modelo de corte óptimo fijo.
6. Corte de personajes:
Debido a las limitaciones de las condiciones de la fotografía, los personajes a menudo quedan pegados y rotos, lo que limita en gran medida el rendimiento del sistema de reconocimiento, que requiere un software de corte de personajes. . Función.
7. Reconocimiento de personajes:
Esta investigación se ha realizado durante mucho tiempo. La etapa inicial es la coincidencia de plantillas y la etapa posterior es la extracción de características. La dificultad de la extracción de características se ve muy afectada por factores como el desplazamiento de los caracteres, el grosor del trazo, los trazos rotos, la adhesión y la rotación.
8. Recuperación de página:
La gente espera que los caracteres reconocidos sigan organizados como las imágenes del documento original, sin cambios en los párrafos, las posiciones y el orden, y que se envíen a documentos de Word. , documentos pdf, etc. Este proceso se llama recuperación de página.
9. Postprocesamiento y revisión:
Corregir los resultados del reconocimiento de acuerdo con la relación entre el contexto lingüístico específico es posprocesamiento. El propósito de desarrollar un sistema de software de reconocimiento de caracteres OCR es simple: transformar la imagen para que los gráficos de la imagen permanezcan. Si hay una tabla, los datos de la tabla y los caracteres de la imagen se convertirán en caracteres de computadora.
Puede reducir el almacenamiento de datos de imágenes, reutilizar y analizar los caracteres reconocidos y, por supuesto, ahorrar mano de obra y tiempo al ingresar el teclado.
Enciclopedia Baidu-Reconocimiento de caracteres OCR
Software de reconocimiento de texto Enciclopedia Baidu-OCR