Colección de citas famosas - Frases elegantes - ¿Qué hacer con el texto escaneado?

¿Qué hacer con el texto escaneado?

El reconocimiento de texto OCR es una de las aplicaciones más comunes para que los usuarios utilicen productos de escáner. En la actualidad, casi todos los productos de escáner vienen con software de reconocimiento OCR. Sin embargo, descubrimos que incluso con el mismo software OCR, la precisión del reconocimiento varía mucho. De hecho, la precisión del reconocimiento OCR no sólo está relacionada con el software OCR en sí, sino también con su uso correcto. Según la experiencia acumulada del autor, el reconocimiento OCR debe partir de los siguientes aspectos. Tomemos como ejemplo el OCR Shangshu No. 6 equipado con el escáner Zhongjing.

1. Operación de escaneo y puntos de atención Cuando el escáner está en línea y el escáner Zhongjing se puede encontrar en "Prueba de escáner", se puede ejecutar el software OCR de Shangshu No. 6. Luego haga clic en el botón "Escanear". Después de un rato, aparece la ventana de control del escáner, que muestra una vista previa de la imagen garantizando "blanco y negro" 300 ppp. Los pasos anteriores también se pueden lograr mediante las "teclas de acceso directo de OCR" en el escáner Zhongjing. La mayoría de los escáneres MICOTEK actualmente en el mercado están equipados con teclas de acceso directo para comodidad del usuario.

Amplíe la vista previa y ajuste la nitidez de la imagen

Para lograr el mejor efecto de reconocimiento, el requisito mínimo para el manuscrito de entrada al escanear es la nitidez. Para ello, podemos utilizar la "Vista previa ampliada" para muestrear y escanear varios caracteres del documento original para ajustar el brillo de la imagen con más detalle. La herramienta de ajuste es "Umbral" en la herramienta de escáner.

Los siguientes son los resultados del análisis bajo diferentes umbrales. Después de ajustar a un umbral adecuado, puede seleccionar el botón "Escanear". Los resultados del escaneo se enviarán al software OCR y la ventana de control del escáner desaparecerá automáticamente.

2. Precauciones antes de la identificación

Después de completar los asuntos anteriores, todo lo que tenemos que hacer es la operación real en el software OCR.

Preste atención a la corrección de inclinación del texto

Debido a que el principio de reconocimiento OCR se basa en la forma de las fuentes, debe prestar atención a si el manuscrito está colocado horizontalmente. En el proceso de implementación específico, el botón de corrección de inclinación de la imagen se puede utilizar para resolver el problema.

Preprocesamiento del reconocimiento de manuscritos

Para las columnas del documento, se recomienda configurar manualmente el rango de reconocimiento. Es mejor no utilizar "segmentación automática" para garantizar la coherencia. de los resultados del reconocimiento.

Utilizar métodos de identificación adecuados.

En la identificación específica, también debes prestar atención a si tu manuscrito es horizontal o vertical, para que puedas seleccionar el botón de formato correcto y mantener la relación correspondiente.

Actualmente, el software OCR de Shangshu No. 6 proporciona a los usuarios diferentes métodos de reconocimiento, como chino simplificado, chino tradicional e inglés. La selección es un menú desplegable en la ventana, no un menú de botones. Los botones Simplificado, Tradicional e Inglés son los métodos de visualización correctos de Shangshu No. 6 en diferentes sistemas operativos, así que no los confunda.

Después de confirmar los pasos anteriores, puedes presionar el botón "Reconocer" en este momento. Después de la identificación, el sistema ingresará a la "Interfaz de revisión de manuscritos".

3. Corrección de manuscritos

En términos generales, el OCR se mostrará en azul para el texto que no se puede determinar por completo. Confirme. Pero vale la pena señalar que pueden aparecer errores donde no los hay, especialmente palabras en inglés en texto chino. El OCR generalmente los reconoce en chino y la tasa de error es casi del 100%. Por lo tanto, cuando estamos revisando, podemos leerlo primero para mejorar el efecto de la revisión del texto.

Podemos agregar el texto que necesites en esta interfaz a través del método de entrada de texto proporcionado por el sistema operativo.

OCR proporciona la función de seleccionar un editor externo, pudiendo elegir un editor de texto.

Finalmente, se recomienda revisar y reorganizar todo el manuscrito en WORD para lograr los mejores resultados utilizando OCR.