¿Qué software puede utilizar el escáner para reconocer automáticamente el texto impreso como texto editable?
Conjuntos de caracteres simplificados y tradicionales: además de los caracteres simplificados, también puedes reconocer más de 5.400 caracteres tradicionales en la provincia de Taiwán, así como caracteres tradicionales de Hong Kong y caracteres chinos GBK.
Identifica tipos de fuentes: puede identificar más de 100 fuentes, como dinastía Song, imitación de la dinastía Song, escritura regular, negra, estela Wei, escritura oficial, círculo y línea, etc., y admite la combinación. uso de múltiples fuentes.
Identificar el tamaño de fuente: el número inicial es más pequeño que la sexta fuente.
Reconocimiento de formularios: puede juzgar, dividir, identificar y restaurar automáticamente varios formularios de impresión generales.
Puede admitir el sistema WINDOWS tradicional.
Cómo utilizar:
1. Abra Shangshu No. 7 y elija abrir la imagen. (Los formatos que puedo reconocer son bmp, tif y jpg).
2 Seleccione Iniciar reconocimiento o presione F8. Los resultados del reconocimiento se mostrarán en la parte superior de la ventana y los resultados del análisis de diseño se mostrarán en la parte inferior. La línea roja es la parte identificable y la línea verde es la parte irreconocible.
3. Seleccione Salida al archivo de formato especificado para guardar los resultados del reconocimiento en el formato requerido.
Operación detallada
1. El software OCR de Shangshu No. 7 es un software autorizado por Weishi Zhongjing Technology Company para comprarlo a Hanwang Technology y entregárselo a los usuarios. El software se coloca en el CD de la unidad del escáner y el usuario puede optar por instalarlo.
2. Una vez completada la instalación del software, el usuario debe hacer clic en "Inicio" en la esquina inferior izquierda del escritorio, buscar el ícono del software "OCR No.7 en Shangshu" y hacer clic en él. Abra la interfaz de usuario de OCR No.7 en "Shangshu".
3. Abra "Seleccionar escáner" en el menú "Archivo" de Shangshu No. 7 OCR y seleccione la opción del controlador "MICROTEK SCANWIZARD 5" correspondiente al escáner. y seleccione Aceptar.
4. Seleccione "Escanear" en el menú "Archivo" para abrir el controlador del escáner. La siguiente interfaz es el "Panel de control avanzado" del escáner.
5. Los usuarios deben prestar atención a seleccionar "Tipo de imagen" en la ventana "Configuración" a la izquierda del software SCANWIZARD 5. Seleccione el tipo "Color RGB" o "Escala de grises". La resolución del escáner es 300PPI.
6. Cuando el usuario completa la "Vista previa" y configura el rango para escanear, puede hacer clic en el botón "Escanear" y el escáner comenzará a escanear. Transfiera los archivos escaneados directamente al directorio predeterminado de Shangshu OCR No.7 (el directorio predeterminado para almacenar archivos de imágenes es el directorio de imágenes en el directorio SHOCR2002 en la unidad c de la computadora del usuario). Después de escanear, cierre el asistente de escaneo del controlador del escáner. 5. El usuario puede ver que el archivo a escanear se envió a Shangshu No. 7 y el nombre de archivo predeterminado es HW001.JPG.
7. Se solicita a los usuarios que seleccionen "Corrección automática de inclinación" en el menú "Editar" del software Shangshu No. 7 y dejen que el software Shangshu No. 7 gire la imagen escaneada en consecuencia para garantizar que Los caracteres de la imagen están dispuestos horizontalmente, en lugar de inclinados. Debido a que el texto está demasiado inclinado, afectará el efecto de reconocimiento del software Shangshu.
9. Después del análisis del diseño, el usuario puede ver el bloque de texto correspondiente y todos los cuadros de identificación correspondientes están seleccionados.
10. En este momento, preste atención a si los atributos del cuadro de identificación correspondiente son correctos. El cuadro de identificación tiene cuatro propiedades, como "Columna horizontal", "Columna vertical", "Tabla" e "Imagen", que están representadas por cuatro casillas de verificación de diferentes colores.
11. Después de pasar la verificación, el usuario puede utilizar el botón "Iniciar reconocimiento" en el menú "Reconocimiento". Obtenga el resultado...
12. En este punto, ha entrado en el estado de revisión del texto. ......
13. Cuando el usuario ha completado la revisión, o no hay revisión en "Shangshu No. 7", el usuario puede seleccionar "Ir al archivo de formato especificado" en "Salida". "menú.
Los usuarios pueden ver los resultados del reconocimiento y pueden elegir TXT, RTF, HTML, XLS y otros formatos.
El directorio de salida predeterminado es el directorio de salida bajo el directorio SHOCR2002 en la unidad c de la computadora del usuario. El usuario puede guardar el archivo seleccionando el nombre de archivo correspondiente. Para mayor comodidad, los usuarios pueden seleccionar la opción "Salida a editor externo", de modo que "Shang Shu" No. 7 OCR llamará automáticamente al software de edición correspondiente al guardar. Por ejemplo, al guardar TXT, llamará automáticamente al software del Bloc de notas y. al guardar RTF, llamará automáticamente al software de edición correspondiente. Llame al software WORD y se llamará automáticamente al software EXCEL al guardar XLS.
Se completa la operación simple de OCR.
Descripción del reconocimiento
Las imágenes de texto escaneadas por el escáner no se pueden editar ni modificar para caracteres individuales. En la enseñanza, necesitamos utilizar software de reconocimiento de texto para reconocer imágenes de texto y convertir el formato de imagen a formato de texto. Existen muchos programas de reconocimiento de texto comunes con básicamente las mismas funciones principales, y "Shang Shu No. 7" es uno de ellos. El proceso de reconocimiento y conversión de imágenes de texto se puede completar fácilmente utilizando el menú principal de "Shang Shu No. 7": Archivo, Editar, Reconocer y Salida.
Pasos de reconocimiento
Paso 1: Obtener el archivo de imagen de texto.
Seleccione el comando "Escanear" o "Abrir imagen" en el menú "Archivo" para abrir el archivo de imagen escaneada. Si hay varios escáneres conectados, puede seleccionar el comando "Seleccionar escáner" en el menú "Archivo" para invocar el escáner.
Paso 2: Ajuste la página de la imagen escaneada.
Seleccione comandos como "Corrección de inclinación de página de imagen" (proporciona métodos de implementación automática y manual) y "Girar" en el submenú "Procesamiento de página de imagen" en el menú "Editar" para ajustar la página de imagen escaneada.
Paso 3: análisis de diseño y conversión de reconocimiento de texto
Análisis de diseño, seleccione el rango de reconocimiento y luego realice el reconocimiento de texto después de seleccionar el rango de reconocimiento. El núcleo del proceso de identificación es el "análisis de diseño". La función de análisis de diseño automático de "Shang Shu No. 7" es muy poderosa y puede mantener una alta precisión de análisis para diseños complejos como periódicos y revistas.
Una vez completada la configuración, puede hacer clic directamente en el botón "Iniciar reconocimiento" para reconocer los caracteres.
Paso 4: Revisión y modificación
Después del reconocimiento automático, aparecerá una "ventana de texto" de los resultados del reconocimiento, que puede proporcionar la revisión de los resultados del reconocimiento. Para facilitar la revisión, "Shangshu No. 7" agrega un método de revisión que utiliza el cursor para mostrar la línea de la imagen original (como se muestra en la línea amarilla en la Figura 3).
El método de revisión proporcionado puede ver la diferencia entre la imagen original y el texto reconocido de un vistazo, y si el reconocimiento es incorrecto, se puede modificar.
Paso 5: Exportar
Shang Shu No. 7
Si confirmas la modificación, selecciona el menú "Salida" del resultado del reconocimiento. Los formatos de archivo de salida son RTF, HTML, XLS y 2126. Podrás elegir el formato adecuado según tus necesidades. Si el usuario espera obtener resultados de reconocimiento similares al texto original, seleccione el formato RTF. Después de abrir el archivo de salida en formato RTF en WORD, encontrará que casi todos los rastros del texto original, incluidas las imágenes en color de la página original, se conservan en WORD.