Colección de citas famosas - Colección de máximas - ¿Qué es la tecnología OCR? OCR es la abreviatura de Optical Character Recognition en inglés y se refiere a un dispositivo electrónico (como un escáner o una cámara digital) que comprueba los caracteres impresos en el papel, determina su forma detectando la luz y. patrones oscuros, y luego El proceso de traducir formas en caracteres de computadora mediante el reconocimiento de caracteres. Es decir, el proceso de escanear datos de texto y luego analizar archivos de imagen para obtener información de texto y diseño. Breve descripción del desarrollo de OCR El concepto de OCR fue propuesto por primera vez por el científico alemán Tauscheck en 1929. Posteriormente, el científico estadounidense Handel también propuso la idea de utilizar tecnología para reconocer caracteres. Casey y Nagy de IBM fueron los primeros en estudiar el reconocimiento de caracteres chinos impresos. En 1966, publicaron el primer artículo sobre el reconocimiento de caracteres chinos, utilizando un método de comparación de plantillas para identificar 1.000 caracteres chinos impresos. A principios de la década de 1970, los académicos japoneses comenzaron a estudiar el reconocimiento de caracteres chinos y trabajaron mucho. La investigación sobre el reconocimiento de caracteres chinos en mi país comenzó relativamente tarde y la investigación sobre OCR comenzó a finales de la década de 1970. Los primeros software de OCR no podían satisfacer las necesidades reales debido a muchos factores, como la tasa de reconocimiento y la productización. Al mismo tiempo, debido al alto costo del equipo de hardware y la baja velocidad de funcionamiento, aún no ha alcanzado el nivel práctico. Sólo unos pocos departamentos, como el Ministerio de Información y las unidades de prensa y publicaciones, utilizan software OCR. Después de 1986, la investigación de OCR en mi país ha logrado grandes avances, con innovaciones en el modelado de caracteres chinos y métodos de reconocimiento, y resultados fructíferos en el desarrollo y aplicación de sistemas. Muchas unidades han lanzado productos OCR chinos uno tras otro. Desde la década de 1990, con la aplicación generalizada de escáneres de plataforma y la popularización de la automatización de la información y la ofimática en mi país, la tecnología OCR se ha promovido enormemente y la precisión y velocidad del reconocimiento del OCR han cumplido con los requisitos de los usuarios. Actualmente existen muchos software de OCR populares, entre los cuales el OCR en inglés incluye principalmente OmniPage y el OCR en chino incluye principalmente Tsinghua Unisplendour OCR, Tsinghua Wentong OCR, Hanwang OCR, Zhongjing Shangshu OCR, Danqing OCR y Mengtian OCR. Aunque la cantidad de caracteres chinos es enorme y los glifos complejos, la tecnología OCR ha madurado. Muchos programas de OCR pueden reconocer no sólo caracteres chinos impresos en blanco y negro, sino también caracteres chinos impresos en escala de grises y en color. La velocidad de reconocimiento es muy rápida y la precisión del reconocimiento alcanza más del 99%. Puede reconocer la simplicidad y tradición de varias fuentes como Song, Hei, Kai, etc.; puede reconocer la disposición mixta de múltiples fuentes y diferentes tamaños de fuente. Algunos programas de OCR también pueden reconocer imágenes y tablas; Al mismo tiempo, la investigación sobre el reconocimiento de caracteres chinos escritos a mano también ha logrado grandes avances, alcanzando una tasa de reconocimiento correcto de más del 70%. Aplicación del software OCR En el mercado de los escáneres, muchos tipos de escáneres domésticos y de oficina están equipados con software OCR, como los escáneres Ziguang equipados con OCR Ziguang, los escáneres Zhongjing equipados con OCR Shangshu, los escáneres Mustek equipados con OCR Danqing, etc. Los escáneres y el software OCR * * * realizan todo el proceso, desde la entrada del manuscrito hasta el reconocimiento de caracteres. El escaneo de documentos se usa a menudo en el campo de la oficina, es decir, usar un escáner para escanear documentos relevantes publicados en periódicos, revistas y otros medios, y luego realizar el reconocimiento OCR, o almacenarlos como archivos de imagen y luego convertir los archivos de imagen en texto. archivos o archivos de Word. Además, el almacenamiento y la transmisión de información digital no sólo son de bajo costo y muy eficientes, sino que también pueden satisfacer las necesidades cambiantes de la tipografía y la transmisión en red. En la actualidad, nuestro país cuenta con muchos tesoros en papel, como libros, periódicos y revistas, restos de la historia, que es urgente convertirlos en información electrónica. Por ejemplo, el establecimiento de una biblioteca electrónica requiere escanear libros página por página. El reconocimiento del software OCR reemplazará el trabajo de mecanografía manual, acortará en gran medida el tiempo de entrada, reducirá la intensidad del trabajo, ahorrará mano de obra, reducirá los costos, mejorará la precisión de la entrada y mejorará la eficiencia del trabajo. y automatización de oficinas moderna. En la actualidad, la combinación de software OCR y escáneres se ha aplicado a muchos campos de la era de la información, como bibliotecas digitales, identificación de diversos extractos, identificación de facturas en bancos y sistemas tributarios, etc. Con el desarrollo y la popularización de las redes y la informatización, su alcance de aplicación será cada vez más amplio. La composición del sistema OCR La función del software de reconocimiento de caracteres chinos OCR es utilizar la computadora para reconocer los gráficos o imágenes de cada carácter chino en varios caracteres chinos ingresados, caracteres impresos o caracteres escritos a mano, y etiquetar el código de categoría de caracteres chinos. . Por lo tanto, el reconocimiento de caracteres chinos es, en última instancia, un problema de reconocimiento de imágenes. Debido a la gran cantidad de información en caracteres chinos, diferentes glifos y fuentes y estructuras complejas, el proceso de reconocimiento de caracteres chinos es extremadamente complicado. Debido a la popularidad y la amplia aplicación de los escáneres, el software OCR solo necesita proporcionar una interfaz con el escáner, utilizando el software del controlador del escáner. Por lo tanto, el software OCR consta principalmente de cuatro partes: módulo de procesamiento de imágenes, módulo de segmentación de diseño, módulo de reconocimiento de texto y módulo de edición de texto. 1. Módulo de procesamiento de imágenes El módulo de procesamiento de imágenes tiene principalmente funciones como escaneo de documentos, escalado de imágenes y rotación de imágenes. Una vez que el escáner ingresa el original, se forma un archivo de imagen. El módulo de procesamiento de imágenes puede ampliar la imagen y eliminar manchas y rayones. Si la imagen se coloca incorrectamente, la imagen se puede girar manual o automáticamente para crear mejores condiciones para el reconocimiento de caracteres y lograr una mayor tasa de reconocimiento. 2. Módulo de división de diseño El módulo de división de diseño incluye principalmente división de diseño y división de cambios, es decir, comprensión del diseño, segmentación de palabras, estandarización, etc. Puede elegir el método de división del diseño automático o manual. El propósito es indicarle al software OCR que separe artículos, tablas, etc. Para que puedan procesarse por separado e identificarse en qué orden. 3. Módulo de reconocimiento de caracteres El módulo de reconocimiento de caracteres es la parte central del software OCR.

¿Qué es la tecnología OCR? OCR es la abreviatura de Optical Character Recognition en inglés y se refiere a un dispositivo electrónico (como un escáner o una cámara digital) que comprueba los caracteres impresos en el papel, determina su forma detectando la luz y. patrones oscuros, y luego El proceso de traducir formas en caracteres de computadora mediante el reconocimiento de caracteres. Es decir, el proceso de escanear datos de texto y luego analizar archivos de imagen para obtener información de texto y diseño. Breve descripción del desarrollo de OCR El concepto de OCR fue propuesto por primera vez por el científico alemán Tauscheck en 1929. Posteriormente, el científico estadounidense Handel también propuso la idea de utilizar tecnología para reconocer caracteres. Casey y Nagy de IBM fueron los primeros en estudiar el reconocimiento de caracteres chinos impresos. En 1966, publicaron el primer artículo sobre el reconocimiento de caracteres chinos, utilizando un método de comparación de plantillas para identificar 1.000 caracteres chinos impresos. A principios de la década de 1970, los académicos japoneses comenzaron a estudiar el reconocimiento de caracteres chinos y trabajaron mucho. La investigación sobre el reconocimiento de caracteres chinos en mi país comenzó relativamente tarde y la investigación sobre OCR comenzó a finales de la década de 1970. Los primeros software de OCR no podían satisfacer las necesidades reales debido a muchos factores, como la tasa de reconocimiento y la productización. Al mismo tiempo, debido al alto costo del equipo de hardware y la baja velocidad de funcionamiento, aún no ha alcanzado el nivel práctico. Sólo unos pocos departamentos, como el Ministerio de Información y las unidades de prensa y publicaciones, utilizan software OCR. Después de 1986, la investigación de OCR en mi país ha logrado grandes avances, con innovaciones en el modelado de caracteres chinos y métodos de reconocimiento, y resultados fructíferos en el desarrollo y aplicación de sistemas. Muchas unidades han lanzado productos OCR chinos uno tras otro. Desde la década de 1990, con la aplicación generalizada de escáneres de plataforma y la popularización de la automatización de la información y la ofimática en mi país, la tecnología OCR se ha promovido enormemente y la precisión y velocidad del reconocimiento del OCR han cumplido con los requisitos de los usuarios. Actualmente existen muchos software de OCR populares, entre los cuales el OCR en inglés incluye principalmente OmniPage y el OCR en chino incluye principalmente Tsinghua Unisplendour OCR, Tsinghua Wentong OCR, Hanwang OCR, Zhongjing Shangshu OCR, Danqing OCR y Mengtian OCR. Aunque la cantidad de caracteres chinos es enorme y los glifos complejos, la tecnología OCR ha madurado. Muchos programas de OCR pueden reconocer no sólo caracteres chinos impresos en blanco y negro, sino también caracteres chinos impresos en escala de grises y en color. La velocidad de reconocimiento es muy rápida y la precisión del reconocimiento alcanza más del 99%. Puede reconocer la simplicidad y tradición de varias fuentes como Song, Hei, Kai, etc.; puede reconocer la disposición mixta de múltiples fuentes y diferentes tamaños de fuente. Algunos programas de OCR también pueden reconocer imágenes y tablas; Al mismo tiempo, la investigación sobre el reconocimiento de caracteres chinos escritos a mano también ha logrado grandes avances, alcanzando una tasa de reconocimiento correcto de más del 70%. Aplicación del software OCR En el mercado de los escáneres, muchos tipos de escáneres domésticos y de oficina están equipados con software OCR, como los escáneres Ziguang equipados con OCR Ziguang, los escáneres Zhongjing equipados con OCR Shangshu, los escáneres Mustek equipados con OCR Danqing, etc. Los escáneres y el software OCR * * * realizan todo el proceso, desde la entrada del manuscrito hasta el reconocimiento de caracteres. El escaneo de documentos se usa a menudo en el campo de la oficina, es decir, usar un escáner para escanear documentos relevantes publicados en periódicos, revistas y otros medios, y luego realizar el reconocimiento OCR, o almacenarlos como archivos de imagen y luego convertir los archivos de imagen en texto. archivos o archivos de Word. Además, el almacenamiento y la transmisión de información digital no sólo son de bajo costo y muy eficientes, sino que también pueden satisfacer las necesidades cambiantes de la tipografía y la transmisión en red. En la actualidad, nuestro país cuenta con muchos tesoros en papel, como libros, periódicos y revistas, restos de la historia, que es urgente convertirlos en información electrónica. Por ejemplo, el establecimiento de una biblioteca electrónica requiere escanear libros página por página. El reconocimiento del software OCR reemplazará el trabajo de mecanografía manual, acortará en gran medida el tiempo de entrada, reducirá la intensidad del trabajo, ahorrará mano de obra, reducirá los costos, mejorará la precisión de la entrada y mejorará la eficiencia del trabajo. y automatización de oficinas moderna. En la actualidad, la combinación de software OCR y escáneres se ha aplicado a muchos campos de la era de la información, como bibliotecas digitales, identificación de diversos extractos, identificación de facturas en bancos y sistemas tributarios, etc. Con el desarrollo y la popularización de las redes y la informatización, su alcance de aplicación será cada vez más amplio. La composición del sistema OCR La función del software de reconocimiento de caracteres chinos OCR es utilizar la computadora para reconocer los gráficos o imágenes de cada carácter chino en varios caracteres chinos ingresados, caracteres impresos o caracteres escritos a mano, y etiquetar el código de categoría de caracteres chinos. . Por lo tanto, el reconocimiento de caracteres chinos es, en última instancia, un problema de reconocimiento de imágenes. Debido a la gran cantidad de información en caracteres chinos, diferentes glifos y fuentes y estructuras complejas, el proceso de reconocimiento de caracteres chinos es extremadamente complicado. Debido a la popularidad y la amplia aplicación de los escáneres, el software OCR solo necesita proporcionar una interfaz con el escáner, utilizando el software del controlador del escáner. Por lo tanto, el software OCR consta principalmente de cuatro partes: módulo de procesamiento de imágenes, módulo de segmentación de diseño, módulo de reconocimiento de texto y módulo de edición de texto. 1. Módulo de procesamiento de imágenes El módulo de procesamiento de imágenes tiene principalmente funciones como escaneo de documentos, escalado de imágenes y rotación de imágenes. Una vez que el escáner ingresa el original, se forma un archivo de imagen. El módulo de procesamiento de imágenes puede ampliar la imagen y eliminar manchas y rayones. Si la imagen se coloca incorrectamente, la imagen se puede girar manual o automáticamente para crear mejores condiciones para el reconocimiento de caracteres y lograr una mayor tasa de reconocimiento. 2. Módulo de división de diseño El módulo de división de diseño incluye principalmente división de diseño y división de cambios, es decir, comprensión del diseño, segmentación de palabras, estandarización, etc. Puede elegir el método de división del diseño automático o manual. El propósito es indicarle al software OCR que separe artículos, tablas, etc. Para que puedan procesarse por separado e identificarse en qué orden. 3. Módulo de reconocimiento de caracteres El módulo de reconocimiento de caracteres es la parte central del software OCR.

El módulo de reconocimiento de caracteres "lee" principalmente los caracteres chinos ingresados, pero no puede tener varias líneas y debe segmentarse línea por línea. Para los caracteres chinos, generalmente se reconoce carácter por carácter, es decir, reconocimiento de palabras, y luego se normaliza. El módulo de reconocimiento de caracteres completa el reconocimiento extrayendo las características de diferentes muestras de caracteres chinos, descubre automáticamente palabras sospechosas y tiene la función de asociación. 4. Módulo de edición de texto El módulo de edición de texto modifica y edita principalmente el texto reconocido por OCR. Si el sistema reconoce un error, el texto se mostrará en un llamativo rojo o azul y se proporcionará un texto similar para elegir un editor para la salida. Cómo utilizar el software OCR Aunque existen muchos tipos de software OCR, los métodos de uso son similares. Primero, escanee el original y luego realice el reconocimiento OCR. El uso del software OCR es el siguiente: 1. Escaneo de documentos Para utilizar el software OCR para el reconocimiento de texto, puede escanear el documento directamente en el software OCR. Después de ejecutar el software OCR, aparecerá la interfaz del software OCR. Coloque el original a escanear en la superficie de vidrio del escáner, con el lado a escanear hacia la superficie de vidrio del escáner, con el extremo superior del original hacia abajo y alineado con el borde de la regla, luego cubra el escáner. y prepárese para escanear. Haga clic en el botón "Escanear" en la ventana para ingresar al software del controlador de escaneo para escanear. El método de escaneo no se describirá en detalle aquí. Pero cabe señalar que la resolución se puede establecer en 200 ~ 400 ppp. Para documentos de texto, es muy importante ajustar el brillo adecuadamente. La imagen del documento escaneado aparece en la ventana del software OCR. 2. Para el reconocimiento OCR, para facilitar la operación, puede seleccionar opciones del menú y aparecerán varios iconos en el lado izquierdo de la ventana. Para aprovecharlo mejor, primero introduzca los iconos en el lado izquierdo de la pantalla de arriba a abajo: Herramienta "Acercar": se utiliza para ampliar la imagen; Herramienta "Alejar": se utiliza para reducir la imagen"; Herramienta "Establecer área de reconocimiento": se utiliza para establecer el área de reconocimiento; herramienta "Establecer orden de reconocimiento": se utiliza para establecer el orden de reconocimiento; herramienta "Eliminar área de identidad": se utiliza para eliminar el área de identificación; herramienta "Borrar ruido de imagen": se utiliza para borrar ruido en la imagen "Herramienta "Borrar bloques de imagen": se utiliza para borrar un área de la imagen; herramienta "Girar imagen": se utiliza para rotar la imagen 90, 180 o 270 grados; herramienta "Corrección de inclinación": se utiliza para manual; Corrección de inclinación de la imagen. Pasos generales para el reconocimiento OCR: (1) Después de escanear el original, la imagen del texto a reconocer que aparece en la ventana es muy pequeña. Primero, seleccione la herramienta "Acercar" para ampliar adecuadamente la imagen y poder verla con mayor claridad. Si es necesario, también puede seleccionar la herramienta Alejar para reducir la imagen adecuadamente. (2) Si es necesario girar la imagen 90°, 180° o 270°, puede utilizar la herramienta "Rotar imagen" para rotar la imagen. Si la imagen del texto está torcida, puede seleccionar la herramienta "corrección de inclinación" para ajustar la imagen. (3) Durante el reconocimiento, seleccione la herramienta "Establecer área de reconocimiento" y enmarque el área a reconocer en la pantalla de texto. En este momento, también puedes encuadrar múltiples áreas según las condiciones de la pantalla. Si el área del cuadro es incorrecta, puede utilizar la herramienta "Eliminar área de reconocimiento" para eliminar el área de reconocimiento seleccionada. (4) Para mejorar la tasa de reconocimiento, si el área de reconocimiento seleccionada tiene ruido o la imagen no se puede reconocer, puede seleccionar la herramienta "Borrar ruido de imagen" para borrar el ruido poco a poco. Si necesita borrar en partes, puede elegir la herramienta "Borrar bloques de imágenes". (5) Haga clic en el icono "Reconocimiento", el OCR mostrará que el texto se está dividiendo y luego vaya a la pantalla "Reconocimiento", el texto reconocido se mostrará gradualmente y se mostrará la ventana "Revisión de manuscritos". Muchos software de OCR tienen funciones de modificación de texto que identifican posibles caracteres erróneos, los muestran en colores brillantes y pueden modificarse. (6) Guarde los archivos reconocidos como archivos de texto de Word (TXT) o archivos RTF.