Colección de citas famosas - Colección de poesías - Cómo convertir libros físicos en libros electrónicos

Cómo convertir libros físicos en libros electrónicos

Herramientas de producción:

1. Escáner

No es necesariamente un buen escáner, pero es mejor que sea más rápido, lo que ahorrará mucho tiempo. Si tiene suficiente dinero, puede comprar un escáner que pueda escanear papel A3, de modo que pueda escanear dos páginas para hacer una.

2.Software OCR

FINEREADER, este software y su crack se pueden encontrar en Baidu o GouLi. Además, también viene con muchos paquetes de idiomas y puede reconocer muchos idiomas (el chino no es ideal, puedes buscar a alguien más, Tongfang tiene una gran capacidad de reconocimiento). Se recomienda instalar más paquetes de idiomas. (Si está escaneando PDF directamente, puede utilizar la herramienta de captura que viene con XP).

Preparación antes de escanear:

1. .. Esto no diré más tonterías.

2. Vaya a Google para ver si hay capítulos de muestra del libro que desea escanear. Si lo tienes, debes descargarlo, aunque sea solo un capítulo.

3. Configure FINEREADER:

a) Mida el tamaño del libro, seleccione Opciones en el menú Herramientas, cambie a la página Escanear/Abrir imagen, haga clic en Seleccionar fuente. .. y seleccione El escáner que está utilizando; luego elija usar una interfaz más sofisticada, recuerde no seleccionar el cuadro de diálogo "Mostrar opciones antes de escanear" a continuación. A continuación, haga clic en el botón de configuración del escáner a la derecha y complete las dimensiones del libro que acaba de medir aquí. De esta manera, al escanear a la posición designada, el escáner retrocederá sin tener que recorrer toda la longitud del escáner, lo que por supuesto ahorra mucho tiempo. Finalmente, configure el intervalo de escaneo, normalmente lo configuro en dos segundos.

b) Configure el modo de escaneo en escala de grises, 300 ppp en la misma interfaz que en el paso anterior. Si utiliza el modo blanco y negro, las ilustraciones del libro serán más oscuras.

c) Revise el libro que desea escanear, principalmente para ver si contiene algún carácter especial. Por ejemplo, algunos libros de matemáticas tienen muchas fórmulas y otros caracteres extraños, y es necesario instalar el paquete de idioma correspondiente. Si no desea utilizar todo el paquete de idiomas, también puede definir un nuevo idioma usted mismo. Este trabajo se realiza en el menú Herramientas, Editor de idioma... La instalación de paquetes de idioma es solo la mitad de la tarea. Para que el software utilice un paquete de idioma o su propio idioma definido, también debe indicarle al software qué idioma necesita usar para completar la tarea de reconocimiento. Hay un cuadro de lista desplegable en la barra de herramientas. El valor predeterminado es inglés. Seleccione Seleccionar varios idiomas... y luego marque los idiomas correspondientes en el cuadro de diálogo emergente. La configuración del idioma está completa. (Nota: esta función rara vez se usa, el inglés general es suficiente).

d) Haga clic en el menú de procesamiento y seleccione Iniciar reconocimiento de fondo, para que pueda escanear y reconocer al mismo tiempo. Después del escaneo, finaliza el reconocimiento automático.

4. Enciende los altavoces, empieza la música y empezamos a trabajar.

Cuestiones a las que se debe prestar atención al escanear para obtener reconocimiento:

1. Si su escáner no es ultradelgado, será mejor que coloque algunos libros al lado. con la misma altura que el escáner. De esta manera, cuando escanee el libro, el libro no se desplomará hacia un lado, lo que puede ahorrar mucho esfuerzo.

2. Al escanear algunos libros gruesos hacia la mitad, el lomo se arqueará hacia arriba y deberá presionar con fuerza; de lo contrario, el texto cerca del lomo se distorsionará, lo que afectará el efecto de reconocimiento. En términos generales, al escanear hacia el centro, a menudo puedes tirar del libro hacia ambos lados o girarlo hacia atrás con fuerza, pero esto causará un gran daño al libro. Si pides prestado el libro de un amigo para escanearlo, no lo hagas, ten cuidado de no aplanarlo; no importa si es un libro de la biblioteca.

3 Actualmente no existe ningún software de OCR que pueda 100. % identifica las ilustraciones del libro. Si una ilustración tiene muchas líneas horizontales o rectas, a menudo se la considera una tabla. A veces, simplemente ignóralo y trata las ilustraciones como texto. En este caso, sólo podrá especificar manualmente el tipo de zona de reconocimiento. El método es muy sencillo. Simplemente seleccione el botón Área de gráficos en la barra de herramientas vertical y dibuje un cuadro rectangular en el gráfico escaneado.

4. Sólo cuando el tamaño del área de reconocimiento de texto cambia o se agrega una nueva área de texto, es necesario volver a reconocer la página. Si simplemente elimina el área de texto o la convierte en un área de gráficos, ya no necesitará reconocerla.

5.FineReader maneja muy bien los formularios y, por lo general, no requiere ningún cambio en el logotipo del formulario. Si desea agregar o eliminar divisores en un formulario, simplemente use los botones de respuesta en la barra de herramientas vertical y los resultados de los cambios se mostrarán inmediatamente, sin identificar la página.

6. Para garantizar la precisión, se requiere revisión ortográfica después del OCR. El error más común es confundir L (L minúscula) con 1 (números arábigos), 0 y o. Si puede encontrar algunos patrones, como que muchos r0 se reconozcan como ro, puede usar la función de reemplazo para reemplazarlos todos. inmediatamente. De esta manera ya no recibirás mensajes de error.

Etiquetas

Las anteriores son sólo algunas de mis propias experiencias en la creación de libros electrónicos escaneados. FineReader es un software potente y hay algunas funciones que aún no he utilizado, como el editor de patrones. Espero que este artículo pueda servir como punto de partida y ser útil para amigos que quieran hacer libros electrónicos.

Producir libros electrónicos escaneados es un gran proyecto. Producir libros electrónicos de alta calidad requiere tiempo y esfuerzo, pero cuando terminas uno, lo sientes como una obra maestra.