1. Conceptos básicos de diseño gráfico autor Jordi Alberich, David Gómez Fontanills y Alba Ferrer Franquesa.pdf

Vista previa de texto
CC-BY-SA • PID_00191347
•
curvas: usa líneas curvas
•
mixtas: combina líneas curvas con líneas rectas
55
Reconocimiento automático de caracteres
El hecho de que todas las familias tipográficas compartan una estructura común ha permitido crear sistemas informáticos que a partir de la imagen de un texto son capaces de
reconocer cada uno de sus caracteres como tal y convertirlo en texto editable. Son los
programas llamados OCR (del inglés Optical Character Recognition, reconocimiento óptico
de caracteres) que permiten convertir un texto en papel escaneado en texto apto para
cualquier programa de tratamiento de texto.
Los primeros programas OCR eran muy básicos y se crearon alfabetos expresos para ellos
que eliminaban cualquier tipo de ambigüedad entre una letra y otra; actualmente, son
capaces de reconocer un texto de cualquier tipografía mientras la imagen original no esté
dañada. Por ejemplo, una "n" mal impresa de forma que la segunda asta se pierda podría
ser reconocida como una "r".
¿Cómo lo hacen? ¿Cómo puede reconocer un sistema informático una forma, interpretarla y asignarle un carácter?
A continuación se muestran esquemáticamente dos posibles modos de hacerlo. En el
primero, el sistema tiene una serie de plantillas y comprueba si la imagen de entrada
coincide con alguna de ellas. En el segundo, conocido como pandemonium (Selfridge,
Lindsay y Norman) se utilizan las diferencias de estructura geométrica de los tipos para
seleccionar las características coincidentes.
Identificación de un carácter en base a la comparación con plantillas.
Fuente: Johannes M. Zanker [consulta 7-2009]. Visual Perception II: Objecte recognition.
http://www.pc.rhul.ac.uk/staff/J.Zanker/
Conceptos básicos de diseño gráfico
