¿Cómo funciona OCR? Explicado de manera simple y comprensible
En este artículo explicamos cómo funciona OCR. OCR significa "Reconocimiento óptico de caracteres" y simplemente se conoce en alemán como reconocimiento de texto. Esto significa que una computadora puede reconocer texto en una imagen escaneada usando OCR y luego convertirlo en un documento de texto simple.
Así es como funciona OCR
Imagine que recibió una presentación en papel de un colega. Ahora desea editarlos en la PC porque no le gustan los pasajes individuales. Así que escanee y vaya a su programa OCR. Ahora sucede lo siguiente:
- El software primero hace un llamado análisis de diseño. Para hacer esto, mira el diseño de la página y separa las imágenes del texto. Ella también toma nota de su posición en la página. Luego se cuenta el número de párrafos y se guardan elementos individuales como los números de página.
- Ahora viene la parte difícil. El software analiza los bloques de texto individuales y los divide en oraciones. Las oraciones se dividen en palabras individuales y las palabras en letras.
- El software OCR contiene patrones de letras y caracteres. El programa ahora compara las letras escaneadas con estos patrones. Si son 99% similares, el algoritmo decide que probablemente tenga que ser esa letra. Es muy preciso porque puede comparar muchos patrones en poco tiempo. De esta manera, diferencia con éxito entre un "8" y un "B".
- Entonces las letras y los caracteres se reconocen gradualmente. Luego se combinan nuevamente como palabras y se vuelven a colocar en su lugar en la oración. Tan pronto como el software esté terminado, todo se guardará en un documento normal, que luego podrá editar. Hecho!
¿Quieres poner a prueba tus conocimientos de software? ¡Participe en nuestro gran concurso de software!