¿Qué es el reconocimiento óptico de caracteres (OCR)?

Tabla de contenido:

¿Qué es el reconocimiento óptico de caracteres (OCR)?
¿Qué es el reconocimiento óptico de caracteres (OCR)?
Anonim

El reconocimiento óptico de caracteres (OCR) se refiere al software que crea una versión digital de un documento impreso, escrito a máquina o escrito a mano que las computadoras pueden leer sin necesidad de escribir o ingresar el texto manualmente. OCR se usa generalmente en documentos escaneados en formato PDF, pero también puede crear una versión de texto legible por computadora dentro de un archivo de imagen.

Qué es OCR

OCR, también conocido como reconocimiento de texto, es una tecnología de software que transforma caracteres como números, letras y signos de puntuación (también llamados glifos) de documentos impresos o escritos en un formato electrónico más fácil de reconocer y leer por computadoras y otros programas de software. Algunos programas de OCR hacen esto cuando un documento es escaneado o fotografiado con una cámara digital y otros pueden aplicar este proceso a documentos que han sido previamente escaneados o fotografiados sin OCR. OCR permite a los usuarios buscar dentro de documentos PDF, editar texto y reformatear documentos.

Image
Image
Escaneo de periódico histórico con software OCR.

imágenes falsas

¿Para qué se utiliza el OCR?

Para las necesidades diarias de escaneo rápido, OCR puede no ser un gran problema. Si realiza una gran cantidad de escaneos, poder buscar dentro de los archivos PDF para encontrar exactamente el que necesita puede ahorrar bastante tiempo y hace que la funcionalidad OCR en su programa de escáner sea más importante. Aquí hay algunas otras cosas con las que OCR ayuda:

  • Procesamiento y entrada de datos automatizados (Ejemplo: Sistemas de seguimiento de solicitantes de empleo para currículums).
  • Hacer que los libros escaneados se puedan buscar.
  • Conversión de escaneos escritos a mano en texto legible por computadora.
  • Hacer que los documentos sean más utilizables mediante programas de lectura que ayuden a los usuarios con discapacidades visuales.
  • Preservar documentos históricos y periódicos, al mismo tiempo que se pueden buscar.
  • Extracción de datos y transferencia a programas contables (Ejemplo: Recibos y facturas).
  • Indización de documentos para uso de motores de búsqueda.
  • Reconocimiento de las matrículas de los conductores mediante un radar de tráfico y un software de cámara de semáforo en rojo.
  • Sintetizadores de voz para personas que no pueden hablar: el físico teórico Stephen Hawking es quizás el usuario más conocido de un programa de sintetizador de voz.

Conclusión

¿Por qué no simplemente tomar una foto, verdad? Porque no podrías editar nada ni buscar el texto porque solo sería una imagen. Escanear el documento y ejecutar el software OCR puede convertir ese archivo en algo que puede editar y buscar.

Historial de OCR

Si bien el primer uso del reconocimiento de texto data de 1914, el desarrollo generalizado y el uso de tecnologías relacionadas con OCR comenzaron en serio en la década de 1950, específicamente con la creación de fuentes muy simplificadas que eran más fáciles de convertir a formato digital. texto legible. La primera de estas fuentes simplificadas fue creada por David Shepard y comúnmente conocida como OCR-7B. OCR-7B todavía se usa hoy en la industria financiera para la fuente estándar utilizada en tarjetas de crédito y tarjetas de débito. En la década de 1960, los servicios postales de varios países comenzaron a utilizar la tecnología OCR para acelerar enormemente la clasificación del correo, incluidos Estados Unidos, Gran Bretaña, Canadá y Alemania. OCR sigue siendo la tecnología central utilizada para clasificar el correo para los servicios postales de todo el mundo. En 2000, se utilizó el conocimiento clave de los límites y capacidades de la tecnología OCR para desarrollar los programas CAPTCHA utilizados para detener a los bots y a los spammers.

A lo largo de las décadas, el OCR se ha vuelto más preciso y más sofisticado debido a los avances en áreas tecnológicas relacionadas, como la inteligencia artificial, el aprendizaje automático y la visión artificial. Hoy en día, el software OCR utiliza el reconocimiento de patrones, la detección de características y la extracción de texto para transformar documentos de forma más rápida y precisa que nunca.

Preguntas Frecuentes

    ¿Cómo puedo escanear documentos con mi teléfono o tableta?

    En iOS, abra la aplicación Notas y cree una nueva nota. Abra la cámara y luego toque Escanear documentos. En Android, abra Google Drive y seleccione Plus (+), luego toque Scan para escanear el documento con su teléfono.

    ¿Cómo uso OCR en Adobe Acrobat?

    Abra un archivo PDF que contenga una imagen escaneada, luego seleccione Herramientas > Editar PDF. Acrobat aplicará automáticamente OCR para que pueda editar el texto. Simplemente seleccione dónde desea realizar ediciones y comience a escribir.

    ¿Cuál es la diferencia entre OCR y OMR?

    El reconocimiento óptico de marcas (OMR) es un software que detecta marcas en papel, generalmente una hoja de burbujas. OMR se utiliza para procesar los resultados de exámenes, encuestas, cuestionarios e incluso elecciones. A diferencia de OCR, OMR no puede descifrar las marcas en la página, solo verifica que las marcas estén allí.

Recomendado: