¿Qué es reconocimiento óptico de caracteres (OCR)?

Muchas veces hemos recibido documentos en el famoso formato “PDF”, pero puede existir conflicto si se necesita manejar la información que contiene dicho documento, por ejemplo: traducirlo.

En los “viejos tiempos” se tenía a una persona capturando en la computadora todo el texto del documento, arreglando el formato (para que quedara justo como el orginal) y después se realizaba la traducción, hoy se cuenta con la ayuda de herramientas especializadas para agilizar estos procesos y uno de ellos es el reconocimiento óptico de caracteres o por sus siglas en inglés OCR (Optical Character Recognition).

Esto es un proceso dedicado a los textos digitalizados, los programas identifican automáticamente a partir de una imagen, símbolos o caracteres que pertenecen a un determinado alfabeto, para luego almacenarlos en forma de datos y así poder manejarlos, copiarlos, editarlos, etc.

En los últimos años la digitalización de la información (textos, imágenes, sonido, etcétera) se ha convertido en la forma más fácil de crear y compartir contenido. Específicamente en los textos, existen y se generan continuamente grandes cantidades de información escrita, tipográfica o manuscrita en todo tipo de archivos. En esta área, para poder automatizar la introducción de caracteres sin que se utilice el teclado implica un importante ahorro de recursos humanos y un aumento de la productividad, al mismo tiempo que se mantiene, o incluso se mejora, la calidad de muchos servicios.

Una vez que los documentos a traducir se encuentran en un formato editable, es mucho más fácil procesarlos en alguna herramienta de TAC (traducción asistida por computadora) para poder agilizar la tarea de traducción.

Si hay duda en cómo traducir archivos PDF en Trados Studio haga clic aquí.