ıllı Internet y Tecnologías de la Información (2018)

internet, Hosting, dominios, seo, antivirus, banco de imágenes, páginas web, tiendas online

[Enciclopedia Online Gratuita] Diccionario de Internet y Tecnologías de la Información y la Comunicación (TIC):

ıllı Reconocimiento óptico de caracteres wiki: info, historia y vídeos

videos internet

salud  Reconocimiento óptico de caracteres 


El reconocimiento óptico de caracteres (ROC), normalmente conocido como reconocimiento de caracteres y expresado con cierta frecuencia con la siglaOCR (del inglés Optical Character Recognition), es un proceso dirigido a la digitalización de textos, los que identifican de forma automática desde una imagen símbolos o bien caracteres que pertenecen a un determinado abecé, para entonces guardarlos en forma de datos. De este modo vamos a poder interaccionar con estos a través de un programa de edición de texto o bien afín.


En los últimos años la digitalización de la información (textos, imágenes, sonido, etc.) ha devenido un punto de interés para la sociedad. En el caso específico de los textos, existen y se producen de forma continua grandes cantidades de información escrita, tipográfica o bien manuscrita en todo género de aguantes. En este contexto, poder mecanizar la introducción de caracteres eludiendo la entrada por teclado implica un esencial ahorro de recursos humanos y un incremento de la productividad, al tiempo que se sostiene, o bien hasta se mejora, la calidad de muchos servicios.


El proceso básico que se hace en el ROC es transformar el texto que aparece en una imagen en un fichero de texto que va a poder ser editado y usado como tal por cualquier otro programa o bien aplicación que lo necesite.


Partiendo de una imagen perfecta, o sea, una imagen con solo 2 niveles de gris, el reconocimiento de estos caracteres se efectuará esencialmente comparándolos con unos patrones o bien plantillas que poseen todos y cada uno de los posibles caracteres. Ahora bien, las imágenes auténticas no son perfectas, por ende el ROC se halla con múltiples problemas:



  • El dispositivo que consigue la imagen puede introducir niveles de grises en el fondo que no pertenecen a la imagen original.
  • La resolución de estos dispositivos puede introducir estruendos en la imagen, afectando los pixeles que deben ser procesados.
  • La distancia que aparta a unos caracteres de otros, al no ser siempre y en toda circunstancia exactamente la misma, puede generar fallos de reconocimiento.
  • La conexión de 2 o bien más caracteres por pixeles comunes asimismo puede generar fallos.

Todos los algoritmos de ROC tienen la finalidad de poder distinguir un texto de una imagen cualquiera. Para hacerlo se fundamentan en 4 etapas:



  1. Binarización.
  2. Fragmentación o bien segmentación de la imagen.
  3. Adelgazamiento de los componentes.
  4. Comparación con patrones.

La mayor una parte de algoritmos de ROC parten como base de una imagen binaria (2 colores). Por consiguiente es recomendable transformar una imagen de escala de grises, o bien una de color, en una imagen en blanco y negro, de tal manera que se conserven las propiedades esenciales de la imagen. Una forma de hacerlo es a través de el histograma de la imagen, donde se muestra el número de pixeles para cada nivel de grises que aparece a la imagen. Para binarizarla debemos seleccionar un umbral conveniente, desde el como todos y cada uno de los pixeles que no lo superen se transformarán en negro y el resto en blanco.


Mediante este proceso conseguimos una imagen en blanco y negro donde quedan meridianamente marcados los contornos de los caracteres y símbolos que contiene la imagen. Desde acá podemos aislar las unas partes de la imagen que poseen texto (más transiciones entre blanco y negro).


Fragmentación o bien segmentación de la imagen


Este es el proceso más costoso y preciso para el siguiente reconocimiento de caracteres. La segmentación de una imagen implica la detección a través de procedimientos de “etiquetadodeterminista” o bien estocástico de los contornos o bien zonas de la imagen, basándose en la información de intensidad o bien información espacial.


Permite la descomposición de un texto en diferentes entidades lógicas, que deben ser suficientemente constantes, para ser independientes del escritor, y suficientemente significativas para su reconocimiento.


No hay un procedimiento genérico para hacer esta segmentación de la imagen que sea suficientemente eficiente para el análisis de un texto. Si bien las técnicas más usadas son alteraciones de los métodos basados en proyecciones lineales.


Una de las técnicas más tradicionales y simples para imágenes de niveles de grises consiste en la determinación de los modos o bien agrupamientos (clústeres) desde el histograma, de tal modo que dejen una clasificación o bien umbralización de los pixeles en zonas homogéneas.


Adelgazamiento de los componentes


Una vez apartados los componentes conexos de la imagen, se les deberá aplicar un proceso de adelgazamiento para cada uno de ellos de ellos. Este procedimiento consiste en ir borrando consecutivamente los puntos de los contornos de cada componente de manera que se conserve su tipología.


La supresión de los puntos debe continuar un esquema de barridos consecutivos a fin de que la imagen prosiga teniendo exactamente las mismas proporciones que la original y de esta forma lograr que no quede irregular.


Se debe hacer un barrido paralelamente, esto es, indicar los pixeles borrables para quitarlos todos al unísono. Este proceso se hace para hacer posible la clasificación y reconocimiento, facilitando la manera de los componentes.


Comparación con patrones


En esta etapa se equiparan los caracteres logrados previamente con unos teóricos (patrones) guardados en una base de datos. El buen funcionamiento del ROC se fundamenta en buena medida en una buena definición de esta etapa.


Existen diferentes métodos para realizar la comparación. Uno de ellos es el procedimiento de proyección, en el que se consiguen proyecciones verticales y horizontales del carácter por reconocer, y se equiparan con el abecedario de caracteres posibles hasta localizar la máxima coincidencia.


Existen otros métodos, como por ejemplo:



  • Métodos geométricos o bien estadísticos.
  • Métodos estructurales.
  • Métodos neuromiméticos.
  • Métodos markovianos (modelo escondo de Márkov).
  • Métodos de Zadeh.

Desde la aparición de los algoritmos de ROC, han sido muchos los servicios que han introducido estos procesos para acrecentar su desempeño y otros que se fundamentan absolutamente en estas tecnologías. Ahora se muestran ciertas más resaltables aplicaciones que emplean el ROC.


Reconocimiento de texto manuscrito


Las contrariedades que podemos localizar en el momento de reconocer un texto tipografiado, no se pueden cotejar con las que aparecen cuando deseamos reconocer un texto manuscrito. No todos escribimos de forma uniforme, y no todos escribimos de igual modo. El reconocimiento de este géneros de textos sigue siendo un reto. Para abordar esta clase de inconvenientes se han desarrollado técnicas y aplicaciones concretas a las que se les llama Reconocimiento inteligente de caracteres o bien ICR (del inglés Intelligent Character Recognition).


Aunque el texto se compone esencialmente de caracteres individuales, la mayor parte de algoritmos ROC no logran buenos resultados, puesto que la segmentación de texto progresivo es un procedimiento complejo.


En el caso de reconocimiento de escritura manuscrita en el momento de corrección de exámenes, existe la posibilidad, agregando un listado de léxico (nombres y apellidos) de acercarse al cien por ciento de acierto. Mediante las casillas de contestación ICR se pueden reconocer palabras, como nombres de países, nombres de zonas, marcas comerciales, resumiendo, todo lo que pueda ser integrado en una lista de palabras (léxico), el que puede ir aumentándose conforme las necesidades.


En el planeta real, en ocasiones se puede llegar a entender una oración cuando la hemos terminado de leer. Mecanizar este proceso implica una operación de niveles morfológico, léxico y sintáctico que se logra a través de el reconocimiento del habla continua. Para realizar esa metodología, se usan algoritmos robustos que utilizan una segmentación anterior, debido a que se consigue de manera automática con la descodificación.


Para facilitar el reconocimiento en ocasiones la tecnología ICR requiere que en el documento se tengan recuadros en los que se introducen los caracteres manuscritos, siendo obligatorio un carácter por recuadro. Frecuentemente se usa para formularios que debemos rellenar a mano y debemos poner en letras mayúsculas.[1]?


Reconocimiento de matrículas


Una de las aplicaciones son los radares. Estos han de ser capaces de encontrar una matrícula de un vehículo con condiciones de iluminación, perspectiva y ambiente variables.


En la etapa de segmentación, se procuran texturas afines a la de una matrícula y se aísla el área cuadrangular que forma la matrícula.


Finalmente, se aplica un proceso de clasificación múltiple sobre el conjunto de pixeles pertenecientes a la matrícula, dando una cadena de caracteres que se deben ajustar a un modelo conocido: el formato de una matrícula. Si aparece algún fallo, es corregido.


Indexación con bases de datos


Con el enorme incremento de información publicada que ha tenido sitio en los últimos tiempos, son cada vez más los métodos que se emplean para organizar todo este material guardado en bases de datos. Uno de estos contenidos son las imágenes. Una de las maneras más corrientes de buscar imágenes es desde metadatos introducidos manualmente por los usuarios. Hoy en día han aparecido buscadores web que dan la posibilidad de buscar imágenes a través de el texto que aparecen en ellas, como el buscador DIRS (Document Image Retrieval System) que, a través de un algoritmo de ROC, extrae el texto que aparece en la imagen y lo usa como metadato que va a poder valer para las buscas. Esta tecnología da una posibilidad en la busca de imágenes y prueba que el ROC todavía puede dar mucho de sí.


Reconocimiento de datos estructurados con ROC Zonal


Se utiliza para digitalizar de forma masiva grandes cantidades de documentos estructurados o bien semiestructurados (facturas, nóminas, recibos, pólizas, justificantes bancarios, etc.), catalogando de manera automática los documentos con los metadatos logrados y archivándolos en formato digital de forma indizada para facilitar su siguiente busca. Tiene el inconveniente de que es preciso diseñar anteriormente las plantillas, mas con una buena configuración se ahorra un buen tiempo en el proceso de digitalización.


  ELIGE TU TEMA DE INTERÉS: 


autoayuda.es   Internet y Tecnologias 

Está aquí: Inicio > [ INTERNET ] > ıllı Reconocimiento óptico de caracteres wiki: info, historia y vídeos

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Ver políticas