Blog

Background top
OCR2
Dic 13, 2021
Tecnología

La tecnología OCR en la verificación de identidad

Hoy hablamos de la tecnología OCR en las soluciones de verificación de identidad a distancia.

⚠️⚠️⚠️ A modo recordatorio

La tecnología OCR, del inglés Optical Character Recognition, hace editable el texto de impresiones digitales. Se trata de una herramienta capaz de extraer información escrita en documentos escaneados, archivos jpg, texto escrito o documentos impresos. El OCR captura la información de un documento y, a continuación, la extrae y transforma los datos a un formato legible por máquina para su posterior procesamiento y análisis.

¿Por qué es importante la tecnología OCR en la verificación de identidad online?

Las soluciones de verificación de identidad incluyen diversas tecnologías, como la inteligencia artificial, el aprendizaje automático, el OCR o la prueba de vida. La combinación de tecnologías, incluido el OCR, permite automatizar el proceso de verificación de identidad y trasladarlo al entorno digital.

La tecnología OCR es importante en los procesos de verificación de identidad porque extrae los datos relevantes del documento de identidad.

Gracias a que la tecnología OCR forma parte de las soluciones de verificación de identidad online, el usuario final sólo tiene que mostrar su documentación de identidad a la cámara de su dispositivo. Automáticamente, el OCR captura toda la información necesaria para la verificación, el usuario no tiene que teclear ni introducir ningún tipo de información. Sin esta tecnología, el propio usuario tendría que rellenar sus datos manualmente.

El OCR agiliza el proceso de extracción de datos, lo que se traduce en una reducción de los tiempos de registro y una experiencia del cliente más fluida.

Además, la tecnología OCR es crucial para determinar si el documento a verificar es auténtico o no. Combinada con la inteligencia artificial y el machine learning, es la parte de la solución que se encarga de extraer los datos que se cotejan con plantillas de documentos oficiales y que se busca en bases de datos. Sin una tecnología capaz de convertir la información de los documentos de identidad a un lenguaje comprensible para el sistema informático, no sería posible el proceso de verificación.  

El desafío de la tecnología OCR en la verificación de identidad

La tecnología OCR se diseñó inicialmente para capturar y extraer datos de texto en negro sobre un fondo blanco.

Implementar el OCR en la verificación de identidad supone un desafío, ya que, se enfrenta a una tarea mucho más completa y aleatoria (los documentos de identidad de cada país son distintos): ha de extraer campos de datos complejos con fuentes pequeñas, hologramas, marcas de agua, fondos variados, etc. Y no solo eso, además de identificar la información importante, ha de estructurarla y verificarla.

Las tecnologías OCR, como su propio nombre indica, se basan en el reconocimiento óptico de caracteres, es decir, distinguen caracteres (letras, números, símbolos, etc.). Pero para poder distinguir o reconocer esos caracteres, es necesario que haya un trabajo previo, en el que se entrena la tecnología.

Durante el entrenamiento del sistema, se almacenan los elementos o caracteres que se necesita que reconozca el OCR (por ejemplo, tipos de fuente, hologramas, fondos, etc.), además de las plantillas de los documentos de identidad a verificar (por ejemplo, DNI español).

Durante un proceso de verificación de identidad, cuando un usuario captura una foto de su documento de identidad con su teléfono móvil o una cámara web, el sistema ha de tener registrada la plantilla oficial del documento de identidad, y los caracteres y demás elementos. Solo así, podrá detectar qué tipo de documento es y, a continuación, estructurar correctamente la información que tiene que extraer.

Básicamente, las tecnologías OCR analizan documentos e imágenes, pixel a pixel para encontrar los caracteres que tienen interiorizados. Se puede decir que funcionan de un modo similar a las tecnologías de reconocimiento facial, porque el sistema también busca coincidencias con la información que tiene almacenada.

Cómo solucionamos este desafío en Alice

En Alice nos esforzamos por entender los problemas reales de las tecnologías que desarrollamos para poder amoldar nuestras soluciones a la realidad. Llevamos más de 10 años desarrollando tecnología y adaptándonos a problemas reales, por eso entendemos cualquier reto tecnológico como un elemento dinámico. Como cualquier tecnología, la clave se encuentra en la mejora continua y en la adaptación a las circunstancias.

Concretamente, en el caso del OCR, contamos con dos ases bajo la manga.

  1. Evaluamos, analizamos y entrenamos nuestros algoritmos continuamente, lo que nos permite detectar y extraer caracteres con un 90 % de precisión. Nuestra tecnología OCR es capaz de reconocer más de 150 idiomas, más de 120 documentos de identidad, más de 301 permisos de conducir, etc.
  2. Somos propietarios de nuestra tecnología, lo que nos permite ser muy ágiles a la hora de hacer cambios e incorporar nuevos datos. ¡Incluimos cualquier documento de identidad en menos de 24 h!

Si quieres saber más sobre nosotros, ¡síguenos en LinkedIn!