Extracción de información de documentos de identidad utilizando técnicas de aprendizaje de máquina

MAMárquez Aristizábal, Hugo Alejandro

Harbin Institute of Technology

Abstract

La extracción automática de información de documentos de identidad es una tarea fundamental en diferentes procesos digitales como registros, solicitud de productos, validación de identidad, entre otros. La extracción de información consiste en la identificación, ubicación, clasificación y reconocimiento del texto de campos clave presentes en un documento, en este caso un documento de identidad. Tratándose de documentos de identidad, los campos clave son aquellos como: nombres, apellidos, números de documento, fechas, entre otros. El problema de extracción de información se ha solucionado tradicionalmente utilizando algoritmos basados en reglas y motores clásicos de OCR. En los últimos años se han realizado…

Citation impact

609
total citations
FWCI
Percentile
References
35
Citations per year

Authors

1
  • MA
    Márquez Aristizábal, Hugo AlejandroCorresponding

    Harbin Institute of Technology

Topics & keywords

Keywords
  • Computer science
  • Training (meteorology)
  • Information retrieval
  • Image (mathematics)
  • Document layout analysis
  • Natural language processing
  • Artificial intelligence
  • Multimedia
UN Sustainable Development Goals
  • Quality Education
No related works found for this paper.