Cómo elegir la mejor solución para la captura de datos empresariales | NTT DATA

ma., 25 octubre 2022

Cómo elegir la mejor solución para la captura de datos empresariales

Las empresas quieren mejorar: procesos, costes, ventas, experiencia del cliente. Y para ello se necesita conocimiento, pero, sobre todo, datos de los que extraer ese conocimiento. La captura de datos es el proceso de recogida para convertirlos en información que pueda ser analizada por un ordenador.

Y dado el ingente volumen de información que se recoge, este solo se puede gestionar de forma viable y racional a través de la captura automatizada. Esto supone para la mayoría de las empresas una gran oportunidad de mejora ya que permite priorizar los elementos relevantes para cada negocio, presentes en la comunicación con los clientes, facilitando búsquedas complejas, apoyando la toma de decisiones estratégicas, reduciendo procesos, minimizando errores…

Pero ¿cómo pueden las soluciones de captura de datos aportar valor a un negocio?

La captura de datos aporta un valor diferencial a cualquier empresa que maneje gran cantidad de información. Por ejemplo, en el caso de una empresa de seguros, acostumbrada a lidiar con certificados médicos, la captura de datos cognitivos podría seleccionar, en apenas segundos, qué personas podrían ser incluidas en ciertas garantías o descuentos.

Como es habitual, las empresas médicas que emiten esos certificados suelen ser diferentes y, las plantillas que utilizan, también. Una captura de datos inteligente no se basaría en las plantillas o en cómo está estructurada o redactada la información. Después de todo, en una plantilla podría decirse que una persona tiene ciertas características físicas en el primer párrafo y, en otra plantilla, en el tercero. Además, en una plantilla para referirse a una morfología atlética podría utilizarse la palabra “ectomorfo” y, en otra, la palabra “asténico”.

La mejor captura de datos es capaz de abstraerse de esas plantillas, entender el contenido y buscar la información que la empresa necesita. Pero incluso la captura de datos podría detectar la fecha de expedición y de expiración del certificado. Si hubiese caducado, lo detectaría al momento y alertaría del problema al instante.

¿Cuáles son los métodos avanzados de captura de datos?

Existen múltiples aplicaciones para capturar datos que se adaptan a los distintos tipos de estructura de la información. En el caso de la solución Dolffia de NTT DATA los siguientes módulos están disponibles para las diferentes capturas de información, siendo una de las más completas del mercado.

1. Clasificación de aprendizaje automático

La clasificación de aprendizaje automático es un proceso de categorización de un conjunto de datos en clases. Se trata de una herramienta de captura de datos de cualquier tipo. El proceso se inicia con la predicción de las clases de los datos. Las clases a menudo se denominan objetivo, etiqueta o categorías.

Entendámoslo mejor con un ejemplo. Una gran compañía eléctrica nacional, procesaba más de 300.000 documentos de 49 tipos al año para dar de alta a los nuevos clientes. Esto se revisaba manualmente por un equipo de personas que verificaban la información para aprobar o rechazar la solicitud. Con la solución Dolffia consiguieron incrementar un 90% el procesado de documentación automática, reduciendo el tiempo de espera del cliente online y minimizando también las reclamaciones ya que se ha aumentado la precisión a un 95%.

2. Procesamiento natural del lenguaje (NLP)

El procesamiento del lenguaje natural (NLP) es, a pesar de su aparente novedad, una disciplina con más de 50 años de desarrollo. A través de la modelización matemática de distintas lenguas, se crean patrones de comunicación entre las máquinas y las personas.

Este proceso de modelización implica que los lingüistas computacionales “preparan” el modelo lingüístico y los ingenieros informáticos lo implementan en un código eficiente y funcional generando contexto e intencionalidad para el posterior estudio. El resultado es el análisis de cualquier dato ya sean opiniones, temas relevantes, errores… para crear patrones de búsqueda y ofrecer soluciones predictivas a través de la comprensión del lenguaje natural (NLC) y mediante la posterior generación de lenguaje natural (GNL), que traduzca esos datos a conocimiento lingüístico.

La comprensión del lenguaje natural (NLC) es la parte del procesamiento de la información que permite leer, interpretar, entender el significado, el contexto y la intención de un texto. Una vez se entiende el significado, la GNL dota a la máquina de la habilidad de crear mensajes autónomos a raíz de los datos analizados. La generación del lenguaje natural (GNL) es el gran reto de la AI. Se trata de la idea de que los ordenadores capten y entiendan información que no está en lenguaje natural (por ejemplo, hojas de cálculo de una hoja de Excel) y crear resultados en lenguaje natural complejo que parezca humano.

3. Reconocimiento óptico de caracteres (OCR)

El reconocimiento óptico de caracteres es un proceso capaz de convertir una imagen tipográfica en un formato de texto que pueda leer una máquina. Es decir, se convierte la imagen en un documento con su contenido como datos de texto.

El sistema OCR es muy recomendable en departamentos de diferentes sectores verticales que muevan gran cantidad de documentación cuya gestión y almacenaje suele llevar mucho tiempo. Hablamos de formularios impresos, facturas, documentos legales escaneados o contratos impresos.

El reconocimiento de patrones abarca campos como el del reconocimiento de la escritura manual, algo especialmente complejo ya que se trata de procesar caracteres no tipificados (no estándar). Una misma letra, por ejemplo, escrita por dos personas distintas, a pesar de tener el mismo valor o significado, puede ser visualmente muy distinta.

4. Ontologías

Los sistemas de información tienen que lidiar con una cantidad cada vez mayor de datos que son heterogéneos, no estructurados o incompletos. Para alinear y completar los datos, los sistemas pueden basarse en taxonomías y conocimientos previos que se proporcionan en forma de ontología. La ontología es la creación de un ecosistema de conceptos que incluye jerarquías, clases y rangos y que permite interrelacionar los distintos elementos de manera automática. Por ejemplo, cuando se realizan búsquedas en Internet “cerca de mí”.

5. Arquitectura de microservicios

La arquitectura de microservicios es un método que permite el desarrollo de aplicaciones software de manera flexible y que funciona como, su propio nombre indica, en una estructura de pequeños servicios autónomos y complementarios. Cada uno de estos servicios realiza funcionalidades concretas que funcionan independientemente del resto de servicios pero que, al mismo tiempo, se comunican entre sí.

Esto permite que se puedan analizar partes independientes más pequeñas que se comunican entre sí a través de interfaces sencillas con el objetivo de solventar problemas o incidencias.

Por ejemplo, el procesamiento de pagos y la gestión de pedidos pueden separarse como unidades de servicios independientes. Gracias a esta separación, los pagos se seguirán aceptando, aunque haya problemas con la facturación.

6. Desambiguación de conceptos

La desambiguación de conceptos es uno de los principales desafíos de los sistemas de procesamiento del lenguaje natural (NLP). Abarca desde la ambigüedad léxica y semántica hasta estructuras más complejas, como las metáforas.

Desde un punto de vista conceptual, la desambiguación es el proceso de determinar el significado más probable de una frase específica.

Estos son algunas de las funcionalidades de las aplicaciones de la captación de datos. Lo cierto es que cada sector o empresa no las necesita todas y solo aquellas definidas por las idiosincrasias propias de su negocio. Pero también es cierto que la velocidad y el avance en el análisis de datos nos hacen prever que lo que no se necesita hoy quizás es necesario mañana. Y cualquier sistema de captación de datos necesita una implementación previa que defina los parámetros por los que se van a analizar estos datos.

Dolffia: la solución de captura de datos cognitivos todo en uno

Dolffia es la plataforma de NTT DATA para el procesado de información desestructurada basada en la IA capaz de entender la información, aprender de ella y, a partir de esos dos pasos básicos, ayudar en la toma de decisiones a la persona o empresa que la usa.

Dolffia ofrece diferentes servicios de captura de datos que se adaptan a cada cliente o a cada caso de uso. Es decir, no es una solución cerrada, es una plataforma con capacidades del lenguaje que puede realizar, de manera automatizada, cualquier tarea basada en el lenguaje, solucionando así la captura de datos en cualquier empresa independientemente del sector en el que esté.

Dolffia, es uno de los softwares más versátiles del mercado para la captura y procesamiento de datos, formando parte de Syntphony de NTT DATA, un ecosistema tecnológico de soluciones TIC que permiten reducir costes y mejorar el tiempo de lanzamiento de productos y servicios en sectores tan diferentes como salud, banca, automoción, o sector público, entre otros.

Más información aquí.