(Por Jorge Aballay) Términos como análisis de texto, seguimiento de opiniones y procesamiento del lenguaje natural se utilizan ampliamente hoy en día, y aunque estos temas pueden parecer excesivamente complejos, cuando se los desglosa apropiadamente, resultan sorprendentemente accesibles.
¿Qué es el análisis de textos?
El análisis de texto es el proceso de tomar información escrita y transformarla en elementos de datos que se pueden rastrear y medir. La idea es obtener datos cuantitativos a partir de información cualitativa no procesada para descubrir tendencias y patrones dentro del texto. La IA permite que esto se haga de forma automática y a una escala masiva, en lugar de que las personas examinen una cantidad similar de datos en forma manual.
Expresado de otra manera, es el proceso de derivar el significado del texto y las comunicaciones escritas representados como datos no estructurados para medir cosas como opiniones y comentarios de los clientes, de los usuarios, de los proveedores, reseñas de productos, informes de empresas y mucho más. Además, es un método para convertir grandes cantidades de datos no estructurados en algo que se pueda comprender, analizar y crear conocimiento adicional para la toma de decisiones.
Ahora bien, como interviene este tipo de análisis en la Supply Chain, donde por su historia está configurada para la explotación de datos, que en general están perfectamente estructurados. Para poder contestar esta pregunta, empecemos por ver los beneficios del análisis de textos.
Los beneficios de usar Análisis de Textos
Hay varios aspectos que contribuyen a obtener beneficios de la obtención de textos de aplicaciones de servicios como SCM, CRM, SRM, de redes sociales, o cualquier otro sistema que recupere información de los comentarios de los usuarios, clientes y proveedores, veamos algunos:
1, Identificar las características de los problemas o fuente de satisfacción.
Con las respuestas a preguntas realizadas en distintas aplicaciones, los clientes tienen la oportunidad de expresar qué les satisface o no y por qué. Por caso, si los usuarios abandonan el proceso de compras o anulan un producto, su análisis de texto podría revelar las motivaciones. Lo mismo en los comentarios que dejan sobre un producto en los hilos de consultas en la mesa de ayuda.
2. Facilita que surjan las tendencias emergentes en donde muchas encuestas de retroalimentación no permiten visualizar el comportamiento.
El análisis de texto ayuda a los analistas a visualizar las categorías de comentarios y su tendencia y a resolverlas de manera proactiva.
3. Los problemas detectados se pueden priorizar de forma rápida y eficaz.
Al identificar las palabras que se utilizan con más frecuencia o al utilizar pares de palabras, se sabrá de inmediato en qué áreas debe concentrarse o en qué áreas se destaca.
4. Las ideas y sugerencias de los clientes y proveedores se materializan, lo que lleva a una experiencia digital mejorada.
Las opiniones y pensamientos que nunca habría escuchado de otra manera salen a la superficie, lo que permite brindar una experiencia de cliente óptima y en el otro extremo a establecer mejores relaciones con los proveedores. Estas surgen de las reseñas en línea y las menciones sociales.
5. Gestionar el riesgo a través de la investigación industrial a gran escala y la recopilación de datos.
6. Investigar datos demográficos específicos para desarrollar redes de servicios más precisas
El porqué de la integración de la supply chain con herramientas de análisis de textos
Si bien nuestros lectores están habituados y cuentan con los conocimientos suficientes sobre supply chain, permítanme repasar algunos conceptos que permitirán enlazar las ideas.
Es sabido que las supply chains son cada vez más globales y complejas. Partes sustanciales de la creación valor se subcontrata a proveedores que a su vez también subcontratar a otros proveedores secundarios. Como resultado, el desempeño de una empresa depende cada vez más del rendimiento de su red de suministro y en consecuencia las empresas individuales son impulsadas a dejar de competir como entidades exclusivamente autónomas, sino más bien como supply chains integradas a otras supply chains.
Como también emergen continuamente redes de suministro distribuidas geográficamente en varios niveles, las empresas pierden gradualmente visibilidad de la cadena lo cual impacta negativamente en la capacidad de la empresa para gestionar la eficiencia, la resiliencia y sostenibilidad de su supply chains.
La visibilidad de la supply chains estructural a menudo es limitada: en general es difícil contar con información de la supply chains más allá de sus proveedores y clientes directos.
La visibilidad de la cadena es una combinación de múltiples factores y la razón principal es que los proveedores no divulgan su propia red de suministro a sus clientes, especialmente si corren el riesgo de ser eliminados como intermediarios o de perder el poder de negociación. La dificultad de la obtención de los datos requeridos para analizar la supply chain se ve agravada por el hecho de que las mismas son dinámicas.
Estos temas lo hemos trabajado intensivamente a través de los seminarios y cursos en el IEEC donde aplicamos los conceptos del Dr. Douglas Lambert y otros reconocidos autores, combinados con los modelos de procesos de la supply chain mediante SCOR.
Para paliar estos inconvenientes se utilizan tecnologías de rastreo como RFID o más recientemente con el uso de blockchain se logra aumentar la visibilidad general de la supply chains, pero las tecnologías de seguimiento no pueden descubrir lo que de otro modo sería desconocido como son los participantes de la supply chains y sus interrelaciones que no están conectados a través de procesos formales.
Técnicas de análisis de texto
Hay una diversidad de métodos que se utilizan en las empresas para analizar textos y datos no estructurados. Repasemos brevemente que significan,
Los datos estructurados están organizados y formateados de manera que se pueden buscar fácilmente en las bases de datos, por el contrario, los datos no estructurados no tienen un formato u organización predefinidos, lo que hace que sea mucho más complicado de recopilar, agrupar, procesar y analizar.
El análisis de textos se utiliza justamente sobre ese último tipo de datos, para analizar y desglosar el contenido de comentarios en campos de texto abiertos, permitiendo la categorización, agrupamiento, reconocimiento de patrones, etiquetado y visualización.
Para realizar estas tareas se utiliza el procesamiento de lenguaje natural (NLP, por sus siglas en inglés), que es un área multidisciplinaria (de las ciencias de la computación, inteligencia artificial y lingüística aplicada) que se encarga de estudiar las interacciones que existen entre personas y computadoras mediante algún lenguaje humano.
Metodología general de análisis
1. Frecuencia de palabras (recuento de palabras)
Se trata simplemente del conteo de las palabras y se llevan a un ranking con la frecuencia con la que se mencionan.
Con esta simple acción se pueden identificar temas comunes que surgen entre los usuarios, esto se puede ver en los contadores de los procesadores de textos o en las técnicas de nubes de palabras.
2. Agrupación de palabras (o emparejamiento de palabras)
A menudo, un grupo de palabras puede proporcionarle más información que una sola palabra. Cuando se agrupan palabras como “delivery”, “tarde”, “falla”, podría inferirse que hay clientes que piensan que el servicio de entrega es ineficiente.
3. Análisis de opiniones
Habiendo aplicado las técnicas anteriores, ahora sabe con qué frecuencia ocurren ciertas palabras y cómo se agrupan, pero ¿esta retroalimentación es positiva, negativa o neutral?
Afortunadamente, es probable que los clientes brinden comentarios sobre temas que les interesan, por lo que, con la herramienta adecuada en su lugar, evaluar la opinión no debería ser un problema.
El análisis de opiniones es un campo dentro del procesamiento del lenguaje natural (PLN) que permite al analista medir el nivel de los comentarios estableciendo un rango del uso de las palabras positivas, negativas y neutrales.
Comprensión de los comentarios de los clientes
Demos un vistazo a los ejemplos que están a continuación para conocer algunos de los pasos y procesos más comunes que realizan las máquinas para “comprender” la información, y cómo el análisis de texto puede ayudar a su negocio al procesar a escala información valiosa.
Supongamos que una empresa lanza un nuevo producto y quiere saber cómo se sienten sus usuarios al respecto. Pueden recopilar reseñas en línea, debates en redes sociales y comentarios de encuestas para averiguarlo. Sin embargo, a los analistas les llevaría horas, si no días, analizar todos estos comentarios e identificar patrones. En cambio, el análisis textual respaldado por la IA puede clasificar la retroalimentación cualitativa para identificar patrones y asignar medidas cuantitativas que se puedan comparar más fácilmente.
Marketing dirigido: las herramientas de análisis de texto se pueden utilizar para investigar segmentos de audiencia, identificar sus intereses, creencias, hábitos de compra y visualización en línea, y más. Esto ayuda a las empresas a crear personas compradoras más precisas y específicas, y les ofrece servicios que están mejor personalizados.
Gestión de riesgos: las instituciones financieras utilizan el análisis de texto para decidir si otorgan o no préstamos a determinadas empresas. Al analizar información de base cualitativa, como artículos de noticias, publicaciones en redes sociales e informes de analistas con IA, los servicios financieros pueden obtener una imagen más clara de su potencial cliente y el nivel de riesgo que representan como inversión. Lo mismo se presenta a espejo con los proveedores.
Por supuesto que aparte de los ejemplos anteriores, hay muchas otras formas en que las empresas utilizan el análisis de texto en las diferentes industrias.
¿Cómo trabaja el análisis de textos en un nivel básico?
Las máquinas procesan el lenguaje mediante:
El etiquetado de oraciones: asigna una parte del discurso a cada palabra,
“la veloz corredora”, se separa en artículo, adjetivo y sustantivo.
El fragmentado: divide las oraciones en frases basadas en partes del discurso,
” la veloz corredora va a la maratón en bicicleta” se separa en sintagma nominal, sintagma verbal, sintagma preposicional.
Recordemos que un sintagma es una unidad lingüística formada por una o varias palabras que desempeña una función sintáctica. El sintagma es una unidad menor que la oración y mayor que la palabra.
El análisis separa los elementos que pueden tener diferentes significados en una sola oración,
“la corredora está de viaje en avión, pero su hermano menor está celoso”, se separa en emociones positivas y emociones negativas.
Finalmente, para refinar este proceso, el usuario puede asesorar al sistema en función de si los comentarios se categorizaron de la manera correcta o no. Esto se hace mediante el aprendizaje automático supervisado, que es esencialmente una forma de entrenar al sistema para que haga lo que se desea, proporcionándole ejemplos de los que aprender. Con el tiempo, la categorización automatizada mejora en función de los comentarios de los usuarios.
Conclusión
Si bien los datos directos de la supply chains de las empresas son escasos, hay una enorme cantidad de datos disponibles en Internet y la World Wide Web en la actualidad. Una parte importante de estos datos contiene información esencial sobre las supply chains y la posición competitiva de las empresas. Sin embargo, esta información está presente principalmente en fuentes, como páginas web, artículos de noticias o publicaciones en redes sociales, escritas en lenguaje natural.
La extracción de información de la supply chains de estas fuentes es un gran desafío; sin embargo, los avances recientes en el procesamiento del lenguaje natural y el aprendizaje automático abren el camino para su explotación.
En un próximo artículo, mostraré como se realiza un proceso de análisis de datos utilizando el lenguaje Python y los algoritmos apropiados para obtener un primer análisis de datos no estructurados.