ImpactU Versión 3.11.2 Última actualización: Interfaz de Usuario: 16/10/2025 Base de Datos: 29/08/2025 Hecho en Colombia
Análisis de la percepción de la calidad de tres empresas colombianas de telefonía móvil en Twitter, mediante técnicas de minería de texto y analítica de negocios
Este documento presenta una solución a un caso teórico-práctico en la red social Twitter empleando técnicas de minería de texto y analítica de negocios en el software gratuito y de código abierto para ciencia de datos, investigación científica y comunicación técnica R. Para esto, se desarrolló un ejercicio aplicado a las empresas de Telecomunicaciones Claro, Movistar y Tigo, debido a la cantidad de datos y al dinamismo económico que estas compañías presentan actualmente en Colombia. Para llevar a cabo esta investigación se requirió realizar una revisión exhaustiva de diversas temáticas como minería de texto, análisis de sentimientos, vigilancia empresarial, analítica de negocios, visualización de datos, entre otros. Estas temáticas se desarrollaron en este caso empleando una combinación de las metodologías de análisis de datos CRISP-DM e IBM. En este proyecto se utilizaron siete fases: (1) comprensión del negocio, (2) acercamiento al proyecto de analítica, (3) análisis de requerimientos y recolección de datos (4) Comprensión de los datos, (5) Preparación de los datos, (6) Modelado y (7) Visualización. Posterior a la construcción de las bases de datos de cada una de las empresas y sus respectivos clientes, el resultado del análisis de texto aplicado a las empresas de Telecomunicaciones presentó una consistencia con su modelo de negocio, siendo palabras como ‘Caso’, ‘Saludarte’, ‘Información’, ‘DM’ con mayor recurrencia en los tweets que emiten estas compañias. Siendo Movistar y Tigo, las empresas que presentan mayor correlación en la manera que manejan su discurso en la red social Twitter. En el caso de las bases de datos de los clientes se evidencia el uso de palabras como ‘Servicio’, ‘Internet’, ‘SICsuper’, entre otras como las más frecuentes. Además, se evaluaron los indicadores de desempeño obtenidos por el algoritmo de clasificación NaÏve Bayes sobre la variable ScreenName, obteniendo una precisión del modelo de 0.877, 0.691 y 0.660 para Claro, Movistar y Tigo respectivamente. Adicionalmente, en la fase de análisis se construyeron gráficas analíticas que complementaron los resultados obtenidos. Finalmente, se plantea una etapa adicional denominada maduración con el fin de refinar los resultados obtenidos en la presente investigación; además de algunos retos, como trabajo futuro, los cuales, vale la pena profundizar, pero que están fuera del alcance de esta investigación