El sistema de salud en Colombia, específicamente los servicios no financiados por la Unidad de Pago por Capitación (UPC), presenta oportunidades de mejora en su análisis debido a limitaciones existentes en métodos y recursos. Las fallas del mercado, que pueden ser deliberadas, afectan la calidad y financiamiento del sistema de salud. El procesamiento eficiente de la información en salud puede ayudar a identificar y prevenir fraudes. El uso de Aprendizaje Automático (ML) ha sido útil para mitigar pérdidas por fraude potencial en áreas financieras. Este trabajo propone una metodología de detección de fraude financiero usando datos de tecnologías de salud no financiadas por UPC, en pacientes colombianos con Enfermedad Renal. La metodología propuesta realiza una agrupación multinivel por pacientes, EPS, IPS y proveedores de servicios médicos para encontrar patrones de comportamiento. En esta medida, se propone identificar un algoritmo o modelo replicable de manera automática. El enfoque de ML propuesto es un modelo hibrido no supervisado y escalonado para el análisis de datos mixtos. Primero, utilizando la agrupación jerárquica con la distancia de Gower que permite agrupar observaciones basadas en variables principalmente categóricas. Segundo, tomando las agrupaciones logradas, K-means se aplica en las variables numéricas, lo que permite refinar los grupos identificados y optimizar la cohesión interna. Este enfoque secuencial aprovecha las fortalezas de ambos métodos (agrupamiento jerarquico y k-means) y ofrece una visión detallada de los clústeres, facilitando la identificación de patrones atípicos que podrían contribuir a la identificación de fraude al sistema de salud. Igualmente, proporciona una base sólida para la detección de comportamientos atípicos y maximiza la capacidad de identificar posibles fraudes en las prescripciones logrando un procedimiento automático inicial de ML que sirve para replicar y priorizar con otras caracterizaciones de la base de datos.