Se desarrolla una metodologÃa para clasificar y predecir usuarios en ambientes virtuales de educación, estudiando la interacción de los estudiantes con la plataforma y su desempeño en los exámenes. Para esto se utilizaron las herramientas de aprendizaje automático, componentes principales, clusterización, lógica difusa, y el algoritmo del K vecino más cercano. La metodologÃa relaciona los usuarios según las variables de estudio, para asà implementar un análisis de clúster que identifica la formación de grupos. Finalmente utiliza un algoritmo de aprendizaje automático para clasificar los usuarios según su nivel de conocimiento. Los resultados muestran como el tiempo que un estudiante permanece en la plataforma no está relacionado con pertenecer al grupo de conocimiento alto. Se identificaron tres categorÃas de usuarios, aplicando la metodologÃa Fuzzy K-means para determinar zonas de transición entre niveles de conocimiento. El algoritmo K vecino más cercano presenta los mejores resultados de predicción con un 91%.