En este trabajo se presenta la construcción metodológica para la clasificación de datos desbalanceados, a partir del análisis comparativo entre técnicas de submuestreo, y tiene como aporte fundamental el desarrollo de una nueva estrategia de submuestreo y la clara identificación de las condiciones de aplicación de cada una de las técnicas. En particular, se consideran las técnicas de submuestreo basado en agrupamiento, un nuevo método de submuestreo basado en teoría de la información y una adaptación de los métodos propuesto para desarrollar un ensamble de clasificadores. Las pruebas de desempeño se orientan a la precisión del sistema en la etapa de clasificación y a la capacidad de cada método para seleccionar las muestras más representativas. Se realizan pruebas sobre 44 bases de datos desbalanceadas de pequeña escala del repositorio de datos KEEL, y tres bases de datos de gran escala orientas a la predicción de cáncer de mama y de homología de proteínas y la detección automática de displasias corticales. Los resultados obtenidos reflejan que el submuestreo basado en teoría de la información es el método de submuestreo que mejor preserva la estructura de la clase mayoritaria, reduciendo la pérdida de información en el proceso de eliminación de muestras. Además, este método presenta una mejora sustancial cuando es adaptado para generar la combinación de diferentes clasificadores aumentando notablemente la capacidad del sistema para generalizar el comportamiento de ambas clases lo cual se puede evidenciar en los resultados de clasificación.