En este artículo se usan los datos de espectroscopia infrarroja del artículo de investigación titulado “Data on roasted coffee with specific defects analyzed by infrared-photoacoustic spectroscopy and chemometrics”[1], en el cual realizaron mezclas de granos defectuosos y saludables de café usando las especies Coffea Arabica (Arábica) y Coffea canephora (Robusta) en diferentes proporciones. Se usó el software libre R: A Language and Environment for Statistical Computing y el paquete de ChemoSpec para hacer un análisis de componentes principales y un modelo de agrupamiento de los espectros infrarrojo, se logró identificar grupo y tendencias en los datos a través de PCA y se obtuvo un modelo predictivo que logro clasificar las muestras en cinco clases.