To determine the concordance of mortality risk classification through the use of the Pediatric Index of Mortality (PIM) 2 and 3.Through a retrospective cohort, we evaluated patients admitted to the pediatric intensive care unit between April 2016 and December 2018. We calculated the mortality risk with the PIM 2 and 3. Analyses were carried out to determine the concordance between the risk classification obtained with both scales using unweighted and linearly weighted kappa.A total of 722 subjects were included, and 66.6% had a chronic condition. The overall mortality was 3.7%. The global kappa concordance coefficient for classifying patients according to risk with the PIM 2 and 3 was moderate at 0.48 (95%CI 0.43 - 0.53). After linear weighting, concordance was substantial at 0.64 (95%CI 0.59 - 0.69). For cardiac surgery patients, concordance for risk classification was fair at 0.30 (95%CI 0.21 - 0.39), and after linear weighting, concordance was only moderate at 0.49 (95%CI 0.39 - 0.59). The PIM 3 assigned a lower risk than the PIM 2 in 44.8% of patients in this subgroup.Our study proves that the PIM 2 and 3 are not clinically equivalent and should not be used interchangeably for quality evaluation across pediatric intensive care units. Validation studies must be performed before using the PIM 2 or PIM 3 in specific settings.Determinar a concordância da classificação do risco de mortalidade por meio do uso dos escores Pediatric Index of Mortality (PIM) 2 e 3.Avaliação de uma coorte retrospectiva pela análise dos pacientes admitidos à unidade de terapia intensiva pediátrica entre abril de 2016 e dezembro de 2018. Calculamos o risco de mortalidade por meio do PIM 2 e do 3. Realizaram-se análises para determinar a concordância entre a classificação de risco obtida com ambas as escalas pela utilização do cálculo do Kappa não ponderado e linearmente ponderado.Incluímos 722 pacientes, sendo que 66,6% destes tinham uma condição crônica. A mortalidade global foi de 3,7%. O coeficiente Kappa de concordância para classificação dos pacientes, segundo o risco com o PIM 2 e o 3, foi moderado: 0,48 (IC95% 0,43 - 0,53). Após ponderação linear, a concordância foi substancial: 0,64 (IC95% 0,59 - 0,69). Para pacientes de cirurgia cardíaca, a concordância para a classificação de risco foi regular: 0,30 (IC95% 0,21 - 0,39); após ponderação linear, a concordância foi apenas moderada: 0,49 (IC95% 0,39 - 0,59). O PIM 3 acusou um risco mais baixo do que o PIM 2 em 44,8% dos pacientes desse subgrupo.Nosso estudo comprova que o PIM 2 e o 3 não são clinicamente equivalentes e não devem ser usadas de forma intercambiável para avaliação da qualidade em diferentes unidades de terapia intensiva. Devem ser conduzidos estudos de validação antes que se utilizem os PIM 2 e 3 em situações específicas.