La validesa i fiabilitat de les modernes classificacions diagnostiques per delirium han estat questionades per motius diferents. En aquest treball demostrem la baixa coincidencia diagnostica del DSM-IIIR, DSM-IV, DSM-5 i CIE-10. Les noves edicions del DSM milloren en fiabilitat inter-avaluador, pero la seva validesa empitjora i la CIE-10 obte en general pitjors resultats. L'escala DRS-R98 avalua de forma amplia i amb una clara descripcio fenomenologica els simptomes del delirium. Confirmem la validesa de la versio espanyola en una poblacio amb alta prevalenca de demencia, amb independencia del criteri diagnostic emprat. Finalment, avaluem una nova proposta diagnostica per delirium subsindromic i trobem que presenta simptomes amb severitat intermedia entre delirium i controls aixi com un perfil fenomenologic similar independentment del context clinic. Son necessaris criteris diagnostics per delirium mes clars i basats en els seus simptomes nuclears, possiblement recolzats en un biomarcador per millorar la seva validesa. La validez y fiabilidad de las modernas clasificaciones diagnosticas para delirium han sido cuestionadas de un modo u otro. En este trabajo demostramos la baja coincidencia diagnostica del DSM-IIIR, DSM-IV, DSM-5 y CIE-10. Las nuevas ediciones del DSM mejoran en fiabilidad inter-evaluador, pero su validez empeora y la CIE-10 obtiene en general peores resultados. La escala DRS-R98 evalua de forma amplia y con una clara descripcion fenomenologica los sintomas del delirium. Confirmamos la validez de la version espanola en una poblacion con alta prevalencia de demencia, al margen del criterio diagnostico usado. Por ultimo, evaluamos una nueva propuesta diagnostica para delirium subsindromico y encontramos que presenta sintomas con severidad intermedia entre delirium y controles asi como un perfil fenomenologico similar independientemente del contexto clinico. Son necesarios criterios diagnosticos para delirium mas claros y basados en sus sintomas nucleares, posiblemente apoyados en un biomarcador para mejorar su validez. The validity and reliability of modern diagnostic classifications for delirium have been challenged to varying degrees. In this paper we demonstrate the low diagnostic coincidence of DSM-III-R, DSM-IV, DSM-5 and ICD-10. The inter-rater reliability improves in the newer DSM editions, but its validity worsens and ICD-10 generally has worse results. The DRS-R98 scale assesses broadly and with a clear phenomenological description delirium symptoms. We confirmed the validity of its Spanish version in a population with a high prevalence of dementia, regardless of the criteria used for diagnosis. Finally, we evaluated a new diagnostic proposal for subsyndromal delirium and found it presents symptoms with intermediate severity between delirium and controls as well as a similar phenomenological profile regardless of the clinical setting. Clearer diagnostic criteria for delirium, based on its core symptoms, and possibly supported by a biomarker are necessary to improve their validity.