Se define como la tarea de asignar valores booleanos a cada par pertenecientes a , donde es el dominio de los documentos y es una colección de categorías predefinidas. T (verdadero) indica archivar un documento bajo , mientras F (falso) indica no archivar bajo .

Entre las aplicaciones que encuentra la clasificación de documentos se tienen los filtros de e-mail (spam / no spam)

Las medidas de evaluación utilizadas en la clasificación de documentos son principalmente precisión, cobertura y F-1.​


Este artículo utiliza material del artículo de Wikipedia Clasificación de documentos, que se publica en Creative Commons Attribution-Share-Alike License 3.0.