La normalisation est un processus qui implique la transformation de caractères et de séquences de caractères dans une représentation formelle. Ce processus est important quand des textes doivent être comparés à des fins de tri et de recherche, mais il est aussi important pour le stockage des données, afin que les documents soient cohérents.
Le consortium Unicode Consortium a défini un nombre de formes de normalisations pour refléter les différents besoins des applications :
Les différentes formes sont définies en terme de transformations de texte, transformations qui sont exprimées avec des algorithmes et des fichiers de données.
Les constantes suivantes définissent les formes de normalisation à appliquer par le normalizer :