Sanitização HTML ou higienização HTML (do inglês HTML sanitization) é o processo de examinar um documento HTML e produzir um novo documento HTML que preserva apenas as marcações que são consideradas “seguras”.
A filtragem HTML pode ser usada para proteção contra ataques de cross-site scripting (XSS) pela limpeza de qualquer código HTML enviado pelo utilizador.
Em PHP, a sanitização HTML pode ser realizada usando a função strip_tags() sob o risco de remoção de todo conteúdo textual seguindo um símbolo não fechado de menor que (“<“). A biblioteca HTML Purifier é outra opção popular para aplicações PHP.
Mais info:
HTML Purifier 4.9.3 (.zip) (versão 4.9.3, testada com PHP 5.3 e superior.)
Como usar HTML Purifier como uma alternativa Tidy
Plugin WordPress, (HTML Purified replaces the default WordPress and bbPress comments filters)