Le spam est un véritable fléau sur internet. Pour le courrier électronique, il y a Mozilla Thunderbird ou encore Wikmail.Pour les pages web dynamiques (forums, blogs, formulaires, etc.) une solution miracle reste encore à trouver...

Chaque outil d'interaction offert aux utilisateurs lambda peut être utilisé de manière abusive. C'est inévitable. De nombreux sites présentent différentes techniques de modération. Même le W3C intervient pour émettre des propositions :

  • utiliser des puzzles logiques (captcha[1]). A condition que le serveur soit capable de générer des problèmes suffisamment variés, on suppose également que les humains sont tous plus capables qu'une machine...
  • utiliser un système sonore, voire un test olfactif, pour détecter les robots utilisés pour le spam.
  • valider manuellement et en temps réel les commentaires. C'est la solution la plus fiable. Problème de taille: le coût. Peut-être qu'en confiant cette tâche ingrate à des petits enfants dans un pays en voie de développement...
  • obliger les utilisateurs à s'identifier avant d'utiliser un formulaire. Et pour éviter les abus avec les formulaires d'identification, il faut les forcer à s'identifier avant de leur permettre d'utiliser les formulaires d'identification.
  • valider les utilisateurs au moyen de leur carte de crédit. C'est une idée brillante. Les robots n'ont pas de cartes de crédit. Et il est connu que les possesseurs de cartes de crédit sont heureux de confier leur numéro de carte de crédit à n'importe quel site internet.
  • instaurer un système d'identification centralisé. Une sorte de carte d'identité électronique; au moindre spam, ou à la moindre infraction, les services de police pourraient immédiatement sévie.
  • utiliser des méthodes heuristiques en se basant sur les volumes de données, l'adresse IP, les logs, des statistiques, des probabilités, le rythme des marées...

Aucune de ces pistes ne peut avoir la prétention de mener à une solution efficace à 100%. Il est possible de supprimer le spam mais à quel prix ? Au prix d'une charge élevée sur le serveur ? En empêchant des commentaires qui seraient pourtant pertinents ?

Comme le suggère Peter Krantz la première chose à faire est d'évaluer les besoins. Pourquoi vouloir ajouter un système anti-spam ? Est-ce vraiment nécessaire ? Beaucoup de sites utilisent des captchas dans le seul but d'avoir une "allure professionnelle".

Sur ce blog, le captcha utilisé est plus un prétexte de programmation qu'une véritable nécessité. Et accessoirement cet anti-spam vous offre une opportunité de tester votre orthographe et vos aptitudes au calcul…


[1]Captcha est un accronyme pour designer le Completely Automated Public Turing test to tell Computers and Humans Apart. En français : un Test public de Turing complètement automatique qui différencie ordinateurs et humains.