Buscar

2007/09/06

reCaptcha, filtrado de spammers mediante libros escaneados

Fuente: Barrapunto.

Si este verano (invierno para los que leen desde el hemisferio equivocado) habéis intentado escribir en Barrapunto sin registraros, habréis encontrado el captcha que saca una imagen con texto distorsionado para evitar que los spammers automaticen el envío. Aparte de lo irritante que es teclear textos absurdos, cuesta distinguir la m de la n. Mientras tanto, los inventores del captcha en la universidad Carnegie-Mellon han sacado el recaptcha , un servicio web (con módulos para varios sistemas de weblog) en el que las palabras a reconocer vienen de libros escaneados del Internet Archive con las que el reconocimiento óptico ha tenido problemas. Tras presentar la misma palabra a varios usuarios, el sistema puede hacerse una idea de los caracteres que hay realmente en la imagen. Ya que hay que trabajar, que ese esfuerzo sirva para la cultura mundial. De momento, las palabras sólo vienen de libros en inglés.

No hay comentarios: