Bloglovin

miércoles, 20 de junio de 2012

CAPTCHA  Y RECAPTCHA
Ayudando a recuperar palabras


Según Wikipedia: Captcha son las siglas de Completely Automated Public Turing Test to tell Computers and Humans Apart (Prueba de Turing pública y automática para diferenciar máquinas y humanos).

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj027QQmcof9SFpYq2Q0B0lyl-3E9j2SL5CFuFM_TkQCqPv8dQQJfhW498AthjCpDrT9NtrTTVIPPFMnJdwdKx6F8dhoKDEt03da6veppBYxcOtPwajNMFJ65fmtslMS7JTBcrPGE30gYih/s320/captcha.jpg

Se trata de una prueba para distinguir si un usuario es humano o no. Este tipo de pruebas no las podría pasar con éxito una máquina porque no distingue los caracteres distorsionados. Se utiliza, entre otras muchas cosas, para, por ejemplo, evitar que un ordenador pueda responder a una encuesta de manera rapidísima y sin control o que pueda mandar spam a velocidad de vértigo. 

Hace ya un tiempo que los captchas se usan por duplicado: RECAPTCHAS. Y tiene una razón que me pareció muy curiosa: 

Luis Von Han, guatemalteco creador de los captchas, pensó en un momento dado:
Se teclean 200 millones de captchas al día
Lo que suponen 500.000 horas diarias
Los programas OCR (reconocimiento óptico de caracteres) se encargan de transformar el contenido de un escaneo en un documento de texto. Si el libro está viejo o en malas condiciones no pueden leer las palabras afectadas. Si el documento está muy deteriorado, el programa no puede leer un 30 % de las palabras que contiene.
Con todos estos datos, lo que se le ocurrió a este señor es poner dos palabras, una que reconozca si eres humano o no y otra que ayude a los OCR a completar su trabajo. De esta manera, si un alto porcentaje de personas a las que se muestra la palabra coinciden en el resultado, éste se dará por bueno. En resumen: con el recaptcha estamos haciendo una labor de ayuda a las máquinas. Estamos colaborando, sin saberlo hasta ahora, a recuperar palabras que un programa informático no podía descifrar.



1 comentario: