CAPTCHA Y RECAPTCHA
Ayudando a recuperar palabras
Según Wikipedia: Captcha son las
siglas de Completely Automated Public Turing Test to tell Computers
and Humans Apart (Prueba de Turing pública y automática para diferenciar
máquinas y humanos).
Se trata de una prueba para distinguir
si un usuario es humano o no. Este tipo de pruebas no las podría pasar con
éxito una máquina porque no distingue los caracteres distorsionados. Se
utiliza, entre otras muchas cosas, para, por ejemplo, evitar que un ordenador
pueda responder a una encuesta de manera rapidísima y sin control o que pueda
mandar spam a velocidad de vértigo.
Hace ya un tiempo que los captchas se
usan por duplicado: RECAPTCHAS.
Y tiene una razón que me pareció muy curiosa:
Luis Von Han, guatemalteco creador de
los captchas, pensó en un momento dado:
Se teclean 200 millones de captchas al
día
Lo que suponen 500.000 horas diarias
Los programas OCR (reconocimiento
óptico de caracteres) se encargan de transformar el contenido de un escaneo en
un documento de texto. Si el libro está viejo o en malas condiciones no pueden
leer las palabras afectadas. Si el documento está muy deteriorado, el programa
no puede leer un 30 % de las palabras que contiene.
Con todos estos datos, lo que se le
ocurrió a este señor es poner dos palabras, una que reconozca si eres humano o
no y otra que ayude a los OCR a completar su trabajo. De esta manera, si un
alto porcentaje de personas a las que se muestra la palabra coinciden en el
resultado, éste se dará por bueno. En resumen: con el recaptcha estamos
haciendo una labor de ayuda a las máquinas. Estamos colaborando, sin saberlo
hasta ahora, a recuperar palabras que un programa informático no podía
descifrar.