Umano chi legge
lunedì, agosto 18th, 2008Finalmente qualcuno ha pensato ad un utilizzo sensato dei captcha. Per chi non lo sapesse, si tratta di quelle combinazioni di lettere e numeri, volutamente distorti e artefatti in modo che siano leggibili da un occhio umano ma non da un computer.
Il fine ultimo dei captcha è proprio quello: capire se chi sta interagendo con quel sito o quell’applicazione è una persona in carne ed ossa oppure un bot.
Dover provare ad un computer che siamo esseri umani è peggio di dover produrre il certificato di esistenza in vita, ma purtroppo i siti che richiedono questa procedura stanno aumentando.
Qualcuno però ha pensato che tutto questo lavoro di lettura potesse essere utile, e ha creato reCaptcha: non si devono più decifrare lettere e numeri a caso, ma parole tratte da libri; in particolare, vengono sottoposte quelle parole che i programmi di riconoscimento ottico (OCR) non sono riusciti a decifrare. Ovviamente la stessa parola viene proposta a più utenti prima di essere acquisita, e delle due parole che vengono proposte una è già conosciuta dal sistema, che ha quindi un modo (seppur empirico) di testare la validità del lettore-utente.
L’intento è quello di aiutare il progetto Internet Archive nella digitalizzazione dei libri.
ReCaptcha, Internet Archive