ferma lo spam… leggi dei libri
Un titolo bizzarro? è proprio quello che propone recaptcha.
In sostanza si tratta di una idea un pò folle un pò geniale.
Avete presente il famigerato captcha? in sostanza, alcuni siti e a dire il vero crescono ogni giorno sempre di più, per evitare di essere riempiti di registrazioni fasulle automatiche, commenti spam robotizzati e altro chiedono al visitatore al termine della compilazione di una form di interpretare una parolina scritta di solito in corsivo deformato in modo da capire se l’utente è un utente umano reale oppure no.

Pensate che sia un problema limitato? ci sono sistemi automatici usati dagli spammer, infatti che possono per esempio riempire di commenti spam un blog – oggi questo blog ha ricevuti circa un migliaio di commenti spam automatici!!!
ora che avete capito di che parlo… beh… sappiate che ogni giorno il popolo internet interpreta circa 60 milioni di queste paroline!!! SESSANTA MILIONI DI CAPTCHA AL GIORNO!
i signori di recaptcha hanno pensato bene di non disperdere questo sforzo interpretativo e ha studiato un sistema per rendere il tutto utile alla cultura
Esistono infatti diversi progetti di digitalizzazione di libri che hanno come scopo quello di rendere disponibile in formato elettronico i preziosi testi. La procedura prevede la scansione di tutte le pagine del libro e una successiva attività di conversione utilizzando un OCR che significa “Optical Character Recognition” che traduce la scansione “grafica” della pagina del libro trascrivendone il contenuto vero e proprio in un file.
Purtroppo l’OCR non è molto affidabile e questo logicamente rallenta il lavoro di conversione e ne aumenta i costi. Si veda questo esempio:

recaptcha risolve entrambe i problemi. combatte lo spam e aiuta la digitalizzazione dei libri. Funziona allo stesso modo del captcha standard. Ecco come si presenta recaptcha in azione:

una delle due parole presentate è conosciuta e funziona come il solito captcha. l’altra invece proviene da un libro digitalizzato e per la quale l’ocr non è riuscito a dare una interpretazione. inserendole entrambe si potrà procedere e avrete aiutato la digitalizzazione dei libri
NB: ogni parola proveniente dai libri viene proposta a più di un solo utente per avere più precisione.
Related posts:

