new Nuovi articoli in homepage!

ferma lo spam… leggi dei libri

Posted by lo schiaccianoci at June 14th, 2007

Un titolo bizzarro? è proprio quello che propone recaptcha.
In sostanza si tratta di una idea un pò folle un pò geniale.

Avete presente il famigerato captcha? in sostanza, alcuni siti e a dire il vero crescono ogni giorno sempre di più, per evitare di essere riempiti di registrazioni fasulle automatiche, commenti spam robotizzati e altro chiedono al visitatore al termine della compilazione di una form di interpretare una parolina scritta di solito in corsivo deformato in modo da capire se l’utente è un utente umano reale oppure no.

captcha

Pensate che sia un problema limitato? ci sono sistemi automatici usati dagli spammer, infatti che possono per esempio riempire di commenti spam un blog - oggi questo blog ha ricevuti circa un migliaio di commenti spam automatici!!!

ora che avete capito di che parlo… beh… sappiate che ogni giorno il popolo internet interpreta circa 60 milioni di queste paroline!!! SESSANTA MILIONI DI CAPTCHA AL GIORNO!

i signori di recaptcha hanno pensato bene di non disperdere questo sforzo interpretativo e ha studiato un sistema per rendere il tutto utile alla cultura :) Esistono infatti diversi progetti di digitalizzazione di libri che hanno come scopo quello di rendere disponibile in formato elettronico i preziosi testi. La procedura prevede la scansione di tutte le pagine del libro e una successiva attività di conversione utilizzando un OCR che significa “Optical Character Recognition” che traduce la scansione “grafica” della pagina del libro trascrivendone il contenuto vero e proprio in un file.

Purtroppo l’OCR non è molto affidabile e questo logicamente rallenta il lavoro di conversione e ne aumenta i costi. Si veda questo esempio:

sample ocr

recaptcha risolve entrambe i problemi. combatte lo spam e aiuta la digitalizzazione dei libri. Funziona allo stesso modo del captcha standard. Ecco come si presenta recaptcha in azione:

recaptcha

una delle due parole presentate è conosciuta e funziona come il solito captcha. l’altra invece proviene da un libro digitalizzato e per la quale l’ocr non è riuscito a dare una interpretazione. inserendole entrambe si potrà procedere e avrete aiutato la digitalizzazione dei libri :)

NB: ogni parola proveniente dai libri viene proposta a più di un solo utente per avere più precisione.


Ti è piaciuto questo post?
DIFFONDILO con StumbleUpon

Stumble it!

Valutazione post: 4 Votes | Average: 5 out of 54 Votes | Average: 5 out of 54 Votes | Average: 5 out of 54 Votes | Average: 5 out of 54 Votes | Average: 5 out of 5    (4 voti, media: 5)
    
Loading ... Loading ...


Posted in Internet, Spam, blog| Segnalalo su OKNotizie Segnalalo su Del.icio.us Segnalalo su Sègnalo 

Articoli collegati

  • commenti moderati…
  • tantissimi libri - informatici - GRATIS
  • Animazioni a suon di SPAM
  • ella mi ha salvato… dallo spam
  • Google Firefox Extensions


  • Articoli dalle stesse categorie



    Commentary

        Leave a comment, a trackback from your own site or subscribe to an RSS feed for this entry.

    Leave a response

     

    leave url