Salı, Ekim 13, 2009
kelime doğrulama
Bugün özel diş hekimin yazdığı reçeteyi repete ettirmek isteyen bir bilgisayar mühendisi başvurdu.
Reçetedeki bir ilacı okuyamadığımdan Google'da aratırken, ,
"Ne dersiniz bu Google da bir gün Altavista gibi silinip gidecek mi?" diye sordum
"Silinmemek için çok uğraşıyorlar, sürekli yeni şeyler geliştiriyorlar. Şimdi de reCaptcha'yı açtılar" dedi.
"O da nedir?" diye sordum
"Captcha internette kullanıcıların gerçekten insan mı yoksa robot mu olduğunu test etmek için kullanılan kelime doğrulama sitemine verilen ad. Buna turing testi deniyor. Aslında ters turing testi demek lazım çünkü turing testi karşı tarafın insan mı robot mu olduğunu anlamak için insanlar tarafından yöneltilir, buradaysa robot insana soru soruyor. Google şimdi bunu kütüphanelerdeki eski kitapları okutmak için kullanmaya başladı" dedi
"Nasıl yani?" dedim
"Misal, kütüphanelerde dijital ortama aktarılmamış milyonlarca kitap var. Bunları tarayıp resim olarak internete yükleyebilirsiniz, resimden okuyabilirsiniz ama tekrar yazılmadıkça içinde arama yapamazsınız. Google şimdi bunu yapmaya başladı.
Kitaptan bir kelimenin resmini gösteriyor, sen onu aşağıdaki kutuya yazarak belki 1800 lerde yazılmış bir kitabın dijital ortama aktarılmasına katkı sağlamış oluyorsun. Her saniye kaç milyon kelime doğrulama yapıldığını düşünürseniz büyük bir potansiyel" dedi
"Peki madem Google o resimde ne yazdığını bilmiyor, benim girdiğim kelimenin doğru olduğunu nasıl anlayacak?" diye sordum
"İki kelime soruyor, ilki daha önce başkası tarafından yazılmış, onu doğru girerseniz ikinciyi de doğru kabul ediyor" dedi
Son resim Rapidshare'in bir süre uyguladığı görüntülü Captchanın nasıl çözüleceğini anlatıyor
Kaydol:
Kayıt Yorumları (Atom)
14 yorum:
reCaptcha'yı satın aldı aslında Google.
Bazı insanlar insanlık adına harıl harıl çalışıyor. Tüm çalışanlara selam olsun...
Vay bee, demek istiyorum. Kırık yıl düşünsem resim doğrulama kullanarak bir kitabı metne dönüştürme yöntemi aklıma gelmezdi.
Şu noktada ağzım açık kaldı.
eğitim şart.
yazılarınızdan öğrendiğim en ilginç şeylerden biri de bu idi...süpermiş...
Bir goruntu icin eger belirli oranda insan ayni kelimeyi girerse, o zaman o girlen kelime dogru kabul ediliyor.
çok ilginçti bu.
Merhaba,
Teknoloji nereye gidiyor.Ağzım açık kaldı.
Kolay gelsin
Eskiden bu iş için OCR (Optical Charecter Recognidata) diye bilinen programlar vardı. Yapay zeka araştırmalarının da katkıları ile neredeyse %100 başarı ile resimleri düz yazıya dönüştürebiliyordu. Onlara ne oldu ki?
eski yazıları ne kadar okuyabildikleri 4. resimde görünüyor
sizi yakınen takip ediyorum ilk defa yorum yazayım dedim
gerçekten çok ilginç ve akıllıca bir yol
vay beah!
eski kitaplarin digital olmasi durumu super bisiy!
osmanlicayi turkceye ceviren bi program da icat etseler keske ne iyi olurdu...butun eski evraklar, kitaplar okunabilirdi!
OCR sistemi hala kullaniliyor ancak bazen basimdan dolayi OCR tam algilayamiyor. reCaptcha sistemi ise hem bir turing testi servisini ucretsiz veriyor hem de OCR ile tanimlanamayan okumalarin yapilabilmesini sagliyor ve dogrulanmasini sagliyor mesela swxd diye bir kelime guncel yazim klavuzlarinda olmayacagindan kolayca tespit edilebilir ama of yerine at olarak tanimlama yapildiginda bu kolay kolay anlasilmaz. Benzer isleri yapip ucret almak istiyorsaniz bkz: http://www.mturk.com
İnanamıyorum... Süper bir buluş.
ozlemkan
Yorum Gönder