Salı, Ekim 13, 2009

kelime doğrulama







Bugün özel diş hekimin yazdığı reçeteyi repete ettirmek isteyen bir bilgisayar mühendisi başvurdu.
Reçetedeki bir ilacı okuyamadığımdan Google'da aratırken, ,
"Ne dersiniz bu Google da bir gün Altavista gibi silinip gidecek mi?" diye sordum


"Silinmemek için çok uğraşıyorlar, sürekli yeni şeyler geliştiriyorlar. Şimdi de reCaptcha'yı açtılar" dedi.
"O da nedir?" diye sordum
"Captcha internette kullanıcıların gerçekten insan mı yoksa robot mu olduğunu test etmek için kullanılan kelime doğrulama sitemine verilen ad. Buna turing testi deniyor. Aslında ters turing testi demek lazım çünkü turing testi karşı tarafın insan mı robot mu olduğunu anlamak için insanlar tarafından yöneltilir, buradaysa robot insana soru soruyor. Google şimdi bunu kütüphanelerdeki eski kitapları okutmak için kullanmaya başladı" dedi


"Nasıl yani?" dedim
"Misal, kütüphanelerde dijital ortama aktarılmamış milyonlarca kitap var. Bunları tarayıp resim olarak internete yükleyebilirsiniz, resimden okuyabilirsiniz ama tekrar yazılmadıkça içinde arama yapamazsınız. Google şimdi bunu yapmaya başladı.




Kitaptan bir kelimenin resmini gösteriyor, sen onu aşağıdaki kutuya yazarak belki 1800 lerde yazılmış bir kitabın dijital ortama aktarılmasına katkı sağlamış oluyorsun. Her saniye kaç milyon kelime doğrulama yapıldığını düşünürseniz büyük bir potansiyel"
dedi



"Peki madem Google o resimde ne yazdığını bilmiyor, benim girdiğim kelimenin doğru olduğunu nasıl anlayacak?" diye sordum
"İki kelime soruyor, ilki daha önce başkası tarafından yazılmış, onu doğru girerseniz ikinciyi de doğru kabul ediyor" dedi


Son resim Rapidshare'in bir süre uyguladığı görüntülü Captchanın nasıl çözüleceğini anlatıyor

14 yorum:

Adsız dedi ki...

reCaptcha'yı satın aldı aslında Google.

aysema dedi ki...

Bazı insanlar insanlık adına harıl harıl çalışıyor. Tüm çalışanlara selam olsun...

UB dedi ki...

Vay bee, demek istiyorum. Kırık yıl düşünsem resim doğrulama kullanarak bir kitabı metne dönüştürme yöntemi aklıma gelmezdi.

Şu noktada ağzım açık kaldı.

Adsız dedi ki...

eğitim şart.

bir güzel çift dedi ki...

yazılarınızdan öğrendiğim en ilginç şeylerden biri de bu idi...süpermiş...

Serra dedi ki...

Bir goruntu icin eger belirli oranda insan ayni kelimeyi girerse, o zaman o girlen kelime dogru kabul ediliyor.

BlahBlah dedi ki...

çok ilginçti bu.

Hadiye dedi ki...

Merhaba,

Teknoloji nereye gidiyor.Ağzım açık kaldı.

Kolay gelsin

Adsız dedi ki...

Eskiden bu iş için OCR (Optical Charecter Recognidata) diye bilinen programlar vardı. Yapay zeka araştırmalarının da katkıları ile neredeyse %100 başarı ile resimleri düz yazıya dönüştürebiliyordu. Onlara ne oldu ki?

hale dedi ki...

eski yazıları ne kadar okuyabildikleri 4. resimde görünüyor

gül dedi ki...

sizi yakınen takip ediyorum ilk defa yorum yazayım dedim
gerçekten çok ilginç ve akıllıca bir yol

Adsız dedi ki...

vay beah!
eski kitaplarin digital olmasi durumu super bisiy!

osmanlicayi turkceye ceviren bi program da icat etseler keske ne iyi olurdu...butun eski evraklar, kitaplar okunabilirdi!

Ali ABAKAN dedi ki...

OCR sistemi hala kullaniliyor ancak bazen basimdan dolayi OCR tam algilayamiyor. reCaptcha sistemi ise hem bir turing testi servisini ucretsiz veriyor hem de OCR ile tanimlanamayan okumalarin yapilabilmesini sagliyor ve dogrulanmasini sagliyor mesela swxd diye bir kelime guncel yazim klavuzlarinda olmayacagindan kolayca tespit edilebilir ama of yerine at olarak tanimlama yapildiginda bu kolay kolay anlasilmaz. Benzer isleri yapip ucret almak istiyorsaniz bkz: http://www.mturk.com

Adsız dedi ki...

İnanamıyorum... Süper bir buluş.
ozlemkan