Cornell Üniversitesi'nde bir Doktora öğrencisi olan Ruidong Zhang, ekibiyle kablosuz kulaklık kullanarak oluşturduğu benzer bir projeyi ve bundan önceki kameralara dayanan modelleri temel alan yeni bir sistem geliştirdi. Gözlük, bir kamerayla uğraşma veya kulağınıza bir şey koyma ihtiyacını ortadan kaldırıyor.

Cornell bilgi bilimi profesörü yardımcısı Cheng Zhang, "Sessiz konuşma tanımadaki çoğu teknoloji, önceden belirlenmiş bir dizi komutla sınırlıdır ve kullanıcının bir kamerayla yüzyüze gelmesi veya bir kamera takmasını gerektirir ki bu ne pratik ne de mümkün" dedi. 

Araştırmacılar, sistemin bir kullanıcının konuşma kalıplarını öğrenmek için yalnızca birkaç dakikalık eğitim verisi gerektirdiğini söylüyor. Araştırmacı, gözlüğün, çalışmaya hazır olduğunda, gerçek zamanlı olarak "yaklaşık yüzde 95 doğrulukla" analiz etmek için derin bir öğrenme algoritması kullanırken ağız hareketlerini algılayarak yüzünüze ses dalgaları gönderip aldığını söyledi.

Belirtiline göre gözlük, akustik algılama için yaklaşık 10 saatlik pil ömrü sunuyor. Bunlara ek olarak, telefondan hiçbir veri talep etmiyor ve bu da gizlilik endişelerini ortadan kaldırıyor. 

gözlük (1)

Microsoft, Xbox'ı Xbox yapan yeşili oyun kontrolörüne ekledi Microsoft, Xbox'ı Xbox yapan yeşili oyun kontrolörüne ekledi

Gözlüğün belki de en heyecan verici kısmı ise, bazı konuşma engellerine sahip olan kişilerin, diyaloğu sessizce bir ses sentezleyiciye beslemek için kullanabilmesidir, bu da daha sonra kelimeleri yüksek sesle bir araç ile karşı tarafa aktarabilir.

Cornell Üniversitesi'nin SciFi laboratuvarındaki ekip, bir finansman programı kullanarak teknolojiyi ticarileştirmeyi araştırıyor. Ayrıca yüz, göz ve üst vücut hareketlerini izlemek için akıllı gözlük uygulamalarına da başvuruyorlar.

Son olarak buluşunun potansiyelini aktarmak isteyen Cheng Zhang, "Camın, günlük ortamlardaki insan faaliyetlerini anlamak için önemli bir kişisel bilgi işlem platformu olacağını düşünüyoruz" dedi.

Editör: Enes Sapmaz