OpenAI, ChatGPT tarihindeki en önemli güncellemeyi duyurdu. Fakat bu güncellemenin versiyon numarası biraz farklı. Bu yeni modele ChatGPT 4,5 ya da 5 yerine GPT-4o adını vermişler. Neredeyse gerçek zamanlı olarak ses, görüntü ve metin bilgilerini kullanıp, bunlar arasında mantık yürütüp sizinle çok doğal bir şekilde konuşuyor. O kadar doğal ki karşınızdakinin gerçek bir insan olmadığını çok hızlı bir şekilde unutabilirsiniz. Bu illüzyon, insan-bilgisayar etkileşiminde çok önemli yeni bir adım. Hatta biraz daha ileri gidelim. İnsan, makine ve hayvan etkileşiminde…
Bir adam telefondan bir kadına köpeğini gösterdi. İnsan, makine ve hayvan etkileşimi! Evet telefonda konuşan ve bu minik sevimli köpeği kameradan görünce heyecanlanan şey GPT-4o.
Eski GPT’lerden farkı ne?
Ona sadece yazıyla ulaşmıyoruz. Sesimizle konuşup, kameramızla görmesini sağlıyoruz. O da cevaplarını bize yazıyla değil, sesiyle veriyor. Hem de en duygusal haliyle.
İki farklı dilde konuşan kişiye gerçek zamanlı tercümanlık yapacak. İki tarafı da mükemmel bir şekilde çeviriyor. Burada dikkat çekmek istediğim bir şey var. Karşılıklı çeviri konusunda yapay zeka zaten epeyce bir ilerlemişti. Bu yeni modelin en büyük artısı hızı. Ses girişlerine 232 milisaniyeye varan hızlarda ve ortalama 320 milisaniyede yanıt verebiliyor; bu da bir konuşmadaki insan tepki süresine çok yakın. 10 dilde yapılan bir araştırmaya göre insanların konuşmalarındaki yanıt gecikmesi yaklaşık 250 milisaniye olarak bulunmuş. Yani yaklaşık 1 saniyenin dörtte biri hızında cevap veriyoruz. İşte bu süreye çok yaklaşmış görünüyor. Eski halinde yanıt süresi ortalama 2.8 saniyeydi. Şimdi 1 saniyenin üçte biri kadar hızlı hatta bazı durumlarda daha da hızlı!
O, artık iletişim kurarken sadece bilgi aktarmıyor. Aynı zamanda duygusal ihtiyaçlarınıza da yanıt veriyor. Artık onu sadece bilgisayar ekranında akan yazı olarak görmüyoruz. Aynı zamanda işitiyoruz, bir arkadaş gibi hissediyoruz.
Yazmak, konuşmak iyi de görmek bambaşka. Görmek, çok daha derin bir ilişki kurmak demek. Ve O, bizi görmeye başladı.
kısaca yeni gelen özellikler
Anlık ve canlı tercüme ile konuşma becerisine sahip
İnsan terminolojisi ve doğal sesine en yakın derecede konuşuyor
Desktop app ile ekran paylaşımı sayesinde soru yanıtlama, ekranı yorumlama, konu anlatımı yapabiliyor