OpenAI'nin yeni başlatılan Yüksek Sesle Okuma özelliği ve yapay zekanın nasıl erişilebilir olabileceği hakkında bilgiler

0
OpenAI'nin yeni başlatılan Yüksek Sesle Okuma özelliği ve yapay zekanın nasıl erişilebilir olabileceği hakkında bilgiler

Pazartesi günü X'te paylaşılan bir gönderideSan Francisco merkezli OpenAI, iOS ve Android uygulamaları için kullanıcıların sohbetleri yüksek sesle okumasına olanak tanıyan yeni bir özelliği duyurdu. Ayrıca çevrimiçi olarak da mevcuttur.

OpenAI'de Model Davranış ürününü yöneten Joan Zhang, duyurudan önce geçen hafta sonlarında benimle yaptığı röportajda şirketin bir süredir erişilebilirlik konusunu düşündüğünü açıkladı. Yaklaşık bir yıl önce piyasaya sürülen, insanların görselleri girdi olarak kullanmalarına ve onlar hakkında sorular sormalarına olanak tanıyan bir özelliğe dikkat çekti: “Teknolojinin güçlü olacağını biliyorduk ama nasıl kullanılabileceğine gerçekten anlam veremiyorduk. ” o bana söyledi. Zhang, OpenAI'nin içgörü ve daha da önemlisi kör ve görme engelli kişilerden geri bildirim almak için Be My Eyes ekibine ulaştığını söyledi. Zhang, OpenAI'yi geri bildirimlerin çoğundan “çok etkilendiğini” belirterek şunları söyledi: “Pek çok beklenmedik geri bildirim var. İnsanların kıyafetlerinin fotoğraflarını çekmesi ve ChatGPT'ye eşleşip eşleşmediğini sorması, ayrıca bahçelerinin fotoğraflarını çekip onlara anlatması gibi kullanım örneklerinden bahsetti. Gang, insanların bu konuda yeni şeyler fark edebildiğini söyledi. Daha önce bilmedikleri bir ortam Bu Faydalıydı çünkü açıklama başka birinden değil, daha tarafsız bir gözlemciden gelmişti.

Gang, OpenAI'nin meşhur ampul anı hakkında şunları söyledi: “Sanırım o zaman 'Tamam, burada yapay zeka ile ilgili bir şeyler var' diye öğrendik.” “Onun erişilebilirliğe alternatif bir bakış açısı sunabilecek biri olmadığı bir gerçek.[the chatbot] Yeni ve daha objektif bir bakış açısı sunar.

“Öğrenmeyi çok merak ediyorduk” diye devam etti [about] Erişilebilirlik ve kör ve görme engelli topluluktan. “Uygulamamız tüm erişilebilirlik kullanım durumları için mükemmel çalışıyor” diyormuş gibi yapmayacağız. Hala gidecek çok yolumuz var ama kesinlikle bu teknolojinin herkesin hayatını iyileştirmesini istiyoruz. Geri bildirimi seviyoruz.

Yorumlarını açıklayan Jang, ekibin Be My Eyes ile olan ortaklıkları sayesinde çok şey öğrendiğini söyledi. Önemli derslerden biri, kör ve görme engelli topluluktaki insanlara yer vermenin sadece görsel yardım sağlamak anlamına gelmediğiydi. OpenAI'nin birçok insanın ses odağını ekran okuyucu ve benzeri olarak kullandığını öğrendiğini söyledi. Örneğin Gang, işletim sisteminin yerel metin-konuşma motorunun bazen alışveriş listesindeki bir grup öğeyle ilgili sorun yaşayabileceğini belirtti. Bunun aksine, kullanıcılar artık Amazon alışveriş sepetlerinin ekran görüntüsünü alıp ChatGPT'ye bunu sorabiliyor; Zhang, bunun daha önce mevcut olmayan bir yetenek olduğunu söyledi. Bu özellik alışverişi daha kolay ve rahat hale getirmelidir.

“Sanırım sadece Be My Eyes ile olan işbirliğimiz sayesinde değil, aynı zamanda birçok kullanıcı geri bildirimi sayesinde de şunu öğrendik: [AI] kullanılabilir [for accessibility]Gang, “Bunun aslında sesli okumayı desteklemek istememizin birçok nedeninden biri olduğunu düşünüyorum” dedi.

Be My Eyes'ın CEO'su Mike Buckley, geçen Aralık ayında benimle yaptığı röportajda OpenAI'nin çabalarını övdü. Geliştirme sırasında erişilebilirliği yüksek bir öncelik haline getirme konusunda OpenAI'nin doğru yolda olduğunu söyledi ve “çok fazla mühendislik zamanı harcadıkları için” onlara büyük saygı duyduğunu ekledi. [and] Çok sayıda proje [and] “Kimse izlemediğinde ürün yöneticisinin erişilebilirlik üzerinde çalışmasının zamanı geldi.”

Yüksek sesle okumanın etkisinin derinliği OpenAI'yi heyecanlandırdı.

Jang, sesli okumaları çevreleyen atmosfer hakkında şunları söyledi: “Bu teknoloji konusunda çok heyecanlıyız çünkü bir süredir üzerinde çalışıyoruz.” “Sanırım bu konuda beni heyecanlandıran iki şey var. Birincisi, bu ses yeteneklerinden önce yazılı olarak çok fazla iş yapılmış olması.” [and] Yazı. Ancak herkes yazarak düşünmüyor. Yazarak düşünüyorum ama çevremde önce konuşarak daha iyi düşünen çok insan tanıyorum. Pek çok insanın bir chatbot ile yazmaya gelince gergin hissettiğini düşünüyorum, ancak ChatGPT ile etkileşimli olarak konuşmayı daha kolay buluyorlar. En çok heyecanlandığım şey şu [voice capabilities] İnsanların ileri teknolojiyle etkileşime girmesine başka bir yol açarak, onların daha iyi iletişim kurmalarının ve fikirlerini daha iyi ifade etmelerinin yolunu açar. Dürüst olmak gerekirse OpenAI konusunda bizi en çok heyecanlandıran şeylerden biri de gelişmiş yapay zeka teknolojilerinin tüm insanlığa fayda sağlamasıdır. Bunun, yazmanın şu ya da bu nedenle uygun olmadığı insanların ihtiyaçlarını karşılayabileceği gerçeği beni özellikle heyecanlandırıyor.

ChatGPT ekibinden bir mühendis olan Zhang'ın meslektaşı Mada Aflac da aynı fikirde.

“Konuşmak temel bir insan becerisidir. [so] Zhang's ile eş zamanlı bir röportajda “Yapay zekanın sesle iletişim kurmasını sağlamak da çok önemli” dedi. “Yazarak yaparken kendinizi rahat hissedebileceğiniz pek çok konuşma var, ancak beyin fırtınası yaptığınızda olduğu gibi bazı diğer konuşmalar ses sayesinde çok daha doğal geliyor. Bu kullanım durumlarının tümü sesle daha iyi sonuç verecektir. Sanırım sizin için istediğiniz herhangi bir şey Yazarak yapabildiğiniz gibi sesli komutlarla da yapabilmeniz gerekir.Kullanıcıların sesli komutları çalıştırmasına olanak tanıyarak sizi anlayabilen ve sizinle doğal dilde konuşabilen bu teknolojiyi geliştirmek, her dijital cihazı daha erişilebilir hale getirmeye yardımcı olacaktır. biz de üretebiliriz [images] Hiçbir şey yazmaya gerek kalmadan. Sonuçta yazabileceğiniz her şeyi sesle de yapabilmeniz gerekir.

OpenAI'nin gelecekteki umutları ve hayalleri sorulduğunda Jang, şirketin ChatGPT'nin kapasitesi ve erişilebilirliği bağlamında bir yıl içinde uzun bir yol kat ettiğini söyleyerek açık sözlü oldu. Umudu, yapay zekanın her zamankinden daha akıllı ve verimli hale gelmesiyle, daha önce sıkıcı veya başka bir şekilde gerçekleştirilmesi mümkün olmayan görevlerin otomatikleştirilmesine yardımcı olabilmesidir. Bunun, insanları sevdikleri şeyi yaparken daha yaratıcı ve bağımsız olma konusunda özgür kılma potansiyeline sahip olduğunu söyledi. Zhang, “İnsanların herhangi bir görev üzerinde sahip olduğu etkileşim türlerini tahmin edersek, ChatGPT ilerledikçe insanların daha fazla üst düzey görevi daha hızlı yapmasına olanak tanıyacağını umuyorum” dedi.

Aflac yine Jang'la anlaştı.

“İhtiyacınız olmayan bir dünya hayal ediyoruz [user interfaces]Gelecekteki büyüme için yapay zekanın potansiyelinden bahsetti. “Yapabileceğiniz her şeyi sesli komutla yapabilirsiniz. Bunun harika, fütüristik bir gelecek olacağını düşünüyorum.”

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir