Üretken Yapay Zeka Üzerine Söyleşi – MIT

2010 yılında perakende yöneticileriyle konuşan Rama Ramakrishnan iki gerçeğin farkına vardı. Birincisi, müşterilere kişiselleştirilmiş öneriler sunan perakende sistemleri büyük ilgi görmesine rağmen bu sistemler perakendecilere genellikle çok az kazanç sağlıyordu. İkincisi, pek çok firma için müşterilerin çoğu yılda yalnızca bir veya iki kez alışveriş yapıyordu, dolayısıyla şirketler onlar hakkında pek bir şey bilmiyordu.

Profesör Ramakrishnan, “Ancak bir müşterinin bir perakendeci veya e-ticaret sitesiyle olan etkileşimlerini not etme konusunda çok dikkatli davranarak, o kişinin ne yaptığına ve neye önem verdiğine dair çok güzel ve ayrıntılı bir bileşik resim oluşturabiliriz. Buna bir kez sahip olduğunuzda, makine öğreniminin kanıtlanmış algoritmalarını da uygulayabilirsiniz.”

Bu adımlar, Ramakrishnan’ı, yazılımı artık Salesforce’un yaygın olarak benimsenen yapay zeka e-ticaret platformunun temeli haline gelen bir girişim olan CQuotient‘i kurmaya yöneltti. “Sadece Black Friday’de CQuotient teknolojisi muhtemelen tek bir günde bir milyardan fazla müşteriyi görüyor ve onlarla etkileşime geçiyor” diyor.

Son derece başarılı bir girişimcilik kariyerinin ardından Ramakrishnan, 2019’da MIT Sloan’a geri döndü ve burada 1990’larda yöneylem araştırması alanında yüksek lisans ve doktora dereceleri aldı. Öğrencilere “sadece bu muhteşem teknolojilerin nasıl çalıştığını değil, aynı zamanda bu teknolojileri nasıl alıp gerçek dünyada pragmatik olarak nasıl kullanabileceğinizi” de öğretiyor.

Ayrıca Ramakrishnan, MIT yönetici eğitimine katılmaktan hoşlanıyor. “Bu, benim için öğrendiklerimi aktarmak ve aynı zamanda daha da önemlisi bu üst düzey yöneticilerin aklından geçenleri öğrenmek, onlara rehberlik etmek ve onları doğru yöne yönlendirmek için harika bir fırsat” diyor.

Örneğin yöneticiler, makine öğrenimi sistemlerini eğitmek için büyük miktarda veriye duyulan ihtiyaç konusunda anlaşılır bir şekilde endişe duyuyorlar. Artık onları belirli görevler için önceden eğitilmiş çok sayıda modele yönlendirebilir. Ramakrishnan, “Önceden eğitilmiş bu yapay zeka modellerini kullanma ve bunları özel iş sorunlarınıza çok hızlı bir şekilde uyarlama yeteneği inanılmaz bir ilerleme” diyor.

 

Yapay zeka sınıflandırmasını anlama 

“Yapay zeka, bilgisayarlara genellikle yalnızca insanların yapabileceği bilişsel görevleri yapma yeteneğini aşılama arayışıdır” diyor. Bu karmaşık yapının tarihini anlamak, teknolojilerden yararlanmaya yardımcı olur.

Sorunları temel olarak insanlardan öğrenilen if/then koşul kurallarını uygulayarak çözen geleneksel yapay zeka yaklaşımının nispeten az sayıda görev için faydalı olduğu kanıtlandı. Ramakrishnan, “Bunun bir nedeni, pek çok şeyi zahmetsizce yapabilmemiz, ancak bunları nasıl yaptığımızı açıklamamız istendiğinde, aslında bunları nasıl yaptığımızı tam olarak ifade edemememizdir” yorumunu yapıyor. Ayrıca bu sistemler, yazılımda yer alan kurallara uymayan yeni durumlar karşısında şaşkına dönebilir.

Makine öğrenimi, yazılımın temel olarak örnek yoluyla öğrenmesiyle dramatik biçimde farklı bir yaklaşım benimsiyor. “Girdi ve çıktılara, soru ve yanıtlara, görev ve yanıtlara ilişkin birçok örnek veriyorsunuz ve bilgisayarın girdiden çıktıya nasıl geçeceğini otomatik olarak öğrenmesini sağlıyorsunuz” diyor. Kredi puanlama, kredi karar verme, hastalık tahmini ve talep tahmini, makine öğreniminin gerçekleştirdiği birçok görev arasındadır.

Ancak makine öğrenimi yalnızca girdi verileri yapılandırıldığında (örneğin bir e-tabloda) iyi çalışabilir. Ramakrishnan, “Giriş verileri, görüntüler, video, ses, EKG’ler veya X-ışınları gibi yapılandırılmamışsa, bundan tahmin edilen bir çıktıya geçiş pek iyi olmaz” diyor. Bu, insanların sistemi eğitmek için yapılandırılmamış verileri manuel olarak yapılandırması gerektiği anlamına geliyor.

2010 civarında derin öğrenmenin bu sınırlamanın üstesinden gelmeye başladığını ve yapılandırılmamış girdi verileriyle doğrudan çalışma yeteneği sağladığını söylüyor. Sinir ağları olarak bilinen uzun süredir devam eden bir yapay zeka stratejisine dayanan derin öğrenme, küresel veri akışı, grafik işleme birimleri (başlangıçta video oyunları için icat edildi) adı verilen olağanüstü güçlü paralel işleme donanımının mevcudiyeti ve algoritmalar ve matematikteki ilerlemeler sayesinde pratik hale geldi.

Son olarak, derin öğrenme kapsamında, geçen yıl ortaya çıkan üretken yapay zeka yazılım paketleri, insana benzeyen metinler, köpek görüntüleri ve üç boyutlu modeller gibi yapılandırılmamış çıktılar oluşturabiliyor. OpenAI’nin ChatGPT’si gibi büyük dil modelleri (LLM’ler) metin girişlerinden metin çıktılarına geçerken, OpenAI’nin DALL-E’si gibi metinden görüntüye modeller gerçekçi görünen görüntüler üretebilir.

 

 

Üretken yapay zeka neler yapabilir (ve yapamaz) 

Ramakrishnan: İnternetin tahmin edilemeyecek kadar geniş metin kaynakları ile eğitilmiş Büyük Dil Modelleri’nin (LLM) en temelde yaptığı şey bir sonraki en makul kelimeyi tahmin etmektir. Sonra kelimeyi orijinal cümleye ekliyor ve sonraki kelimeyi de aynı mantıkta buluyor. Bu sayede arzu edilen paragraf elde edilmiş oluyor.

“Birçok araştırmacı da dahil olmak üzere pek çok kişiyi şaşırtacak şekilde, LLM bazı karmaşık şeyleri de yapabiliyor. Güzel ve tutarlı şiirler yazabilir, Seinfeld(Tv Dizisi) bölümleri yazabilir ve bazı akıl yürütme problemlerini çözebilir. Bir sonraki kelime tahmininin bu muhteşem yeteneklere nasıl yol açabileceği gerçekten oldukça dikkat çekici.”

Ramakrishnan: Fakat onun yaptığı şeyin sorunuza doğru yanıtı bulmaktan ziyade, sorunuza makul bir yanıt bulmak olduğunu her zaman aklınızda tutmalısınız. İçeriği gerçeklere dayalı olarak yanlış, alakasız, zehirli, önyargılı veya saldırgan olabilir.

Bu, çıktının eldeki görev için doğru, alakalı ve yararlı olduğundan emin olma yükünü kullanıcılara yüklüyor. “Çıktısında hatalar olup olmadığını kontrol etmeniz ve bunları kaybolmadan önce düzeltmeniz için bir yol olduğundan emin olmalısınız” diyor.

Pek çok yenilikçi aracın bunu yapmasını bekleyen Ramakrishnan, bu eksiklikleri giderecek teknikleri bulmak için yoğun araştırmaların sürdüğünü ekliyor.

 

LLM’ler için doğru kurumsal rolleri bulma 

Sektördeki insanlar LLM’lerin bu gelişen durumunu göz önünde bulundurduğunda özellikle yazılım alanında bu teknolojiye ne gibi sorumluluklar verebilir?

Ramakrishnan ilk olarak maliyetleri göz önünde bulundurmanızı tavsiye ediyor: “Düzelteceğiniz bir taslağa sahip olmak, her şeyi kendiniz yaratmaktan çok daha mı az masraflı bir çabadır?” İkincisi, LLM gözden kaçan bir hata yaparsa ve hatalı içerik dış dünyaya duyurulursa, sonuçlarına katlanabilir misiniz?

Ramakrishnan, “Her iki hususu da karşılayan bir uygulamanız varsa, o zaman bu teknolojilerin söz konusu görevde size gerçekten yardımcı olup olamayacağını görmek için bir pilot proje yapmak iyi olur” diyor. Pilotu normal bir BT projesi olarak değil, bir deney olarak ele almanın gerekliliğini de vurguluyor.

Şu anda yazılım geliştirme en olgun kurumsal LLM uygulamasıdır. “ChatGPT ve diğer LLM’ler metin girişi ve çıkışıdır ve bir yazılım programı yalnızca metin çıkışıdır. Programcılar İngilizce metin girişinden Python metin çıkışına geçebildiği gibi siz de İngilizceden İngilizceye veya İngilizceden Almancaya geçiş yapabilirsiniz. Bu teknolojileri kullanarak kod yazmanıza yardımcı olacak pek çok araç var.”

Elbette programcıların sonucun işi doğru şekilde yaptığından emin olmaları gerekir. Neyse ki yazılım geliştirme zaten kodun test edilmesi ve doğrulanması için altyapı sunuyor. “Burası çok güzel bir nokta, teknolojinin sizin için kod yazmasını sağlamak çok daha ucuzdur, çünkü bunu hızlı bir şekilde kontrol edip doğrulayabilirsiniz.”

Bir diğer önemli LLM kullanımı, pazarlama metni veya e-ticaret ürün açıklamaları yazmak gibi içerik üretimidir. Ramakrishnan, “Yine, ChatGPT’nin taslağını düzeltmek, sizin için her şeyi yazmanızdan çok daha ucuz olabilir. Ancak şirketlerin döngüde bir insanın olduğundan emin olmak için çok dikkatli olmaları gerekiyor.

LLM’ler aynı zamanda kurumsal belgeleri aramak için kurum içi araçlar olarak hızla yayılıyor. Geleneksel arama algoritmalarının aksine, bir LLM sohbet robotu, sorduğunuz her soruyu hatırladığı için sohbete dayalı bir arama deneyimi sunabilir. “Ama yine de ara sıra bazı şeyleri telafi edecek” Harici müşterilere yönelik sohbet robotları açısından, müşteriye yanlış bir şey söyleme riski nedeniyle bunlar daha çok erken günler.”

Genel olarak Ramakrishnan, yapay zekanın hızla gelişen potansiyelleri ve tuzaklarıyla boğuşmak için dikkate değer bir zamanda yaşadığımızı belirtiyor. “Şirketlerin, ürünleri ve hizmetleri çok daha akıllı, çalışanları çok daha üretken ve süreçleri çok daha verimli hale getirmek için bu son derece dönüştürücü teknolojileri nasıl alıp uygulamaya koyacaklarını bulmalarına yardımcı oluyorum” diyor.

 

Kaynak: https://news.mit.edu/2023/generating-opportunities-generative-ai-rama-ramakrishnan-1102

 

CEVAP VER

Please enter your comment!
Please enter your name here