Yapay zekanın potansiyeli, yalnızca birkaç şirket tarafından kontrol edildiği sürece sınırlı kalacaktır. Bugünkü yapay zeka modellerinin çoğu, geliştirilmesi ve eğitilmesi için büyük kaynaklar gerektirdiğinden, birçok kişi ve şirket için erişilemez durumda. Jonathan Frankle ve MIT Doçenti Michael Carbin tarafından kurulan MosaicML, bu durumu değiştirmeyi hedefliyor. MosaicML, kullanıcıların kendi verilerini kullanarak açık kaynak modellerini eğitmelerine, iyileştirmelerine ve izlemelerine olanak tanıyan bir platform geliştirdi. Nvidia GPU’ları kullanarak kendi modellerini inşa eden MosaicML, generatif yapay zeka ve büyük dil modelleri (LLM’ler) gibi alanların büyümesiyle birlikte derin öğrenmeyi daha erişilebilir hale getirdi.
MosaicML’nin bu yaklaşımı, lider bir veri depolama, analitik ve yapay zeka şirketi olan Databricks’in dikkatini çekti ve Databricks, MosaicML’yi satın aldı. İki şirketin birleşen uzmanlığı, okuma anlama ve mantık bulmacaları gibi görevlerde mükemmel olan DBRX adında, en verimli ve yüksek performanslı açık kaynaklı LLM’lerden birini oluşturdu. DBRX’in önemi sadece performansında değil, aynı zamanda Databricks araçları kullanılarak inşa edilmesinde yatıyor; bu da diğer şirketlerin kendi modelleriyle benzer başarıyı elde etmelerine olanak tanıyarak generatif yapay zekanın etkisini hızlandırıyor.
Princeton Üniversitesi’nde bilgisayar bilimleri alanında lisans ve yüksek lisans dereceleri, MIT’de ise doktora derecesi bulunan Jonathan Frankle, çalışmalarına başladığında derin öğrenme alanına odaklanmayı seçti. Bu alan, çalışmalarına başladığı dönemde çok da popüler değildi. 2017 yılında Google tarafından yayımlanan ve dil çevirisi ile içerik üretiminde devrim niteliğinde olan transformer mimarisini tanıtan bir makale ile bu alan büyük bir ivme kazandı.
2020 yılında Frankle ve Carbin, birlikte yazdıkları bir araştırma makalesini okuyan teknoloji yöneticisi Naveen Rao tarafından bir şirket kurma önerisi aldı. Söz konusu makalede, performanstan ödün vermeden derin öğrenme modellerini küçültmenin bir yolu gösterilmişti. Hanlin Tang ile birlikte MosaicML’yi kurarak, yapay zeka model eğitiminin verimliliğini artırmaya odaklandılar. Görüntü sınıflandırmasını daha hızlı hale getiren çeşitli teknikleri bir araya getirme gibi yenilikleri, MosaicML’nin başarısına önemli katkıda bulundu.
MosaicML’nin, özellikle açık kaynak modeller aracılığıyla yapay zekayı demokratikleştirme misyonu, MIT’nin E14 Fonu da dahil olmak üzere birçok kişi tarafından takdir edildi ve bu fon, şirketin A Serisi yatırım turuna katıldı. Bu demokratikleşme, daha fazla şirketin kendi üretken yapay zeka modellerini eğitmesine olanak tanıyarak yapay zeka geliştirme sürecine daha geniş bir katılım sağladı.
Databricks tarafından satın alınması, MosaicML’nin etkisini daha da artırmasına olanak tanıdı. Mart ayında Databricks, daha önce yalnızca tescilli modellere özgü yetenekleri açık kaynak topluluğu ve işletmelerin kullanımına sunan DBRX’i piyasaya sürdü. DBRX, büyük işletmelerde özellikle değerli olduğunu kanıtladı ve ince ayarlarla sürekli olarak gelişmeye devam ediyor; bu da onu GPT gibi kapalı modellere güçlü bir alternatif haline getiriyor.
Frankle, yapay zeka inovasyonunda açık kaynak teknolojisinin önemini vurguluyor ve teknoloji geliştirmede bilimsel ve işbirlikçi bir yaklaşımı savunuyor. Endüstrinin, ilerleme ve yapay zekanın başarılı bir şekilde gelişmesi için açıklığı benimsemeye devam etmesini umuyor.
Kaynak: MIT19