Neden Yapay Zekâ Bugünlerde Popüler Oldu?

ChatGPT ve benzeri sistemlere LLM (Large Language Model – Büyük Dil Modeli) diyoruz. Bu modellerin özelliği, milyonlarca yapay sinir ağı içeriyor olmaları ve bu sinir ağlarının milyarlarca kelimeyle eğitilmiş olmasıdır. Yapay sinir ağlarında, bir sinir düğümünden diğerine bağlantı kurulurken, bu bağlantılar belirli ağırlıklarla çarpılır. İstenilen sonucu elde etmek için bu ağırlıkların ayarlanmasına yapay sinir ağının eğitilmesi denir.

Ensar GÜL

Prof. Dr., Maltepe Üni. Öğretim Üyesi

Yaklaşık 75 sene önce, bilgisayarın icadı ile birlikte bir insanın saatlerce uğraşıp yaptığı hesaplamalar saniyeler içinde yapılmaya başlandı. Bilahare, sadece bilimsel hesaplarda değil, şirketlerin günlük işlerinin yapılmasında da bilgisayarlar kullanılmaya başlandı. Örneğin, binlerce kişinin çalıştığı bir şirkette maaş hesaplamaları ve bordroların çıkarılmasını düşünelim. Bütün bordroları elle hazırlarsanız, çok sayıda kişinin günlerce çalışması gerekir. Halbuki yapılan iş, rutin bir iştir ve yazılan bir bordro programı ile bilgisayar tarafından çok kısa sürede yapılabilir.

İlk bilgisayarlar, “lamba” diye adlandırdığımız elektronik elemanlar ile yapılmaktaydı. Lambaların boyu birkaç santimetre olduğu için bilgisayar da çok yer kaplıyordu ve ağırlığı çok fazlaydı. Transistörün icadı ve 1950’li yıllarda bilgisayar yapımında kullanılmaya başlanmasıyla birlikte, bilgisayarların hem ağırlığı hem de hacmi küçüldü; hesaplama kapasitesi ve gücü arttı.

Çok hızlı işlem yapabilen bilgisayarlar acaba zeki makineler haline gelebilir miydi? Bu soru, bilim adamları ve mühendisler tarafından gündeme getirildi ve ilk olarak 1955 yılında “yapay zekâ” terimi kullanıldı.

Bilim adamları, önce insan beyninin yapısını örnek alarak, beyinde yer alan sinir ağlarının bilgisayarda simülasyonunu yaparak zeki bir sistem elde etmeye çalıştılar. Fakat o zamanki bilgisayarlar, çok sayıda sinir düğümünü simüle edecek kadar güçlü değildi. 1960’lı yılların ortalarında, on sene içinde zeki bilgisayarların yapılacağı öngörüldü; fakat bu öngörü gerçekleşmedi. Japonya’nın 1980’lerde başlattığı beşinci nesil bilgisayar projesi, insanlar gibi mantık yürütmeyi ve konuştuğumuz dili anlamayı hedefledi; fakat bu hedef gerçekleşmedi ve proje durduruldu. Bundan sonra yapay zekâya olan ilgi azaldı.

2000’li yıllarda ise hesaplama gücünün çok artması ve yapay sinir ağlarındaki teorik gelişmeler sonucu, özellikle tercüme, resim ve ses tanıma işlemleri yapay sinir ağları ile yapılabildi.  Teorik gelişmelerin yanında, pratikte GPU (grafik işlemcisi) kullanılarak daha önce gerçekleştirilmesi mümkün olmayan yapay sinir ağları modelleri gerçekleştirildi. 2010’lu yıllarda ise yapay Siri ve Alexa gibi, yapay sinir ağları tabanlı yapay zekâ ürünleri ortaya çıktı. Bu yıllardaki en önemli gelişme, Google mühendisleri tarafından geliştirilen yeni bir yapay sinir ağı modelinin tercüme yapmak için kullanılması ve çok başarılı olmasaydı. OpenAI firması ise aynı modeli kullanarak sadece tercüme değil, herhangi bir giriş cümlesi girildiğinde metin üretecek şekilde GPT-3 ismini verdiği bir sistem geliştirdi. Bu modelin daha gelişmiş bir hali, Kasım 2022’de ChatGPT ismiyle kullanıma açıldı. Bundan sonra diğer firmalar da benzer sistemleri geliştirmek için yarışa girdi.

ChatGPT ve benzeri sistemlere LLM (Large Language Model – Büyük Dil Modeli) diyoruz. Bu modellerin özelliği, milyonlarca yapay sinir ağı içeriyor olmaları ve bu sinir ağlarının milyarlarca kelimeyle eğitilmiş olmasıdır. Yapay sinir ağlarında, bir sinir düğümünden diğerine bağlantı kurulurken, bu bağlantılar belirli ağırlıklarla çarpılır. İstenilen sonucu elde etmek için bu ağırlıkların ayarlanmasına yapay sinir ağının eğitilmesi denir.

Eğitim tamamlandıktan sonra, örneğin bir LLM modeline “Bugün hava açık, güneş” cümlesini verdiğimizde, model önce kelimeleri sayısal değerlere çevirerek yapay sinir ağına gönderir. Yapay sinir ağı ise “güneş” kelimesinden sonra gelebilecek olası kelimeleri üretir ve bunların olasılıklarını hesaplar. En yüksek olasılığa sahip olan kelimeyi —örneğin “parlıyor” — seçer. Sonraki adımda ise “parlıyor” kelimesi de dikkate alınarak bir sonraki kelime üretilir.

Nasıl ki bilgisayarlar ve üzerinde çalışan programlar; muhasebe, bankacılık, rezervasyon ve internet üzerinden alışveriş gibi işlemlerde otomasyon sağlamışsa, LLM’ler de bu işleri bir adım öteye taşımıştır. Örneğin, internet üzerinden alışveriş yaparken seçtiğiniz ürünlere göre size yeni ürünler öneriyor; çektirdiğiniz röntgeni, bir uzman doktordan daha iyi şekilde analiz edebiliyor. Ayrıca, konusunu belirlediğiniz alanda yapay metin, yapay resim ve yapay video üretip; bilgisayar programları bile yazabiliyor.

Şu anda, dünyadaki araştırma kurumları ve şirketler, LLM’lerin nasıl mantık yürütebileceği ve muhakeme yapabileceği üzerine çalışmalarını sürdürüyor. Bu hedefler gerçekleştirildiğinde, makineler —yani LLM modelleri— insan zekâsını aşan bir yetkinlik sergileyebilir ve bilim ile teknolojideki ilerlemeler baş döndürücü bir hıza ulaşır.