ChatGPT'nin geliştiricisi OpenAI, yeni nesil ürününü duyurdu: kod adı "Strawberry" olan ve resmen OpenAI o1 olarak adlandırılan bir yapay zeka modeli.
Daha spesifik olmak gerekirse, o1 aslında bir model koleksiyonu. Şu anda ChatGPT ve OpenAI API'si üzerinden iki versiyonu erişime açılmış durumda: o1-preview ve daha küçük ve ucuz olan o1 mini. Bu modellere erişim için ChatGPT Plus veya Team aboneliğiniz olması gerekiyor. Kurumsal ve eğitim kullanıcıları ise önümüzdeki hafta bu modellere erken erişim sağlayabilecekler.
Ancak şunu belirtmekte fayda var ki o1'in sohbet deneyimi şu an için oldukça temel. ChatGPT'nin aksine, o1 henüz web taraması yapamıyor veya dosyaları analiz edemiyor. Ayrıca mesaj gönderim limitleri bulunuyor; o1-preview için haftalık 30, o1-mini içinse 50 mesaj sınırı var. API üzerinden o1-preview kullanımı ise oldukça maliyetli: 1 milyon giriş tokenı için 15 dolar (GPT-4o'nun üç katı), 1 milyon çıkış tokenı içinse 60 dolar (GPT-4o'nun dört katı). (1 milyon token yaklaşık 750.000 kelimeye eşdeğerdir.)
OpenAI, o1-mini'yi tüm ChatGPT ücretsiz kullanıcılarına sunmayı planladığını söylüyor, ancak henüz bir çıkış tarihi belirlenmiş değil. O1'in en dikkat çekici özelliklerinden biri, kendini doğrulama yeteneği. OpenAI'ye göre, o1 verilen komut veya sorunun tüm parçalarını daha uzun süre inceleyerek kendi hatalarını tespit edebiliyor. Bu, o1'i diğer generatif yapay zeka modellerinden farklı kılan en önemli özelliklerden biri.
O1, özellikle matematik ve programlama gibi karmaşık problemlerin çözümünde yetenekli. Örneğin, o1 bir görevi yerine getirirken tüm aşamaları dikkatlice planlıyor ve her adımın sonucunu değerlendirerek doğru cevaba ulaşıyor. Bu da o1'i, avukatların e-postalarını taramak gibi çok adımlı görevler için ideal hale getiriyor.
OpenAI araştırmacısı Noam Brown, o1’in takviyeli öğrenme (reinforcement learning) ile eğitildiğini ve bu sayede sistemin yanıt vermeden önce düşünmesini sağlayan özel bir öğrenme algoritması kullanıldığını belirtiyor. Brown, “O1 ne kadar uzun düşünürse, özellikle mantıksal görevlerde o kadar iyi sonuç veriyor” diye ekledi.
OpenAI ayrıca o1'in, Uluslararası Matematik Olimpiyatları elemelerinde sorunların %83'ünü doğru çözdüğünü, GPT-4o'nun ise yalnızca %13'ünü çözebildiğini iddia ediyor. O1’in Codeforces gibi programlama yarışmalarında ise %89 başarı oranına ulaştığı belirtiliyor.
Öte yandan, o1'in dezavantajları da yok değil. O1 bazı sorulara yanıt verirken diğer modellere göre daha yavaş olabiliyor; yanıtların gelmesi on saniyeyi bulabiliyor. Ancak sohbet sürümü, her adımı ekranda göstererek kullanıcıya modelin ne yaptığını bildiriyor. O1'in eksiklikleri zamanla daha net ortaya çıkacak gibi görünüyor. Diğer rakip firmaların da benzer modeller geliştirmesi bekleniyor ancak o1 bu konuda şimdilik öncü konumda.
Comments