Yapay Bülten 66 (Google, Firebase Studio, Veo 2, Live API ve Gemini Live'ın yeni özelliklerini tanıttı)

30 Mart – 13 Nisan 2025 tarihleri arasında yapay zeka dünyasındaki en önemli gelişmeler.

ChatGPT artık eski konuşmaların tamamını hatırlayabiliyor. Kullanıcı tercihlerini ve biyografileri zamanla öğrenerek daha kişisel ve doğal yanıtlar verebiliyor.

OpenAI’ın önümüzdeki hafta GPT-4.1, GPT-4o’nun yeni versiyonları ve mini ile nano modellerini tanıtılacağı söyleniyor.

Google, kullanıcıların tarayıcı üzerinden doğal dil, şablonlar veya mevcut kod depolarıyla tam mobil ve web uygulamaları oluşturmasını sağlayan yapay zeka destekli Firebase Studio platformunu tanıttı.

Google’ın en gelişmiş video üretim modeli Veo 2 artık Gemini API üzerinden geliştiricilerin erişimine açıldı. Veo 2, metin veya görsel girdilerden video oluşturabiliyor.

Google, çok dilli destek ve yeni ses seçenekleriyle güçlendirdiği Live API‘yi kullanıma açtı. Yeni arayüzü ve gelişmiş ses algılama özellikleri sayesinde geliştiriciler için daha işlevsel hale geldi.

Google, yedinci nesil özel çipi Ironwood ile her biri 9.216 çip içeren pod başına 42 Exaflop’tan fazla işlem gücü sunuyor. 192 GB bellek kapasitesiyle dikkat çeken çip önceki nesline kıyasla 6 kat daha fazla bellek ve hız vaat ediyor.

Google, Gemini Live’a görüntü ve ses algılama özelliği ekledi. Project Astra teknolojisi sayesinde kullanıcılar kamera veya ekran paylaşımı yoluyla Gemini uygulamasına daha zengin içerikler aktarabilecek.

Meta, hafta sonu süpriz yaparak Scout, Maverick ve Behemoth isimli üç yeni Llama 4 modelini tanıttı. Scout tek bir Nvidia çipte çalışabilirken, Maverick çoklu dil ve görsel-işitsel destek sunuyor. Behemoth ise GPT-4.5’i geride bırakan performansıyla öne çıkıyor.

Meta, konuşan karakterler üreten MoCha modelini tanıttı. MoCha, gerçekçi yüz ifadeleri ve el hareketleriyle konuşan karakterler üretebiliyor.

Midjourney, yaklaşık bir yıl aradan sonra V7 adlı yeni görsel yapay zeka modelini tanıttı.

Runway, sahneler arası tutarlılık, karakter ve stil devamlılığı ile uzun format video üretebilen Gen-4 video modelini tanıttı.

Grok 3 artık API üzerinden kullanılabiliyor. Grok 3 için giriş token’ı maliyeti milyon başına 3$, çıkış ise 15$ olacak. Grok 3 Mini ise sırasıyla 0.30$ ve 0.50$ ile fiyatlandırılacak.

Anthropic, Claude kullanıcıları için yeni fiyatlandırma planları tanıttı. Yeni Max planı ayda 100$ karşılığında 5 kat, 200$ karşılığında ise 20 kat daha fazla kullanım hakkı sunuyor.

TikTok’un sahibi olan ByteDance, sabit görselleri yüksek gerçekçilikle videoya dönüştüren DreamActor-M1 modelini tanıttı.

Genspark’ın AI Super Agent’ı 9 günde 10 milyon $ ARR’a ulaştı.

Stanford raporu’na göre Çin’in LLM’leri ABD’yi yakalıyor. ABD geçen yıl 40 gelişmiş model yayınlarken, Çin 15 model yayınladı ancak kalite açısından aradaki fark büyük ölçüde kapandı. Çin modelleri artık benchmarklarda ABD’li rakipleriyle benzer puanlar alıyor.

Yatırım haberleri

Eski OpenAI CTO’su Mira Murati, yeni yapay zeka girişimi Thinking Machines Lab için 2 milyar dolar yatırım topladığı söyleniyor. Söylenti doğru çıkarsa gelmiş geçmiş en büyük tohum yatırım turu olacak.

Nvidia destekli AI video girişimi Runway, 3 milyar dolar değerleme ile 308 milyon dolar yatırım aldı.