Yapay Bülten: 25 (OpenAI, yeni AI ses asistanı ve yeni multi modeli GPT-4o’yu tanıttı)

OpenAI, yeni AI ses asistanı GPT4o’yu tanıttı. Kaynak (24. sayımızda yer verdiğimiz)

  • GPT-4o, ses ve görsel içerikleri anlama konusunda gelişmiş yeteneklere sahip.
  • GPT-4o, “Her” filmindeki gibi sohbet edebiliyor, anlık dil çevirisi yapabiliyor, anlık kamera görüntüsü işleyip matematik problemi çözebiliyor veya kod yazabiliyor.
  • GPT-4o, sesli girdilerde 232 milisaniye (insan yanıt süresine çok yakın) gibi kısa bir sürede yanıt verecek ve gerçek zamanlı tercümanlık yapabilecek.
  • GPT-4o, 50 farklı dilde ve Dünya’nın %97’siyle etkileşime geçebiliyor.
  • GPT-4o herkes tarafından ücretsiz şekilde kullanılabilecek.
  • Önceki her model farklı görevler için kullanılırken GPT-4o, metin, ses ve görsel işlemeyi tek modelde birleştiriyor.
  • Ücretli kullanıcılar GPT-4o’yu 2x daha hızlı ve 5 kat daha fazla kullanabilecek.

Diğer OpenAI gelişmeleri:

OpenAI’ın GPTs mağazası ücretsiz olarak herkes için kullanıma açıldı.

OpenAI, yapay zeka modellerini geliştirmek için Reddit ile anlaşma yaptı. OpenAI’ın modelleri Reddit’deki tartışmalara API ile gerçek zamanlı veri işleyebilecek. Kaynak

OpenAI’ın kurucu ortağı ve baş bilim adamı Ilya Suyskever resmi olarak şirketten ayrıldı. Ilya’nın yerini Jakub Pachocki alacak. Kaynak

OpenAI, GPT’ye Google Drive ve OneDrive’dan dosya yükleyebilecekleri yeni özellik getirdi.


Alphabet I/O etkinliğinde birçok Google uygulaması için yeni yapay zeka özelliklerini tanıttı. Yeni gelen özellikler:

  • Google, Project Astra ile GPT-4o’ya benzer şekilde kamera yardımı ile gerçek zamanlı veri işleyebilecek, kod yazabilecek veya problem çözebilecek.
  • Google, 1080p çözünürlükte çıktı veren metinden video oluşturan Veo‘yu ve gelişmiş görüntü oluşturma modeli Imagen 3‘ü duyurdu. Kaynak
  • Gmail’de yapay zeka yardımı ile geçmiş konuşmalar için özetler oluşturabilir veya yeni gelen maillere yanıt verilebilecek.
  • E-Tablolar’da grafikler oluşturup veri analizi yapılabilecek.
  • Google’ın online uygulamaları (Gmail, e-tablolar gibi) entegre şekilde veri toplayıp bilgi verebilecek.
  • Google arama sorgularına ayrıntılı şekilde yapay zeka ile cevap verecek.

Diğer Google gelişmeleri:

Google, Gemini’ye OpenAI’ın GPT mağazasına benzer şekilde “Gems” adında kişiselleştirilmiş chatbotlar oluşturulabilecek yeni özellik ekledi.

Google Photos, kullanıcıların fotoğraf koleksiyonlarında doğal dil sorgularıyla arama yapılabileceği “Ask Photos” adında yeni bir özellik getirdi. Kaynak

Google, SigLIP görüntü kodlayıcı ve Gemma metin kod çözücüsünü birleştiren yeni bir görüntü-dil modeli olan PaliGemma‘yı tanıttı. Kaynak

Google, JavaScript/TypeScript ile yapay zeka destekli uygulamalar oluşturmak için Apache 2.0 lisansı altında açık kaynaklı Firebase Genkit‘i tanıttı. Genkit; içerik üretimi, özetleme, metin çevirisi ve görsel üretme gibi özelliklere sahip. Kaynak


Japon telekom sağlayıcısı SoftBank Corp, çağrı merkezi çalışanlarının stresini azaltmak ve iyi müşteri ilişkilerini sürdürmek için öfkeli müşteri seslerini temsilcilere yönlendirmeden önce yumuşatmak için yapay zeka kullanacak. Kaynak


ElevenLabs, web sayfalarını, PDF’leri ve metin içeren dosyaları 11 ses seçeneğiyle okuyan AI Audio’ aracını tanıttı. Kaynak


Yatırım haberleri

  • Weka, veri yönetim platformunu desteklemek için 1.6 milyar dolar değerleme üzerinden 140 milyon dolar yatırım aldı. Kaynak
  • Londra merkezli, çağrı merkezleri için yapay zeka sesli asistanlar üreten PolyAI, 500 milyon değerleme üzerinden 50 milyon dolar yatırım aldı. Kaynak
  • Voxel51, görsel yapay zeka platformunu geliştirmek için 30 milyon dolar yatırım aldı. Şirket değerlemesi paylaşılmadı. Kaynak