Telefon

OpenAI'dan GPT-4o Metin, Ses ve Görüntüde Duygusal Etkileşim

Melih ÖZKAŞ
13 Mayıs 2024
2 Dakika

OpenAI, pazartesi günü GPT 4o adını verdiği yepyeni bir yapay zeka modelini duyurdu. Şirketin iddiasına göre bu model, “daha doğal insan bilgisayar etkileşimi”ne bir adım daha yaklaşıyor. Yeni model, metin, ses ve görüntü kombinasyonlarını girdi olarak kabul edebilir ve üç formatta da çıktı üretebilir. Ayrıca duyguları tanıyabilir, konuşma sırasında müdahale etmenize izin verir ve konuşma sırasında neredeyse insan hızında yanıt verebilir.

OpenAI CTO Mira Murati’nin canlı yayında yaptığı sunumda, “GPT 4o’nun özel yanı, GPT 4 seviyesindeki zekayı ücretsiz kullanıcılar da dahil olmak üzere herkese getirmesidir,” dedi. “Bu, kullanım kolaylığı konusunda büyük bir adım atmamızın ilk adımıdır.”

Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN

Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) May 13, 2024

Sunum sırasında, OpenAI, GPT 4o’nun canlı olarak İngilizce ve İtalyanca arasında çeviri yaparken, bir araştırmacının gerçek zamanlı olarak bir lineer denklemi çözmesine yardımcı olurken, başka bir OpenAI yöneticisinin nefes alış verişlerini dinleyerek derin nefes alma konusunda rehberlik sağladığını gösterdi.

GPT 4o’nun “o” harfi, modelin çoklu yeteneklerine atıfta bulunarak “omni” anlamına geliyor. OpenAI, GPT 4o’nun metin, görüntü ve ses üzerine eğitildiğini belirtti, yani bütün girdi ve çıktılar aynı sinir ağı tarafından işlenir. Bu, şirketin önceki modelleri olan GPT 3.5 ve GPT 4’ün aksine, kullanıcıların sadece konuşarak soru sormasına izin vermekte ancak konuşmayı metne çevirmekte olan modellerden farklıdır. Bu da tonu ve duyguyu dışarıda bırakır ve etkileşimleri yavaşlatır.

OpenAI, yeni modeli birkaç hafta içinde ücretsiz ChatGPT kullanıcıları da dahil olmak üzere herkese sunacak ve ayrıca ChatGPT’nin masaüstü sürümünü de (başlangıçta Mac için) çıkartacak ve başlangıçta ödeme yapan kullanıcılar erişebilecek.

OpenAI’nın duyurusu, Google’ın yıllık geliştirici konferansı olan Google I/O’dan bir gün önce geldi. OpenAI’nın GPT 4o’yu duyurmasının ardından Google da kendi AI sohbet botu Gemini'nin benzer yeteneklere sahip bir sürümünü paylaştı.

Paylaş:

Başka Haber

Sony WH 1000XM6 Yeni Nesil Kablosuz Kulaklık Deneyimi

Başka Haber

Sistina Şapeli’nde Beyaz Duman Yeni Papa Robert Prevost

Kategoriler

Teknoloji

Bilim

Akıllı Telefon

Oyun

Dizi / Film

Otomobil

OpenAI'dan GPT-4o Metin, Ses ve Görüntüde Duygusal Etkileşim

Paylaş:

Sony WH 1000XM6 Yeni Nesil Kablosuz Kulaklık Deneyimi

Sistina Şapeli’nde Beyaz Duman Yeni Papa Robert Prevost

Kategoriler

Bakmaya Değer

Sony WH 1000XM6 Yeni Nesil Kablosuz Kulaklık Deneyimi

Sistina Şapeli’nde Beyaz Duman Yeni Papa Robert Prevost

Gmail'e Alternatif Notion Mail ile E posta Deneyimini Yenile

Dead Reckoning Aksiyon Teknoloji ve Tom Cruise Buluşuyor!

Meta'nın Llama 4 Serisi Yapay Zekada Yeni Bir Dönem Başlıyor

Midjourney V7 Yapay Zeka ile Görsel Üretimde Yeni Dönem

Volkan Konak'ın Trajik Kaybı Müziğimizde Derin Bir Yaradır

F1 2025’in LiDAR Teknolojisiyle Yarış Deneyimi Yenileniyor

Gmail'e Alternatif Notion Mail ile E posta Deneyimini Yenile