OpenAI ve NVIDIA, RTX GPU’lar üzerinde çalışacak şekilde optimize edilmiş yeni açık yapay zeka model ailesi GPT-OSS’yi duyurdu. Bu iş birliği ile yerel (on-device) çıkarım yapabilen, yüksek performanslı modellerin RTX destekli bilgisayarlarda kullanılabilir hale geldiği belirtildi.

Yeni model ailesi, iki ayrı varyanttan oluşuyor:

  • GPT-OSS-20B:
    En az 16 GB VRAM’e sahip NVIDIA RTX AI PC’lerde çalışmak üzere optimize edilen bu model, RTX 5090 GPU üzerinde saniyede 250 token üretme kapasitesine sahip.

  • GPT-OSS-120B:
    Bu model ise, profesyonel kullanım için geliştirilen RTX PRO GPU’larla hızlandırılmış iş istasyonlarında çalışmak üzere tasarlandı.

Her iki model, NVIDIA H100 GPU’ları üzerinde eğitildi ve MXFP4 hassasiyetini destekleyen ilk modeller oldu. MXFP4, performans kaybı yaşanmadan doğruluk oranını iyileştiren yeni bir teknik olarak öne çıkıyor. Modeller ayrıca 131.072 token’lık bağlam uzunluğu ve mixture-of-experts (MoE) mimarisi ile dikkat çekiyor. Bu mimari, düşünce zinciri (chain-of-thought), talimat takibi ve araç kullanımı gibi gelişmiş görevlerde destek sağlıyor.

Kullanım Alanları ve Geliştirici Araçları

Kullanıcılar ve geliştiriciler, modelleri şu platformlar aracılığıyla deneyimleyebiliyor:

  • Ollama Uygulaması:
    GPT-OSS modelleri, bu uygulama üzerinden ek yapılandırma gerektirmeden kullanılabiliyor.

  • Llama.cpp:
    RTX GPU’lar için optimize edilmiş açık kaynak araçlara destek sağlanırken, CUDA Graphs gibi katkılar performans artırmaya yönelik olarak projeye entegre edildi.

  • Microsoft AI Foundry Local:
    Windows geliştiricileri, modelleri önizleme aşamasındaki AI Foundry üzerinden terminal komutlarıyla çalıştırabiliyor.