Két új nyílt GPT modellt tett hozzáférhetővé az OpenAI

Az OpenAI gpt-oss modell néven kedden két új, teljesen nyíltan hozzáférhető nyelvi modellt adott ki, méghozzá ingyenesen. Ez nemcsak technológiai szempontból jelentős lépés, hanem kommunikációs fordulat is a mesterséges intelligencia piacán, hiszen az OpenAI ezzel visszatért ahhoz az alapelvéhez, amellyel egy évtizede elindult: az MI-t mindenki számára elérhetővé tenni.

A most bemutatott gpt-oss-120b és gpt-oss-20b modellek nem csak abban különböznek, hogy mekkora számítási kapacitás szükséges a futtatásukhoz, hanem abban is, hogy mit szimbolizálnak. A nyílt forráskódú és ingyenes hozzáférés egyszerre jelent lehetőséget fejlesztőknek, kutatóknak és kis cégeknek, akik eddig csak korlátozottan férhettek hozzá fejlett nyelvi modellekhez.

Mi az a gpt-oss modell, és miért fontos?

Az OpenAI gpt-oss modell nevében az „oss” nem véletlenül emlékeztet az „open source software” rövidítésére – ez a lépés valóban egyfajta nyílt forráskódú fordulatként értelmezhető. Bár a kód nem teljesen open source (hiszen például a tanításhoz használt adatok csak részben nyilvánosak), a modellek teljes súlyai hozzáférhetők, ami ritkaság az iparágban.

A két új modell:

gpt-oss-120b: egy nagy teljesítményű modell, amelynek futtatásához például egy Nvidia A100 GPU is elég – ez az o4-mini szintjét célozza meg.
gpt-oss-20b: egy kisebb modell, amely akár egy felső-középkategóriás gémer gépen is elfut – az o3-mini szintjén teljesít.

Mindkét modell tanítható és finomhangolható, tehát nemcsak kiindulási alapnak jók, hanem konkrét feladatokra is testreszabhatók.

Miért most jött el ez a fordulat?

A válasz egyszerre stratégiai és filozófiai. A Telex cikke szerint az OpenAI-nál egyfajta „emlékezés” történt: eszükbe jutott, hogy eredetileg nem a több száz dolláros előfizetésekért és csillogó funkciókért jöttek létre, hanem azért, hogy a mesterséges intelligenciát az emberiség javára fejlesszék.

A másik ok azonban kézzelfoghatóbb: a Meta, a kínai DeepSeek és más versenytársak egyre több nyílt, versenyképes modell kiadásával szorítják az OpenAI-t. Egy ideje már látható volt, hogy a zárt rendszerű, előfizetéses modell nem fenntartható hosszú távon, ha közben a világ nyílt megoldásokra vágyik.

Mit tudnak ezek az új modellek?

A gpt-oss-120b és gpt-oss-20b is képes arra, hogy az emberi gondolkodáshoz hasonló módon, úgynevezett „reasoning”-alapú logikával oldjon meg feladatokat. Ez a képesség korábban jellemzően csak a legdrágább modellek kiváltsága volt.

A 120 milliárd paraméteres modell komolyabb MI-alapú rendszerekhez is alkalmas lehet, például ügyfélszolgálati chatbotok, okos dokumentumkezelők vagy komplex adatértelmező rendszerek alapjaként. A 20 milliárd paraméteres változat viszont már kisebb cégek és egyéni fejlesztők számára is elérhető teljesítményű – és ami még fontosabb, használható is, anélkül, hogy brutális hardverparkot kellene mögé tenni.

Finomhangolhatóság és átláthatóság

Az egyik legnagyobb előnye ezeknek a modelleknek, hogy finomhangolhatók. Azaz nemcsak általános szövegértésre képesek, hanem testre is szabhatók – például jogi, orvosi vagy technológiai szövegkörnyezethez.

Az OpenAI nemcsak a modellek súlyait tette elérhetővé, hanem azt is nyilvánosságra hozta, hogyan történtek a tanítási folyamatok, milyen adatokat használtak, milyen szűrési módszereket alkalmaztak. Ez különösen fontos lépés az átláthatóság felé, amire sok kritikus hívta fel korábban a figyelmet.

Miben más ez, mint a GPT-4 vagy a ChatGPT?

A GPT-4 (és a hozzá kapcsolódó ChatGPT) továbbra is egy zárt modell, előfizetéses rendszerben érhető el, és bár a teljesítménye jobb lehet, nem lehet hozzáférni a belső működéséhez vagy módosítani azt. Az OpenAI gpt-oss modell ezzel szemben szabadon használható, sőt – módosítható is.

Ez azt jelenti, hogy aki egyedi alkalmazásokat, saját márkás AI-megoldásokat, vagy akár csak kísérleti projekteket futtatna, annak ezek a modellek lehetőséget biztosítanak. Nem kell hozzájuk API-kulcs, előfizetés vagy bármilyen zárt rendszerhez való kapcsolódás.

Versenytársak, nyomás és stratégiaváltás

A nyílt modellek piacán eddig főként a Meta (pl. Llama 3) és a kínai cégek (DeepSeek, Baichuan) számítottak meghatározónak. Az OpenAI most egyértelműen válaszolt erre a kihívásra: nemcsak hogy belépett ebbe a versenybe, hanem rögtön két versenyképes modellt is kiadott.

A Science Alert szerint az OpenAI több céggel is együttműködik már, hogy ezeket a modelleket valós ipari környezetben is használni lehessen. Ez lehet például egészségügyi adatfeldolgozás, oktatási platformok, vagy éppen jogi asszisztensek fejlesztése.

Mit jelent ez a jövőre nézve?

Ha az OpenAI komolyan gondolja a nyíltságot, akkor a jövőben akár több ilyen nyílt modellt is láthatunk tőlük. Ez egyben azt is jelenti, hogy az MI-fejlesztés nem csak óriáscégek kiváltsága lesz, hanem egyre inkább demokratizálódik.

Az openai gpt-oss modell így nemcsak technológiai újítás, hanem stratégiai üzenet is: a mesterséges intelligencia nem zárható be örökre fizetős falak mögé. Legalábbis nem akkor, ha valóban a globális haszonszerzésen túl az emberiség javát is szolgálni akarjuk.

A szabadság ára és lehetőségei

Bár a modellek használata ingyenes és nyílt, azt nem szabad elfelejteni, hogy az MI alkalmazása komoly felelősség is. A nyílt súlyú modellek finomhangolhatók, de ha rossz kezekbe kerülnek, vagy etikátlan célra használják őket, abból problémák is lehetnek.

Éppen ezért kulcsfontosságú lesz az is, hogy a közösség, a kutatók, a civil szervezetek és a szabályozók hogyan reagálnak erre az új helyzetre. A nyílt modellek használata csak akkor lehet valóban előnyös, ha átláthatóság, etika és hozzáértés is társul hozzá.

Mire lehet képes egy otthoni gépen futó GPT?

Az openai gpt-oss modell kisebbik verziója, a 20b, már egy egyszerűbb gémer gépen is elindulhat – 16 GB VRAM-mal simán elmegy. Ez azt jelenti, hogy olyan dolgok, amik korábban csak a felhőben működtek (mint például egy személyes asszisztens, nyelvi fordító vagy jegyzetelő AI), mostantól akár a saját gépeden is elérhetőek lehetnek – offline.

Ez nemcsak a szabadságot növeli, de a biztonságot is, hiszen nem kell adatokat küldeni külső szerverekre, hanem minden helyben történik.