Forradalmi áttörés vagy ügyes másolat a legújabb kínai sláger?

Egyesek forradalmi áttörésnek tartják a DeepSeek új nyelvi modelljét, míg mások egy egyszerű másolatnak, utánzatnak titulálták, ami az elmúlt néhány évtized tapasztalata alapján nem is lenne nagy meglepetés Kínától – véli Virág Zsolt, a Hiflylabs alapítója, igazgatóságának elnöke. Szerinte az idei év nagy tanulsága eddig az, hogy az Egyesült Államoknak komolyan számolnia kell Kínával a mesterséges intelligencia területén is.

Nagy port kavart a kínai DeepSeek-R1 megjelenése a globális mesterséges intelligencia (MI) iparágban. Amíg azonban kezdetben sokan földrengésszerű a változásról beszéltek, ma már egyre inkább látható, hogy a modell inkább még több kérdést vet fel, mint amennyi választ nyújt.

A DeepSeek-R1 megjelenése kétségtelenül felkavarta az állóvizet a nyelvi modellek terén, hiszen az elmúlt időszakban úgy tűnt, hogy az amerikai vállalatok egyre inkább megerősítik vezető pozíciójukat. Ma már az Egyesült Államok és Kína közötti technológiai rivalizálás egyik legfontosabb terepe lett az MI, ami miatt nem meglepő, hogy mind az USA, mind Kína sosem látott pénzmennyiséget pumpál az iparágba

– fogalmazott az Economxnak Virág Zsolt.

A gazdaság és az üzleti élet legfrissebb hírei az Economx.hu hírlevelében.

A szakértő szerint ahhoz, hogy értékelni tudjuk a helyzetet, érdemes megnézni, hogy mit tudhatunk a DeepSeek fejlesztőjéről:

a modellt fejlesztő cég Kína egyik legnagyobb befektetési alapja, amely algoritmusok és matematikai modellek alapján hoz meg döntéseket.

Az üzleti intelligencia megoldásokkal, tanácsadással, valamint mobilalkalmazás-fejlesztéssel foglalkozó cég alapítója hozzáteszi ugyanakkor, hogy egyes összeesküvés-elméletek arról szólnak, hogy direkt Donald Trump nagy MI-bejelentésére időzítették az új modell kiadását, hogy megleckéztessék az amerikai technológiai szektort – és letörjék a tőzsdék szárnyalását –, a valóság szerinte azonban az, hogy a vállalat az elmúlt két évben folyamatosan adott ki ígéretes, nyílt licencű modelleket. „Egyre jobbakat és egyre gyorsabbakat, így csak egy karnyújtásnyira volt ez a modell.”

Mennyi volt az annyi?

A DeepSeek előző modelljét, a V3-at hivatalosan mindössze 5-6 millió dollárból fejlesztették, szemben az amerikai versenytársak ennél nagyságrendekkel magasabb összegű beruházásaival.

Ez azonban nem a januárban érkezett R1 fejlesztési költsége, hanem azé modellé, amire épült

– hangsúlyozta Virág Zsolt. Tehát azt nem lehet tudni, hogy mennyi volt a teljes költség – de az biztos, hogy jelentősen alacsonyabb, mint az OpenAI termékeké. Emiatt figyelemre méltó szerinte, hogy a DeepSeek-R1 teljesítménye számos területen – például matematikai problémamegoldásban és kódolásban – felveszi a versenyt a ChatGPT legerősebb modelljeivel.

Mémesített kínai cenzúra

A legtöbb kritikus azt emeli ki a DeepSeekkel kapcsolatban, hogy a kínai cenzúra körüllengi a modellt. Bár a kódolásban, fejlesztésben, matematikai modellekben ez mit sem számít, kétségtelen, hogy a kínai fejlesztések nem nyugati perspektívából „nézik” a világot. A DeepSeek cenzúráját pedig az a mém írja le a legjobban, amely szerint:

„Miről ne kérdezzük a nőket? Az életkorukról.”
„Miről ne kérdezzük a férfiakat? A fizetésükről.”
„És miről ne kérdezzük a DeepSeeket? A Tienanmen téri eseményekről.”

A DeepSeek ugyanis vagy nem hajlandó Kína szempontjából érzékeny témákra válaszolni, vagy ha megteszi, akkor a kínai vezetés szemszögéből mutatja be azt. Természetesen nem is igazán várhatunk mást Virág Zsolt szerint egy olyan fejlesztéstől, amely Kínában készült, hiszen a kínai törvények szerint muszáj az ő narratívájuk szerint válaszolni a világ nagy kérdéseire. Ezzel pedig komolyan számolniuk kell a nyugati vezetőknek, így nem is csoda, hogy egyre több ország igyekszik korlátozni vagy tiltani a kínai modelleket.

Érzékelhető geopolitikai feszültséget okozhat a DeepSeek népszerűsége, hiszen a nyugati társadalomban uralkodó, mainstream nézetekkel ellentétes gondolatok terjedhetnek el Amerikában és Európában, ha sokan fogják használni a kínai szervereken futó változatát, ez pedig egyértelműen ellentétes a nyugati politikusok szándékával

– mondta a szakértő. Ezt alá is támasztják egyébként a betiltásáról szóló hírek.

Azt Virág Zsolt sem vitatja, hogy felmerülnek nemzetbiztonsági kérdések is, amelyek az adatok tárolására vonatkoznak. „Az amerikai hadsereg például tilalmat vezetett be a DeepSeek használatára, mivel aggályok merültek fel azzal kapcsolatban, hogy a modell gyűjti és tárolja az amerikai felhasználók adatait Kínában” – közölte Virág, hozzátéve ugyanakkor, hogy a „jó hír” az, hogy

miután a modell nyílt licencű, ezért létezik olyan verziója, amit letöltve egyrészt kínai cenzúra nélkül, másrészt anélkül használhatunk, hogy Kína irányába küldenénk adataink;
illetve egyes nyugati szolgáltatóknál – például a Microsoft vagy a Perplexity – is elérhetőek az általuk futtatott DeepSeek-R1 verziók.

Tanár és diák?

Felvetődött az is, hogy a DeepSeek modelleket a ChatGPT-vel tanították volna egy olyan gépi tanulási technikával, amelynek lényege, hogy egy nagyobb és erősebb modellt, a „tanármodellt” használunk egy kisebb modell, a „diákmodell” betanítására (szaknyelven desztillálás). A híresztelés szerint a ChatGPT-t tanármodellként használva gyűjthették össze a válaszait, majd szinte kizárólag ezekkel tanították be a kínai modellt – azonban Virág Zsolt szerint ezt az elméletet még nem tudták igazolni. Szerinte valószínűbb az, hogy az R1 nem a ChatGPT „desztillációja”, hanem sokkal inkább úgy lehet elképzelni a kapcsolatot, hogy a GPT polcáról „levett egy-két könyvet”, de a személyisége és tudása nagy része máshonnan származik.

„A nyugati MI kutatólaborok esetében bevett módszer, hogy egymás modelljeit is használják az interneten elérhető tanítóadatok kiegészítésére, ebben az esetben tehát csak a politikai szempontok miatt nevezhették egyesek »lopásnak«, hogy a kínai fejlesztők is felhasználtak más modelleket ilyen módon” – mondta. A kínai MI-modellek előretörése szerinte arra késztetik az amerikai iparági vezetőket, hogy felülvizsgálják stratégiáikat és felgyorsítsák az innovációt. A nyugati MI-fejlesztők ígéretet tettek modellek minőségének javítására, válaszul a DeepSeek előretörésére.

Valójában az MI fejlődésének ma komoly gátja, hogy a modellek energiafaló szörnyekké váltak. Eddig ugyanis nem volt túlságosan fontos a hatékonyság

– emelte ki a cégvezető.

A DeepSeek megjelenése Virág Zsolt szerint arra sarkallja a szektort, hogy sokkal energiahatékonyabban fejlesszenek és működjenek, miközben a nyílt licenc és publikus kutatási módszertan miatt határokon átívelő összefogásra sarkallják a nemzetközi fejlesztő közösséget is. „Ez a felhasználók számára mindenképp jó hír, hiszen mindenki számára elérhetőbb és hatékonyabb MI-megoldások jöhetnek létre” – összegzett a Hiflylabs alapítója.