Az 1,4 milliárd lakosú Kína  számos ígéretes AI startupot és projektet indított el az utóbbi időben, miközben a világ vezető internetes szereplői éveket töltöttek az ilyen új vállalkozások támogatására szolgáló infrastruktúra kiépítésével és fejlesztésével.

Mivel a DeepSeek tapasztalatai megkérdőjelezik, hogy szükség van-e olyan rendkívül drága hardverekre, mint amilyeneket például az Nvidia fejleszt, a feltörekvő kínai mesterségesintelligencia-vállalatok kilátásai javulni látszanak.

A Bloomberg összegyűjtötte, melyek azok a kínai startup cégek és szolgáltatások, amelyeket érdemes szemmel tartani. 

Moonshot

A Moonshotot a Tsinghua Egyetem adjunktusa, Yang Zhilin alapította, aki korábban a Meta Platforms és az Alphabet Google AI-projektjein dolgozott.  A DeepSeek R1-el egy napon bejelentett modell ahhoz hasonló elven működik és egy gondolatláncos megközelítést használ a lekérdezésre adott válasz megtalálására és finomítására. A Kimi k1.5 a rövidebb válaszokhoz készült, és akár 2 millió kínai karakteres kontextust is támogat, amely a korábbi beszélgetésektől kezdve a felhasználói szándékon át a körülményekig mindent tartalmazhat.

Zhipu

A Zhipu már egy sor alkalmazást adott ki, köztük egy olyat, amely képes szimulálni a felhasználó tevékenységét okostelefonon vagy webböngészőn. A beszéd mesterséges intelligenciamodellje az emberi hangszín, az érzelmek és a tökéletlenségek - például a töltelékszavak, a szünetek és az időnkénti lélegzetvétel - szimulációját tartalmazza. Az amerikai kereskedelmi minisztérium a Biden-kormányzat utolsó napjaiban feketelistára tette a vállalatot. Az elit Tsinghua Egyetem a Zhipu sikerét öregdiákjának, Tang Jie-nek tulajdonította. Egyébként  Tang volt a már említett Moonshot vezetőjének a mentora is, amikor az az egyetemen tanult.

Alibaba

Kína vezető e-kereskedelmi és felhőalapú számítástechnikai vállalata napokkal azután rukkolt elő modelljének legújabb verziójával, hogy a DeepSeek bemutatása világszerte hullámokat kavart, jobb benchmark eredményekkel kecsegtetve. Az Alibaba Group nem mellesleg a Tencent Holdings  mellett a listán szereplő startupok többségében is részesedéssel rendelkezik, miközben versenyben van velük. Eddie Wu vezérigazgató irányítása alatt a vállalat most újra a fő erősségeire összpontosít, amelyeknek a felhőalapú számítástechnika és az AI-hullám meglovagolása kulcsfontosságú elemei.

ByteDance

Kína legnépszerűbb fogyasztói chatbotja a TikTok anyavállalatától származik. Saját bevallása szerint a ByteDance-nek van még némi felzárkóznivalója a mesterséges intelligencia terén, és ezt kiemelt prioritásként is kezeli. A Doubao chatbot a Mixture of Experts (MoE) gépi tanulási megközelítéssel épül fel, amely meglehetősen elterjedt  a kínai AI-modellek körében. A Doubao a szellemes, emberihez hasonló beszélgetésnek és a felhasználóbarát felületnek köszönhetően nyert teret az országban. Képkészítő funkciói a fiatal felhasználók számára is vonzóvá teszik. 

Baichuan

A Baichuan legújabb modellje a mélygondolkodásnak nevezett technikát alkalmazza - vagyis egy olyan összetett érvelési és problémamegoldó megközelítést, amely azt utánozza, ahogyan az emberek dolgoznak a problémákon. A vállalat egy bizonyított tényeken alapuló orvosi modellt kínál, amelyet egészségügyi kutatások és adatok lekérdezésére terveztek az egészségügyi szakemberek és akadémikusok számára. 

Minimax

A Minimax az úgynevezett Lightning Attention mechanizmust használja a rendkívül hosszú adatsorok hatékony lebontására kisebb, kezelhető adattömbökre. A modellt úgy tervezték, hogy egy hosszú szövegből a legfontosabb részeket rangsorolja, anélkül, hogy elakadna. Az alapító Yan Junjie a Kínai Tudományos Akadémián doktorált, majd a Tsinghua Egyetemen folytatta tanulmányait. A SenseTime alelnöke volt, mielőtt onnan a Minimax megalapítása érdekében távozott.

01.AI

A DeepSeek-hez hasonlóan nyílt forráskódú 01.AI tavaly októberben adta ki a Yi-Lightning Mixture of Experts modellt, amely szorosan az OpenAI és a Google zárt forráskódú modelljei mögött végzett egy benchmarkon. A startup, amely állítása szerint az iparági vezetőknél jóval alacsonyabb költséggel képezi ki AI-modelljeit, a legmesszebbre jutott szolgáltatásainak kereskedelmi forgalomba hozatalában, és különböző iparági alkalmazásokhoz készít megoldásokat. A múlt hónap elején bejelentette, hogy az Alibabával közös fejlesztési projektet indít. 

Stepfun

A Stepfun legújabb terméke egy trillió paraméteres nagy nyelvi modell, amely szintén a MoE technikára épül. Vagyis megközelítésében a modellt részhalmazokra osztja, amelyek mindegyike szakértelemmel rendelkezik bizonyos típusú adatok vagy feladatok kezelésében. Így feladatonként mindig csak a szükséges szakértői részhálózatot aktiválja. Jiang Daxin vezérigazgató korábban a Microsoft ázsiai kutatásit vezette.