Hamarosan könnyebb lesz a Facebook- és Instagram-bejegyzések megtekintése a kevésbé beszélt nyelveken, olyanokon, mint például a skót gael, az ír, a walesi vagy az izlandi. A Meta szerint olyan nyelvek kerülnek most a rendszerbe, amelynek kevesebb mint egymillió mondata használható fel a gépi adatbázisok, a mesterséges nyelvi modellek számára a tanuláshoz.
Ám a szakértők egyelőre nincsenek elájulva az innovációtól: azt mondják, hogy a szolgáltatás fejlesztéséhez a Metának elsősorban anyanyelvi beszélőkkel és nyelvészekkel kellene konzultálnia, hogy a fordítóeszköz megfelelő legyen – írja az Euronews.
A Meta fordítóprogramjainak, mesterséges intelligenciájának „oktatása” közben egy bizonyos Opus nevű adattárból dolgozik, amely egy nyílt forráskódú platform, és különböző nyelvek hiteles szövegeinek írott és hangzó formátumos gyűjteményét tartalmazza. Ebben többek között Wikipedia szócikkek is szerepelnek.
Amennyiben a technológia teljes egészében megvalósul, a Meta becslése szerint naponta több mint 25 milliárd fordítás valósulhat meg a Facebook News Feed-ben, az Instagramon és a további platformokon.
William Lamb, az Edinburgh-i Egyetem gael szakértő nyelvész professzora elmondása alapján Skócia lakosságának mintegy 2,5 százaléka, körülbelül 130 000 ember nyilatkozta azt a 2022-es népszámlálás során, hogy valamilyen szinten ismeri a 13. századi kelta nyelvet. Az Unesco a gael nyelvet mindeközben a kihalástól fenyegetett kategóriába sorolja, mivel kevesen beszélik rendszeresen.
Ha valóban szeretnének javítani a fordításon, akkor olyan gael anyanyelvűekkel kellene beszélniük, akik még mindig beszélik, lélegzik a nyelvet
– állítja William Lamb, aki azt is megjegyezte, hogy a Meta skót gael nyelvű fordításai „még nem túl jók" a tömeges adatgyűjtés következtében.
Ugyanakkor az komoly problémát jelent, hogy az anyanyelvi beszélők többsége 70 év körüli és nagyrészt nem használ számítógépet. Éppen ezért a Meta számára az lenne a legmegfelelőbb megoldás a professzor szerint, ha licencmegállapodást kötne a BBC-vel, amely a nyelv megőrzéséért dolgozik, és magas színvonalú online tartalmakat készít a nyelven.
Alberto Bugarín-Diz, a spanyolországi Santiago de Compostela Egyetem mesterséges intelligencia professzora úgy véli, hogy a Lamb professzorhoz hasonló nyelvészeknek együtt kellene működniük a nagy technológiai vállalatokkal a rendelkezésükre álló adatkészletek finomításában.
A szövegek, a fordítások felülvizsgálatát szakemberekre kellene bízni, valamint a humán tudományok képviselőinek és a műszaki háttérrel rendelkező embereknek, a mérnököknek együtt kellene dolgozniuk
– nyilatkozta Alberto Bugarin-Diz.