Késlekedik a Meta óriásának előretörése.


A közösségi óriás csúsztatja a Llama 4 modellcsalád " Behemoth" néven említett eddigi legerősebb verziójának nyilvános kiadását, mivel attól tart, hogy nem tud jelentősebb előrelépést hozni az előző kiadásokhoz képest, illetve teljesíteni az elvárásokat.

A Meta múlt hónapban első ízben rendezte meg a LlamaCon konferenciát, amely kifejezetten a vállalat nagyszabású nyelvi modelljeinek szentelt esemény volt. Sok szakértő azt várta, hogy a cég egy új, fejlettebb érvelési modellel rukkol elő, különösen miután a DeepSeek V3 és az Alibaba által kifejlesztett Qwen már bemutatkozott a piacon. Az esemény előtt egy hónappal a Meta a Llama LLM-család legújabb, negyedik generációját is elérhetővé tette, amely két nyitott súlyozású modellt tartalmazott: a Llama 4 Scout-ot és a 4 Maverick-et. Ezen felül bejelentették az "Behemoth" névre keresztelt, jelenleg még képzés alatt álló erősebb modellt is, amelyet kifejezetten arra terveztek, hogy desztillációs folyamatok során kisebb és specializáltabb modellek előállítására használják.

A Wall Street Journal értesülései alapján a Behemoth megjelenése, amelyet eredetileg áprilisra, majd júniusra terveztek, várhatóan késlekedni fog. Jelenleg úgy tűnik, hogy őszre vagy akár még későbbi időpontra csúszik a debütálás, ami kedvezőtlenül hathat a Meta versenyképességére egy rendkívül zsúfolt piacon. Bár a cég hatalmas összegeket fektetett a fejlesztésekbe, a várt eredmények még mindig elmaradnak a várakozásoktól, és a fejlesztőcsapat aggodalmát fejezi ki azzal kapcsolatban, hogy nem tudják teljesíteni a kitűzött célokat. A felsővezetés körében is növekvő feszültséget tapasztalni, mivel a fejlődési lehetőségek hiánya egyre inkább érezteti hatását.

A fejlesztők és az iparág szakemberei egyre nagyobb csalódottsággal tapasztalják, hogy a korábban innovatív és nyitott modelleket kínáló Meta lassan elveszíti lendületét, mind technikai teljesítményben, mind pedig a fejlesztői szemlélet tekintetében. Míg a Meta folyamatosan hangsúlyozza a nyíltság és az ökoszisztéma-építés iránti elkötelezettségét, addig olyan versenytársak, mint a DeepSeek, a Qwen és az OpenAI, rendkívül dinamikusan fejlődnek a logikai érvelés, az eszközhasználat és a valós életbeli alkalmazások terén.

Tavaszi válogatás: Az IT szektor 2025-ös pangásától az interjúk új dimenzióiig. Ezúttal öt izgalmas és releváns témát emeltünk ki, amelyek az IT karrierutakat formálják.

Jensen Huang, az Nvidia vezérigazgatója 2023-ban a Llama 2 bevezetését az év legnagyobb áttörésének titulálta az mesterséges intelligencia világában. Ezt követően, 2024 júliusában debütált a Llama 3, amely komoly versenytársa lett az OpenAI-nak. Az új modell azonnal megnövelte a keresletet a nagyobb számítási teljesítmény iránt, ami a GPU-k bérleti díjának emelkedéséhez vezetett.

A Meta a közelmúltban elkezdte alkalmazni a kínai DeepSeek által népszerűsített "mixture of experts" architektúrát, amely új dimenziókat nyit a gépi tanulás terén. Ez a Mixture of Experts (MoE) struktúra lehetővé teszi, hogy az AI-modell több, különböző szakterületekre specializált almodellt (szakértőt) integráljon egy átfogó rendszerbe, így javítva a teljesítményt és a hatékonyságot. A feladatok kisebb részekre bontásával minden egyes részfeladatot a megfelelő szakértő hálózatok kezelnek, ami optimalizálja a folyamatot. A mechanizmus, amely meghatározza, hogy melyik szakértőt aktiválják a bemenet alapján, a "gating" néven ismert. Ez a megközelítés tükröződik a DeepSeek-V3, a Mixtral 8x7B és a Llama 4 modellek működésében is, amelyek mind a MoE architektúra előnyeit kihasználják.

A Llama 4 debütálásával a Meta a marketinggépezet dübörögtetésével gyorsan kivívta magának a kritikus visszhangot, miután a fejlesztők észrevették, hogy a nyilvános benchmarkinghoz használt Meta verzió nem ugyanaz, amely számukra letölthető és telepíthető.

Ugyan nincs olyan megbízható forrás, amely meg tudná mérni, hogy melyik modell vagy modellcsalád a legnépszerűbb a fejlesztők körében, de a rendelkezésre álló adatok azt mutatják, hogy a Llama legújabb modelljei nem tartoznak a vezető választások közé. A teljesítmény alapján rangsoroló Artificial Analysis oldal a Llama 4 Mavericket és Scoutot közvetlenül az OpenAI tavaly év végén kiadott GPT-4 modellje fölé, de az xAI Grok és az Anthropic Claude alá helyezi. A saját API-ján keresztül gyűjtött adatokkal ranglistát készítő Openrouter platformon pedig a Lama 3.3 a május elején használt legnépszerűbb 20 modell között szerepel, míg a Llama 4 variánsok nem. Az elemzők szerint a Meta lemaradásának egyik legfontosabb kvázi mutatója lehet az érvelési modell hiánya, ami alapvetőbb eleme az egyre népszerűbb AI-ügynökök felépítésének, mely felé az iparág tart.

Érdemes hozzátenni, hogy a Meta problémája nem teljesen egyedi, mert más modellfejlesztőknél szintén lassulni látszik a fejlődés az elköltött összegek ellenére. Az OpenAI GPT-5 modelljét eredetileg nyárra datálták, végül a GPT-4.5-öt tudja előbb szállítani a cég, a következő generáció érkezésének időpontja pedig nem ismert. Az Anthropic tavaly jelentette be, hogy aktívan dolgozik a Claude 3.5 Opuson, ami máig nem jelent meg, és a cég is csak annyi információval tud szolgáltani, hogy "hamarosan" várható.

Related posts