Google har lanserat en ny teknik för Gemma 4 AI-modeller som möjliggör upp till tre gånger snabbare prestanda genom att förutsäga framtida tokens. Detta kan revolutionera effektiviteten i AI-bearbetning utan att förlora i kvalitet.

Logotyp · Gemma 4 · via Brave Search
Google har nyligen presenterat en banbrytande uppdatering för sina Gemma 4 AI-modeller som kan revolutionera hur AI-system bearbetar och genererar data. Den nya tekniken, kallad Multi-Token Prediction (MTP), använder en metod för spekulativ avkodning som kan tredubbla hastigheten vid inferens utan att kompromissa med resultatens kvalitet.
Traditionella stora språkmodeller (LLM) som Gemma genererar text genom att skapa en token i taget, där varje token bygger på den föregående. Detta är en tidskrävande process, eftersom varje token kräver lika mycket beräkningskraft oavsett dess betydelse i den slutliga texten. Gemma 4-modellerna förändrar detta genom att använda MTP, som kan spekulera och förutsäga flera tokens i förväg, vilket dramatiskt minskar den tid det tar att bearbeta information.
Nyckeln till denna hastighetsökning ligger i den spekulativa avkodningstekniken. Istället för att vänta på att varje token genereras sekventiellt, använder MTP en lättviktsmodell för att snabbt generera utkast till tokens. Dessa utkast verifieras sedan parallellt av huvudmodellen. Om huvudmodellen godkänner sekvensen, accepteras hela sekvensen i ett enda steg, vilket sparar tid och resurser.
För svenska och nordiska användare innebär detta snabbare och mer responsiva AI-tjänster, något som blir allt viktigare i takt med att efterfrågan på realtidsapplikationer ökar. Oavsett om det handlar om röstassistenter, realtidsöversättning eller andra AI-tjänster, kan den förbättrade hastigheten avsevärt förbättra användarupplevelsen.
Google har även gjort Gemma 4 tillgänglig under Apache 2.0-licensen, vilket ger utvecklare större frihet att anpassa och använda modellerna i sina egna applikationer. Denna öppenhet, kombinerad med den tekniska innovationen av MTP, kan leda till en våg av nya AI-drivna lösningar som är mer effektiva och användarvänliga.
I en värld där AI spelar en allt större roll i både privat och professionellt liv, erbjuder Googles senaste innovationer inom Gemma 4-modellerna en glimt av framtiden där avancerad AI-teknik är både snabbare och mer tillgänglig än någonsin tidigare.
Artikeln baseras på följande publika källor. Vi rekommenderar att du följer länkarna för att läsa originalrapporteringen och primärkällor.
// Kommentarer (0)