NVIDIA heeft zojuist zijn nieuwste GB300 NVL72-systemen uitgebracht. Ze kunnen 50 keer meer werk aan per megawatt elektriciteit vergeleken met het oudere Hopper-platform. Dat betekent dat de kosten met 35 keer dalen voor elk stuk verwerkte informatie.
Signal65 heeft afzonderlijke tests uitgevoerd op de GB200 NVL72 en ontdekte dat het meer dan 10 keer zoveel informatie per watt verwerkt, waardoor de kosten worden teruggebracht tot een tiende van wat ze waren.
De verbeteringen blijven komen. NVIDIA's TensorRT-LLM bibliotheekupgrades alleen al gaven de GB200 een vijfvoudige prestatieverbetering in slechts vier maanden voor taken die directe reacties vereisen. Teams die aan Dynamo-, Mooncake- en SGLang-tools werken, duwen de efficiëntie nog hoger.
Deze AI-tools vallen uit als er vertraging is of als ze niet genoeg context kunnen onthouden. Bedrijven hebben nodig dat ze daadwerkelijk werken in echte zakelijke situaties, niet alleen in demo's.
Kunstmatige intelligentietools die code schrijven en werken als digitale assistenten, zijn nu goed voor bijna de helft van alle AI-gerelateerde zoekopdrachten, een stijging van slechts 11% een jaar geleden.
De cijfers komen uit OpenRouter's State of Inference-rapport en laten zien hoe snel dingen veranderen in deze ruimte.
Deze plotselinge sprong zorgt ervoor dat bedrijven zich haasten om hardware te bouwen die dit kan bijbenen. Deze AI-assistenten moeten direct reageren en context onthouden van hele softwareprojecten, wat serieuze eisen stelt aan rekenkracht.
Marktexplosie voedt strijd van techgiganten om dominantie
Het geld dat ermee gemoeid is, is enorm. De AI-agentmarkt was 4,92 miljard dollar waard in 2024. Schattingen stellen het op 6,016 miljard dollar voor 2025, en vervolgens opzwellend tot 44,97 miljard dollar tegen 2035. Dat is 22,28% groei elk jaar voor het komende decennium. Banken, ziekenhuizen, winkels en fabrieken zijn de early adopters.
Bedrijven integreren deze agenten in klantbeheersystemen, planningstools en beveiligingsopstellingen om geld te besparen en meer gedaan te krijgen. Wat begon als optionele technologie wordt basisinfrastructuur.
Zoals gemeld door Cryptopolitan, heeft Alibaba zojuist Qwen3.5 gelanceerd voor de Chinese markt, waarbij het claimt 60% lagere verwerkingskosten dan voorheen. Het model kan naar schermen kijken en taken uitvoeren op telefoons en computers. Het gaat rechtstreeks in gevecht met ByteDance's Doubao-app, en er komt ook een DeepSeek-update.
OpenAI heeft Peter Steinberger aangenomen op de 15e. Hij bouwde OpenClaw, een open-source AI-agent. CEO Sam Altman zei dat Steinberger het werk aan de volgende generatie persoonlijke agenten zal leiden en noemde hem een genie met geweldige ideeën over slimme assistenten die nuttige dingen gedaan kunnen krijgen.
De talentencrisis die niemand kan oplossen
94% van de bedrijfsleiders zegt dat ze een tekort hebben aan AI-vaardigheden. Tegen 2028 verwacht 44% nog steeds 20 tot 40% tekorten te hebben. Workera zegt dat deze hiaten de wereldeconomie 5,5 biljoen dollar zouden kunnen kosten in 2026 door vertraagde producten, kwaliteitsproblemen en verloren verkopen.
Op dit moment overtreft de vraag naar AI-talent het aanbod wereldwijd met 3,2 op één. AI-banen betalen 67% meer dan reguliere softwareposities. Toch leert 85% van de kantoormedewerkers over dit spul in hun eigen tijd, en 83% zegt dat ze zichzelf voornamelijk onderwijzen in plaats van formele training te krijgen.
Wanneer bedrijven AI-tools kopen van gespecialiseerde leveranciers, slagen ze 67% van de tijd. Interne bouwprojecten werken slechts ongeveer een derde zo vaak.
Salesforce zag 119% agentgroei begin 2025 en overschreed 500 miljoen dollar aan terugkerende inkomsten voor deze producten. Ze voegden 6.000 enterprise-klanten toe in drie maanden.
Bedrijven zullen waarschijnlijk oplossingen kopen in plaats van ze te bouwen. Dat wijst erop dat de markt zich concentreert rond een paar grote spelers die kunnen leveren wat daadwerkelijk werkt.
Bron: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


