De nieuwe generatie modellen van DeepSeek staat centraal in het technologische debat vanwege een zeer duidelijk voorstel: context van maximaal één miljoen tokens en een architectuur van meer dan één biljoen parameters Ontworpen om efficiënt en vooral veel goedkoper te zijn dan gesloten-lusalternatieven in de Verenigde Staten, heeft het Chinese bedrijf vol ingezet op de V4, een productfamilie die open gewichten, een enorm contextvenster en een agressieve prijsstrategie combineert.
Deze stap komt op een moment dat Europa en Spanje de kosten en technologische soevereiniteit van AI onder de loep nemen. DeepSeek V4 is een aantrekkelijke optie voor Europese startups, mkb's en grote bedrijven. die geavanceerde mogelijkheden nodig hebben, maar niet volledig afhankelijk kunnen – of willen – zijn van dure, propriëtaire API's of exclusieve hardware zoals de meest gewilde NVIDIA GPU's.
Een V4-familie gecentreerd rond 1T aan parameters en een context van 1M tokens

DeepSeek heeft de komst van DeepSeek-V4 Preview aangekondigd als een familie van open modellen die gebaseerd is op twee ideeën: een contextvenster van maximaal 1 miljoen tokens en gigantische architecturen gebaseerd op Mixture-of-Experts (MoE)Binnen deze familie vallen twee hoofdvarianten op: DeepSeek-V4-Pro en DeepSeek-V4-Flash, beide met de 1M-context als kenmerk.
In de meest ambitieuze gevallen presteert de V4-Pro in de volgende cijfers: tot wel 1,6 biljoen parameters in totaal (1,6T), hoewel het dankzij het MoE-schema, dat cruciaal is voor het behoud van efficiëntie, slechts tussen de 32 en 49 miljard parameters per inferentiestap activeert. Parallel daaraan heeft het bedrijf lichtere varianten geïntroduceerd, zoals V4-Flash en V4-Lite, met in totaal ongeveer 284-285 miljard parameters en ongeveer 13 miljard actieve parameters, ontworpen voor implementaties waar snelheid en kosten prioriteit hebben.
Het totale aantal parameters plaatst de V4-familie aan de top van de markt, maar het belangrijkste detail is dat Slechts een fractie van die experts is geactiveerd met tokens.Hierdoor kan het zich qua capaciteit gedragen als een gigantisch model, maar met een rekenkrachtverbruik dat dichter bij dat van veel kleinere modellen ligt. Deze aanpak past bij de filosofie van DeepSeek: concurreren met grote, closed-source modellen zonder de gebruikskosten de pan uit te laten rijzen.
Het bedrijf heeft ook voorlopige varianten zoals V4-Lite uitgebracht, die dienen als technische validatie, en heeft het implementatieschema aangepast. V4 bevindt zich nog in een beperkte testfase. In sommige contexten kan de V4 Preview-familie al worden gebruikt in de officiële chatbot en via de bijgewerkte API van het bedrijf, waarbij de 1M-context de standaardwaarde is in de services.
Hybride architectuur en een mix van experts om de langetermijncontext haalbaar te maken.
De sleutel tot DeepSeek's vermogen om een ​​contextvenster van een miljoen tokens te bieden zonder dat de inferentiekosten de pan uit rijzen, ligt in de architectuur. De fabrikant legt uit dat V4 het volgende introduceert: een combinatie van hybride zorg, een mix van experts en compressietechnieken Ontworpen om te werken met zeer lange sequenties, waardoor zowel het aantal FLOPs per token als het benodigde geheugen wordt verminderd.
Van de technische componenten die het bedrijf noemt, springen de volgende eruit: MLA (Multi-Head Latent Attention), DSA of DeepSeek Sparse Attention, en conditionele geheugenmechanismen zoals EngramDeze componenten zijn er gezamenlijk op gericht de belasting van de aandachtsberekening te verminderen, met name wanneer het model honderdduizenden of een miljoen tokens in één keer moet verwerken.
Volgens gegevens die het bedrijf zelf heeft gedeeld, in scenario's met 1 miljoen tokens. DeepSeek-V4-Pro heeft mogelijk ongeveer 27% van de FLOPs per token nodig en slechts 10% van de KV-cache in vergelijking met eerdere versies zoals DeepSeek-V3.2.Lichtere varianten, zoals V4-Flash, verlagen deze cijfers nog verder en positioneren zich als snelle inferentieoplossingen voor toepassingen waar latentie cruciaal is.
Deze verbeteringen zijn niet louter theoretisch: het bedrijf beweert dat de combinatie van MoE, verspreide aandacht en contextbegrip het mogelijk maakt om... werken met een ultralange context in minder extreme hardware De kosten per miljoen tokens liggen nu al aanzienlijk lager dan die van veel gesloten modellen met een afnamebereik van 128 of 200 tokens.
Prestaties bij redeneer-, programmeer- en agentische taken
DeepSeek wil zich niet alleen onderscheiden vanwege zijn omvang en context. In interne vergelijkingen benadrukt het bedrijf dat De V4-Pro en zijn varianten zijn speciaal geoptimaliseerd voor complexe redeneringen, programmering en agents.Deze drie gebieden vertegenwoordigen momenteel een aanzienlijk deel van de zakelijke vraag. Benchmarks zoals SWE-bench, ontworpen om de capaciteit van Code repositories begrijpen en aanpassenEr wordt gesproken over nauwkeurigheidscijfers van meer dan 80%, in lijn met toonaangevende gesloten modellen.
Bij meer algemene redeneringen – waaronder wiskunde, STEM-disciplines en problemen met gedachtegangen – plaatst het bedrijf de V4-Pro op de eerste plaats. als een van de sterkste open modellenen stelt dat het de grens van voorstellen voor gesloten grenzen benadert. Wat betreft wereldwijde bekendheid plaatst interne data het aan de voorhoede van het open ecosysteem, slechts achter een paar zeer specifieke propriëtaire modellen, zoals bepaalde geavanceerde varianten van Gemini.
Naast de cijfers ligt de nadruk op agentische taken Het wijst op een gebruik dat veel verder gaat dan eenvoudige chat. DeepSeek beweert dat V4 stuurt al zijn eigen infrastructuur van codeagents en systemen aan die meerdere stappen aan elkaar koppelen.Ze hebben toegang tot tools en werken met uitgebreide archieven of documentdatabases. Deze aanpak sluit aan bij de huidige trend in de sector, waarbij veel bedrijven niet langer alleen op zoek zijn naar een chatbot, maar naar assistenten die kunnen functioneren als "digitale collega's" binnen complexe werkprocessen.
Deze vergelijkingen moeten met een korreltje zout worden genomen: zoals bij vrijwel alle recente AI-releases, Een groot deel van de gegevens is afkomstig van het bedrijf zelf en van tests in gecontroleerde omgevingen.Desondanks trekt de combinatie van een lange context, een efficiënte architectuur en concurrerende prestaties de aandacht van Europese ontwikkelaars die de kosten en mogelijkheden vergelijken met alternatieven zoals GPT, Claude, Llama of Mistral.
Open modellen, gepubliceerde gewichten en compatibiliteit met populaire API's.
Een van de belangrijkste factoren die DeepSeek zijn bekendheid heeft bezorgd, is de toewijding aan het open ecosysteem. Met V4 versterkt het bedrijf deze aanpak: heeft het technische rapport gepubliceerd en de openbare gewichten van de familie vrijgegeven op platforms zoals Hugging Face.waardoor onderzoekers, bedrijven en overheidsinstanties de modellen kunnen downloaden en op hun eigen infrastructuur kunnen uitvoeren.
Deze open benadering met betrekking tot gewichten, in tegenstelling tot de volledig gesloten voorstellen van veel Amerikaanse laboratoria, heeft duidelijke implicaties voor Spanje en de Europese Unie. De mogelijkheid om deze modellen in te zetten in datacenters binnen de EUbinnen kaders zoals de AVG en de toekomstige AI-regelgeving van de EU.Het biedt een manier om meer controle over gegevens te behouden zonder in te leveren op hoogwaardige functionaliteiten.
Wat de praktische integratie betreft, heeft DeepSeek ervoor gekozen om de drempels te verlagen: De API behoudt dezelfde base_url en is compatibel met de ChatCompletions-schema's van OpenAI en met de Antropische interfacesVoor veel ontwikkelteams betekent dit dat het migreren van tests of delen van het verkeer naar V4 in wezen beperkt is tot het wijzigen van de model-ID naar deepseek-v4-pro of deepseek-v4-flash en het aanpassen van een paar parameters.
Tegelijkertijd heeft het bedrijf een tijdschema vastgesteld voor het uitfaseren van oudere modellen, zoals deepseek-chat en deepseek-reasoner. Ze zullen worden stopgezet en doorverwezen naar V4-Flash. totdat ze volledig worden uitgefaseerd, waardoor gebruikers zich moeten voorbereiden op de migratie. Het is een duidelijke manier om het aanbod te concentreren op de nieuwe generatie en te voorkomen dat het gebruikersbestand versnipperd raakt over te veel verouderde varianten.
Beperkte inferentiekosten en focus op economische efficiëntie
Het verhaal van DeepSeek draait al vanaf het begin om efficiëntie. Met versie 4 wordt die focus versterkt door een combinatie van MoE-architectuur, gedistribueerde aandacht en hardware-optimalisatie, met als doel... De kosten per miljoen tokens verlagen tot niveaus die aanzienlijk lager liggen dan die van de meest bekende premium API's.Sommige externe analyses spreken van bedragen rond de $0,30 per miljoen instaptokens voor bepaalde configuraties, een fractie van wat hoogwaardige, gesloten modellen in rekening brengen.
In de Europese context, waar infrastructuur- en energiekosten relevant zijn, sluit deze focus op efficiëntie goed aan bij de behoeften van startups en het mkb. Het verwerken van omvangrijke juridische documenten, lange medische dossiers of complete software repositories. Het is niet langer een luxe die alleen is weggelegd voor bedrijven met vrijwel onbeperkte budgetten, maar wordt onderdeel van betaalbare scenario's voor opkomende projecten.
Sommige aanbieders van AI-infrastructuur bieden al vroegtijdige toegang tot DeepSeek V4-gebaseerde nodes als onderdeel van hun catalogi, waardoor het voor Europese bedrijven gemakkelijker wordt. Ze kunnen de werkelijke prestaties en kosten evalueren zonder dat ze hun eigen infrastructuur helemaal vanaf nul hoeven op te bouwen.Voor veel organisaties is deze testfase de eerste stap voordat wordt besloten of ze doorgaan met een uitbestedingsmodel of kiezen voor implementaties op locatie.
De gedeeltelijke stilte van het bedrijf over de exacte trainingskosten en de specifieke gebruikte hardware heeft ondertussen twijfels doen rijzen in sommige sectoren. Sinds 2025 circuleren er vermoedens over de werkelijke hoeveelheid resources die nodig zijn om de modellen te trainen, waaronder schattingen die wijzen op tienduizenden high-end GPU's. DeepSeek beweert dat het een nieuwe fase van "winstgevende langetermijncontext" heeft bereikt.Maar de onduidelijkheden over de materiële omvang van de activiteiten zijn nog niet volledig opgehelderd.
Impact op startups en bedrijven in Spanje en Europa
Voor het Europese ondernemerslandschap, en met name voor technologie-startups in Spanje, biedt de opkomst van modellen zoals DeepSeek V4 mogelijkheden die tot voor kort moeilijk te overwegen waren. Krijg toegang tot een model met meer dan een biljoen parameters binnen de context van 1 miljoen tokens en open gewichten. Het stelt je in staat geavanceerde producten te ontdekken zonder volledig afhankelijk te zijn van leveranciers uit Silicon Valley.
In gereguleerde sectoren – financiën, gezondheidszorg, recht, openbaar bestuur – bestaat de mogelijkheid van Voer het model uit in datacenters binnen de EU of zelfs in uw eigen faciliteiten. Dit is met name relevant. De naleving van de AVG en nationale gegevensbeschermingsvoorschriften wordt eenvoudiger wanneer informatie de Europese jurisdictie niet hoeft te verlaten om door een AI-model te worden verwerkt.
Spaanse startups die met grote hoeveelheden documenten werken, zoals bedrijven in de juridische technologie, gezondheidstechnologie of ontwikkelaarstools, kunnen de context van de 1 miljoen tokens benutten om het analyseren van complete dossiers, zeer lange medische dossiers of monolithische codeopslagplaatsen Zonder dat ze in meerdere stukken hoeven te worden verdeeld en er ingewikkelde herstelsystemen hoeven te worden ontworpen. Dit vermindert de technische complexiteit en in veel gevallen ook de latentie.
Tegelijkertijd is het belangrijk om de risico's in gedachten te houden: het ecosysteem van tools rond DeepSeek is jonger dan dat van andere open modellen zoals Llama, en De documentatie en de ondersteuning vanuit de community zijn nog in ontwikkeling.Bovendien brengt het feit dat het een Chinees bedrijf betreft een geopolitieke component met zich mee die sommige Europese organisaties met de nodige voorzichtigheid bekijken, met name bij projecten die verband houden met overheidsinstanties of kritieke infrastructuur.
Een stap die druk uitoefent op dure, gesloten modellen.
Naast de specifieke specificaties wordt DeepSeek V4 binnen de sector als volgt geïnterpreteerd: een verdere stap in de concurrentiedruk op de duurste gesloten modellen op de markt.Door de context van 1 miljoen tokens als standaard in te voeren voor al haar officiële diensten en deze te combineren met open gewichten, geeft het Chinese bedrijf een duidelijke boodschap af: de ultralange context hoeft niet langer een exclusieve functie te zijn van een paar dure, eigen modellen.
Voor grote westerse laboratoria vormt dit een uitdaging. OpenAI, Anthropic en Google hebben van oudsher een combinatie van hogere kwaliteit, bredere context en een eigen ecosysteem als waardepropositie. De opkomst van een open alternatief met in sommige gevallen een nog betere context en zeer lage kosten dwingt tot een heroverweging van product- en prijsstrategieën, met name in segmenten waar de marges van gebruikersbedrijven klein zijn.
In de Spaanstalige wereld, waar veel startups met veel kleinere budgetten werken dan hun tegenhangers in de Verenigde Staten, werkt de concurrentiedruk in hun voordeel. Hoe krachtiger en opener de beschikbare modellen zijn, hoe beter technische teams in staat zullen zijn om te kiezen op basis van prijs, naleving van regelgeving en gebruiksscenario.En niet alleen van het merk achter de API.
Tegelijkertijd beseft DeepSeek dat deze gok niet zonder uitdagingen is: de meeste benchmarks en vergelijkingen zijn afkomstig uit eigen documentatie of uit tests in previewfases, en de markt wacht nog af hoe de V4-modellen presteren wanneer ze op grote schaal worden ingezet in veeleisende productieomgevingen, waaronder Europese.
Al met al bevestigt de komst van DeepSeek V4 een trend die zich al enige tijd aan het ontwikkelen was: Geavanceerde AI-modellen zijn niet langer het exclusieve domein van een paar bedrijven met gesloten systemen en astronomische budgetten.Met een combinatie van meer dan 1 biljoen parameters, een context van 1 miljoen tokens, open gewichten en een discours gericht op efficiëntie, introduceert het Chinese bedrijf een alternatief dat bedrijven en ontwikkelaars in Spanje en Europa moeilijk kunnen negeren in hun toekomstige plannen voor de implementatie en vernieuwing van AI-infrastructuur.