Intel Binary Optimization Tool: hoe het het maximale uit je games en benchmarks haalt

  • De Intel Binary Optimization Tool optimaliseert reeds gecompileerde binaire bestanden zonder het originele .exe-bestand aan te raken, door instructies te herorganiseren en vectorisatie te verbeteren.
  • De tool maakt gebruik van HWPGO en profielen die zijn gegenereerd in Intel-laboratoria, en behaalt gemiddelden van bijna 8% en pieken van meer dan 20% in games.
  • De huidige mogelijkheden zijn beperkt: weinig ondersteunde games, exclusief voor Arrow Lake Refresh, en problemen met anti-cheatprogramma's en benchmarks zoals Geekbench.
  • Als de compatibiliteit wordt uitgebreid en de zorgen over transparantie worden weggenomen, zou het een belangrijke pijler kunnen worden in Intels prestatiestrategie.

Intel Binary Optimization Tool

De komst van de nieuwe Intel Core Ultra 200S Plus-processors, ook wel bekend als Arrow Lake Refresh, brengt meer dan alleen hogere kloksnelheden en meer cores. Het wordt ook geleverd met een heel bijzonder stukje software: de Intel Binary Optimization Tool, ofwel BOT/IBOT, een technologie die is ontworpen om de prestaties in de praktijk verder te verbeteren, met name in games met bescheiden GPU's en veeleisende taken, zonder dat ontwikkelaars ook maar één regel code hoeven aan te raken.

Deze aanpak is interessant omdat hij zich richt op hoe binaire bestanden op de CPU worden uitgevoerd, en niet alleen op de pure rekenkracht van de chip. In plaats van programma's opnieuw te compileren of games te patchen, stelt Intel een extra laag voor. Dynamische optimalisatie van reeds gecompileerde code Deze technologie werkt tussen het uitvoerbare bestand en de processor, waarbij instructies worden herorganiseerd en de interne microarchitectuur beter wordt benut. Dit alles leidt tot een zeer interessante discussie: is het nog wel "eerlijk" om processors te vergelijken als een van beide dergelijke agressieve ondersteuning biedt?

Wat is de Intel Binary Optimization Tool precies en waarin verschilt deze van andere optimalisatietools?

Intel Binary Optimization Tool is in essentie, een laag van intelligente vertaling en optimalisatie toegepast op reeds gecompileerde binaire bestandenHet compileert, decompileert of wijzigt het oorspronkelijke uitvoerbare bestand van het spel of de applicatie niet, maar het verandert wel de manier waarop de binaire gegevens de CPU aansturen, zodat deze efficiënter werkt.

Het idee komt voort uit een fundamenteel probleem dat al jaren bestaat: veel games en programma's worden ontwikkeld met het volgende in gedachten: oudere architecturen, consoles of standaard CPU'sHet gevolg is dat, wanneer je ze uitvoert op moderne hardware zoals Arrow Lake Refresh, de CPU niet volledig wordt benut. Er zijn inefficiënties, fouten in de branch prediction, slecht cachegebruik of simpelweg een gebrek aan vectorisatie waar die aanwezig zou kunnen zijn.

In plaats van traditionele compileroptimalisaties of ontwikkelaarspatches, stelt BOT voor dat Intel, in zijn eigen laboratoria, Analyseer die werklasten op microarchitecturaal niveau. en een geoptimaliseerde versie van de code genereren, zonder het .exe-bestand op de schijf aan te raken.

Binnen het software-ecosysteem van het merk voegt BOT zich bij tools zoals Intel Application Optimizer (APO) en andere onderdelen van de performance suite. Terwijl APO zich primair richt op de Kern- en threadtoewijzing en interactie met de scheduler Vanuit het besturingssysteem werkt BOT nog verder terug, in de stroom van instructies die in de CPU zelf worden uitgevoerd, waardoor beide systemen elkaar aanvullen in plaats van overlappen.

Interne werking van Intel BOT

Hoe Intel BOT intern werkt: HWPGO, microarchitectuur en binaire profielen

De technische motor achter Intel BOT is gebaseerd op een bepaalde aanpak. Hardwaregebaseerde profielgestuurde optimalisatie (HWPGO)Simpel gezegd analyseert Intel hoe binaire bestanden zich gedragen wanneer ze op hun architectuur draaien, detecteert knelpunten en genereert op basis van die informatie een geoptimaliseerde versie van de machinecode.

Tijdens deze analyse worden zaken als mislukte branch predictions, pipeline bubbles, cache latency en inefficiënt prefetcher-gebruik nauwkeurig gemonitord. Wanneer inefficiënte patronen worden geïdentificeerd, bouwt het systeem een Correctief profiel dat de instructies herorganiseert om die problemen te minimaliseren. Het doel is niet om minder werk te doen of bewerkingen over te slaan, maar om dezelfde hoeveelheid werk te verrichten op een manier die de CPU in staat stelt een veel hogere effectieve IPC (Instructions Per Cycle) te behouden.

Een belangrijk aspect is dat dit hele profileringsproces niet op uw pc plaatsvindt, maar in de laboratoria van Intel. Met behulp van post-link optimalisatietechnieken genereert het bedrijf geherstructureerde binaire codes met verbeterde instructiedichtheidDeze profielen zijn specifiek ontworpen voor de microarchitecturen van hun nieuwste chips. Ze worden vervolgens als onderdeel van het prestatiepakket aan de gebruiker geleverd, zodat deze ze kan activeren.

Wanneer u Intel BOT activeert op uw computer, wordt er een service in de gebruikersmodus op de achtergrond uitgevoerd. Deze service is verantwoordelijk voor... Houd in de gaten wanneer compatibele binaire bestanden worden uitgebracht. en de uitvoering ervan omleiden naar de geoptimaliseerde paden die door Intel zijn aangemaakt. Het .exe-bestand op uw harde schijf wordt niet gewijzigd: wat verandert, is het pad dat de instructies tijdens de uitvoering volgen, vergelijkbaar met hoe een grafische driver in bepaalde games shaders vervangt door geoptimaliseerde versies.

Technisch gezien gedraagt ​​de tool zich als een soort dynamische optimalisator voor de uitvoeringsstroom, die gebruikmaakt van zijn interne kennis van de Arrow Lake Refresh-microarchitectuur. Het is geen klassieke driver of gamepatch; het zit er ergens tussenin. Herschik het instructiemenu zonder de "onderdelen" te wijzigen., alleen de volgorde waarin ze aan de CPU worden aangeboden.

Relatie tussen Intel BOT, APO en andere Intel-prestatietools

In Intels recente strategie staat BOT niet op zichzelf: het maakt deel uit van een breder pakket waarin andere technologieën naast elkaar bestaan. Intel Extreme Tuning-hulpprogramma (XTU)Intel Application Optimizer (APO) en nu ook Intel's eigen Binary Optimization Tool (IBOT/BOT). Elk onderdeel behandelt een ander aspect van de prestaties.

XTU richt zich op de meer klassieke kant van CPU-overklokken, spanningen en parametersDat wil zeggen, de afstemming van de hardware zelf. APO werkt op de software- en besturingssysteemlaag en regelt hoe threads en taken worden verdeeld over de verschillende soorten cores (P-cores, E-cores) en bewaakt de toewijzing van resources, zodat de applicaties die het het meest nodig hebben, profiteren van de juiste hardware.

BOT gaat op zijn beurt nog een stap verder: de reeks instructies die de CPU uitvoert voor een specifiek binair bestandTerwijl APO probeert de taak op het juiste moment in de juiste kernel te plaatsen, zorgt BOT ervoor dat die instructies worden geordend en gevectoriseerd op een manier die het beste past bij de interne architectuur van de chip.

In de praktijk betekent dit dat wanneer een spel op de lijst met ondersteunde titels staat en de gebruiker de bijbehorende modus activeert, APO en BOT kunnen samenwerken.APO zorgt voor de juiste toewijzing van taken, en BOT extraheert de resulterende machinecode. Juist in deze scenario's zijn de meest opmerkelijke prestatieverbeteringen waargenomen, met name in games die slecht zijn aangepast aan de hybride architectuur van Intel.

Het is belangrijk op te merken dat, hoewel de filosofie van BOT doet denken aan die van APO (beide zijn softwareoptimalisaties die "van buitenaf" op de applicatie worden toegepast), Ze zijn niet uitwisselbaar of gelijkwaardig.Intel presenteert ze als complementaire tools om elke laag van de prestatiestack te verfijnen: van hardware en de configuratie ervan (XTU), via procesallocatie (APO), tot de reorganisatie van de machinecode zelf (BOT).

Prestatieverbeteringen in games: van bescheiden verbeteringen tot spectaculaire sprongen voorwaarts.

Intel beweert dat de Binary Optimization Tool in de eerste reeks ondersteunde titels een Gemiddelde verbetering van ongeveer 8% in games.met veel hogere pieken in specifieke scenario's. We hebben het voorlopig over een beperkte lijst van ongeveer 12 spellen, maar de eerste resultaten zijn opvallend.

Een van de meest aangehaalde voorbeelden is Shadow of the Tomb RaiderDeze game maakte, vanwege de oorspronkelijke optimalisatie, niet volledig gebruik van de hybride architectuur van moderne Intel-processoren. Met de APO + BOT-combinatie zijn in sommige benchmarks prestatieverbeteringen van circa 22% en zelfs meer gemeten, waarbij de framesnelheid bijvoorbeeld van 298 naar 375 frames per seconde steeg, een sprong van bijna 26%.

In een modernere game, beter geoptimaliseerd voor de huidige CPU's, zoals Cyberpunk 2077Het verhaal neemt echter een aanzienlijk andere wending. In dit geval bedragen de verbeteringen slechts enkele procentpunten: van ongeveer 210 FPS naar iets meer dan 220 in bepaalde benchmarks, of van ongeveer 173 FPS naar ongeveer 179 in andere specifieke scènes. We hebben het hier over stijgingen van ongeveer 3-5%Die zijn nog steeds welkom omdat ze "gratis" zijn voor de gebruiker, maar ze veranderen de ervaring niet meer zo veel.

Wat deze cijfers aantonen, is dat BOT noch wonderbaarlijk noch zwarte magie is, maar eerder Het hangt er sterk van af hoe goed (of slecht) het begin van het spel is geoptimaliseerd.Als het oorspronkelijke binaire bestand ernstig niet is afgestemd op de architectuur van Intel, kan de impact dramatisch zijn. Wanneer het redelijk goed is afgestemd, haalt BOT er slechts een paar extra FPS uit, wat in kritieke situaties of bij hoge verversingsfrequenties nog steeds een verschil kan maken.

Buiten de gamingwereld zijn ook opmerkelijke effecten waargenomen in bepaalde resource-intensieve toepassingen, zoals... Objectverwijdering of HDR-verwerkingwaarbij laboratoriumanalyses wijzen op een toename tot wel 30% dankzij een agressievere vectorisatie van oorspronkelijk scalaire codefragmenten.

Diepgaande vectorisatie en instructieanalyse: de Geekbench-case

Een van de duidelijkste manieren om te begrijpen wat BOT doet, is door te kijken naar wat Primate Labs, de verantwoordelijke partij voor GeekbenchZe onderzochten nauwgezet hoe hun benchmarkprestaties veranderden wanneer de tool van Intel actief was. Hiervoor gebruikten ze de Intel Software Development Emulator (SDE), die het aantal en het type uitgevoerde instructies meet.

Bij een standaard Geekbench 6-test zonder bot duurde de test ongeveer 1,26 biljoen instructies om te voltooien. Met BOT geactiveerd daalde dat aantal tot ongeveer 1,08 biljoen, wat een reductie van circa 14% in het totale aantal instructies impliceert. Met andere woorden, het werk wordt compacter en efficiënter uitgevoerd, zonder functionaliteiten te schrappen of gebruik te maken van snelkoppelingen.

Wanneer de instructies worden opgesplitst naar type, wordt de filosofie van de tool nog duidelijker. Het aantal scalaire instructies daalt van ongeveer 220.000 miljard tot ongeveer 84.600 miljardTerwijl vectorinstructies (SSE2, AVX2, enz.) explosief stijgen van 1.250 miljard naar ongeveer 18.300 miljard, oftewel een toename van ongeveer 13,7 keer voor dit type instructie.

Dit maakt volkomen duidelijk dat BOT zich grotendeels toelegt op converteer inefficiënte scalaire codefragmenten naar gevectoriseerde code. Dit zorgt voor een beter gebruik van de SIMD-eenheden in Intel-processoren. Waar voorheen veel eenvoudige, repetitieve bewerkingen werden uitgevoerd, worden deze nu gegroepeerd in vectorbewerkingen die meerdere datapunten parallel verwerken. Dit sluit perfect aan bij het interne ontwerp van de nieuwste microarchitecturen van het bedrijf.

Deze grootschalige vectorisatie gebeurt niet blindelings. Het is gebaseerd op hardwareprofilering (HWPGO) en binaire post-optimalisatie die Intel in zijn laboratoria uitvoert, wat verklaart waarom BOT van buitenaf gezien wordt als een een tamelijk geavanceerde zwarte doosDe gebruiker ziet alleen dat de benchmark of het spel sneller draait, maar heeft geen exact inzicht in welke transformaties op het uitvoeringspad zijn toegepast.

Compatibel met een beperkt aantal games, exclusief voor Arrow Lake Refresh en vereist handmatige activering.

Ondanks het potentieel kent de tool een aantal noemenswaardige beperkingen. De eerste is dat, in ieder geval in deze beginfase, De compatibiliteit met Intel BOT is beperkt tot een klein aantal games.van ongeveer een dozijn geselecteerde titels. Intel heeft aangegeven dat het de catalogus zal uitbreiden, maar voorlopig is het aanbod vrij beperkt.

De tweede belangrijke beperking is dat het een Exclusieve functie van Arrow Lake Refresh-processors (Core Ultra 200S Plus), waarbij Linux-ondersteuning afhankelijk is van oplossingen zoals Proton 11Het is iets wat je in eerdere generaties niet kon activeren, waardoor BOT een onderscheidend kenmerk is van deze CPU-familie ten opzichte van eerdere modellen en, gedeeltelijk, ten opzichte van de directe concurrentie.

Om van deze optimalisaties te kunnen profiteren, moet de gebruiker bovendien een aantal stappen uitvoeren: momenteel wordt BOT geactiveerd via een "Geavanceerde modus" binnen het Intel-prestatiepakket En het vereist een herstart van het systeem om de profielen correct toe te passen. Het is geen ingewikkeld proces, maar het is verre van volledig transparant.

Intel heeft erop aangedrongen dat de uiteindelijke ervaring zo automatisch mogelijk moet verlopen, en inderdaad gebeurt veel van de magie geruisloos zodra je het hebt ingesteld, maar voorlopig is er nog een bepaald onderdeel dat... complexiteit en exclusiviteit waardoor de enorme impact ervan beperkt blijft onder minder enthousiaste gebruikers of gebruikers die minder geneigd zijn om geavanceerde instellingen aan te passen.

Een ander punt om te overwegen is dat BOT, door op zo'n laag niveau in te grijpen in het uitvoeringspad van het binaire bestand, momenteel verboden in veel gevoelige omgevingenvooral in online games met zeer strenge anti-cheat-systemen.

Problemen met anti-cheat-systemen en twijfels in de wereld van benchmarking.

Een van de meest delicate aspecten voor Intel BOT is de interactie met de anti-cheat-systemen in multiplayergamesOmdat de tool de uitvoeringswijze van het binaire bestand tijdens de runtime wijzigt, kunnen sommige anti-cheatprogramma's, zoals Ricochet of Vanguard, dit interpreteren als een poging om het spel te manipuleren en het als verdacht gedrag markeren.

Dit betekent dat, voorlopig, BOT is mogelijk niet geschikt voor competitieve online games.waarbij klantintegriteit de hoogste prioriteit heeft. Totdat er een duidelijke overeenkomst is tussen Intel en leveranciers van anti-cheat-systemen, of specifieke methoden om te garanderen dat deze optimalisaties geen oneerlijke voordelen opleveren, zal de functie waarschijnlijk beperkt blijven tot singleplayer-games of ervaringen zonder dergelijke agressieve anti-cheat-systemen.

Een ander belangrijk twistpunt is ontstaan ​​op het gebied van synthetische benchmarks. Primate Labs, het bedrijf achter Geekbench, heeft verklaard dat het gebruik van bots de geldigheid van de resultaten in gevaar brengenOmdat het het verwachte gedrag van het uitvoerbare bestand ingrijpend verandert. In een benchmarkomgeving, waar de "pure prestaties" van het systeem gemeten zouden moeten worden, verandert een externe optimalisatielaag als deze de spelregels.

Om de transparantie te waarborgen, zal Geekbench expliciet runs markeren waarbij Intel BOT-interventie wordt gedetecteerd. Versie 6.7 van de benchmark voegt een specifieke vlag om "door BOT verbeterde" resultaten te identificerenzodat ze gemakkelijk te onderscheiden zijn van conventionele metingen en niet zonder de juiste toelichting in ranglijsten terechtkomen.

Deze situatie leidt tot een interessant debat over hoe we benchmarks moeten interpreteren in een tijdperk waarin optimalisatiesoftware om de werkzaamheden van een CPU fundamenteel te herordenen.De grens tussen de "werkelijke" mogelijkheden van de hardware en de ondersteuning die de software biedt, vervaagt. Dit dwingt ons om opnieuw na te denken over wat we precies meten wanneer we twee processors met zeer verschillende configuraties vergelijken.

Vanuit het perspectief van de eindgebruiker is de discussie echter minder filosofisch: als een game of applicatie merkbaar sneller draait op hun computer omdat Intel erin is geslaagd het uitvoeringspad te verbeteren zonder in te leveren op kwaliteit of functionaliteit, zal het gevoel simpelweg zijn dat... "De processor presteert beter"Hoewel een deel van die eer eerder te danken is aan de binaire optimalisatielaag dan alleen aan de siliciumchip.

Praktische voordelen en toekomstperspectieven van Intel BOT ten opzichte van de concurrentie

In het grotere geheel wordt BOT gepresenteerd als een soort "geheim wapen" voor de inlichtingendiensten. een deel van de prestatiekloof dichten Het bedrijf wordt geconfronteerd met zeer sterke alternatieven van de concurrentie, met name op het gebied van games, voordat toekomstige architecturen zoals Nova Lake en het beloofde BLLC hun intrede doen.

Het belangrijkste voordeel van de tool is dat, wanneer het oorspronkelijke uitvoerbare bestand slecht geoptimaliseerd is voor de Intel-architectuur, De winst kan enorm zijn. Zonder dat de gebruiker iets in het spel zelf hoeft aan te passen, en zonder dat de ontwikkelaar een specifieke patch hoeft uit te brengen. Het is een manier om prestatieverlies te compenseren in games die oorspronkelijk voor andere platforms of consoles zijn ontworpen.

Bovendien vermindert BOT de beeldkwaliteit, tussenfilmpjes of natuurkundige effecten niet: de functionaliteit van het programma blijft hetzelfde. Wat wel verandert, is de manier waarop de instructies zijn georganiseerd, zodat de CPU... Drukker bezig met nuttig werk en minder wachttijd. door middel van data, caches of voorspellers. Vanuit het perspectief van de game-ervaring vertaalt dit zich in een stabielere framerate en, in sommige gevallen, minder prestatievariatie in complexe scènes.

De grote uitdaging voor de toekomst zal zijn schaalbaarheid en acceptatie in de industrieWil Intel BOT echt een grote impact hebben, dan moet de lijst met ondersteunde games en applicaties aanzienlijk groeien, en zullen belangrijke spelers in het ecosysteem (anti-cheatsoftware, benchmarkontwikkelaars, ontwikkelstudio's, enz.) zich moeten aanpassen aan het bestaan ​​van deze nieuwe middlewarelaag.

Het zal ook interessant zijn om te zien hoe de concurrentie reageert. Als deze binaire optimalisatiestrategie effectief blijkt en goed wordt ontvangen door de markt, zou het niet verrassend zijn als andere bedrijven soortgelijke strategieën gaan onderzoeken. vergelijkbare code-oplossingen na optimalisatie Of je kunt je verdiepen in het gebruik van drivers en tussenliggende lagen om het maximale uit de hardware te halen.

Over het algemeen biedt de Intel Binary Optimization Tool veel potentie voor diegenen die elke laatste FPS of extra punt uit bepaalde workloads willen persen, maar er zijn aanzienlijke grijze gebieden met betrekking tot compatibiliteit, transparantie en reikwijdte. Als Intel erin slaagt de ondersteuning uit te breiden, de integratie met anti-cheatsoftware te verbeteren en de aanwezigheid ervan in benchmarks te normaliseren, zou het een waardevolle tool kunnen worden. een belangrijk onderdeel van hun prestatiestrategie in de komende jaren, naast puur hardwareverbeteringen.

Gerelateerd artikel:
Versnel je games als een hel met Wise Game Booster