Sse 4.1-processors. AMD Bulldozer-architectuur. instructies:

Hallo allemaal. Laten we het vandaag hebben over hoe we kunnen achterhalen welke SSE-instructies de processor ondersteunt. Maar wat is SSE weet je? Ik weet het niet, en het is niet dat ik het niet weet, ik kan niet eens begrijpen wat het is. Nou, dat wil zeggen, ik begrijp dat dit een processorinstructie is die nodig is om de werking ervan te optimaliseren, dat wil zeggen, zodat het met dezelfde frequentie van percentages met deze instructie meer opdrachten kan verwerken. Maar dit is zo, ongeveer zo gezegd...

Over SSE Ik weet helemaal niet waar het in het leven nodig is, misschien voor games? Ik weet wat Hyper-threading is (hoewel het geen processorinstructie is, het is een technologie), wat VT-x, VT-d is, wat EM64T is, ik weet niet wat SSE is! Nou, dit zijn de taarten jongens

Kortom, jongens, ik zal jullie meteen vertellen dat er een kleine scrappy is met deze zaak, ik bedoel dat reguliere middelen Windows zoiets als SSE kan niet worden achterhaald of het dat is of niet. Hier moet je een speciaal programma downloaden. Maar maak je geen zorgen, dit superduper-programma is gratis, het weegt heel weinig, de computer laadt helemaal niet, maar tegelijkertijd is het MEGA NUTTIG en heet het CPU-Z (trouwens, je kunt downloaden het hier: cpuid.com/softwares/cpu-z.html , dit is de officiële site).

Dus jongens, download CPU-Z, installeer het en voer het uit. En je zult meteen zien hoeveel van deze SSE's ik heb:

Niet één of twee, maar wel zes, beste mensen

Trouwens, zoals je kunt zien, is er nog veel nuttige informatie, zie je? Als je dringend iets wilt weten over je proces, dan start je snel CPU-Z en oeps, alles wat je nodig hebt is binnen handbereik! Ik zeg dat het CPU-Z-programma een goede zaak is! Geloof me niet? Geen probleem, ik zal het je nu bewijzen. Kijk, weet je wanneer deze of gene geheugenbalk is uitgebracht? Nou, dat wil zeggen, de datum van de release in de fabriek, om zo te zeggen. Of vind je het niet interessant? Nou, sommige mensen zijn erg geïnteresseerd, ik ben bijvoorbeeld erg geïnteresseerd! En nu kan het CPU-Z-programma dergelijke informatie tonen! Dus jongens, kijk, je hebt CPU-Z gestart, ga naar het SPD-tabblad, selecteer het slot met de balk (aan de linkerkant), dat wil zeggen, de connector waar het is geïnstalleerd en kijk naar de informatie op de geselecteerde balk. Ik heb één balk voor 8 optredens in het vierde slot en dit is wat het CPU-Z-programma liet zien:

Hier kun je zien dat mijn plank in de 30e week van 2014 is uitgebracht. Er staat ook geschreven dat mijn fabrikant Hyundai Electronics is, nou ja, dit is de naam van de Hynix-bar

Nou, kortom CPU-Z is super, als je snel de belangrijkste informatie over de hardware van een computer of laptop moet bekijken, dan zal het dit allemaal zonder grappen laten zien! Kortom, ik raad jongens aan!

En toch vergat ik iets over SSE te schrijven. U kunt SSE niet in- of uitschakelen. Want deze instructie is er of niet. Hyper-threading kan bijvoorbeeld worden in-/uitgeschakeld, maar SSE niet!

Dat is alles jongens, ik hoop dat alles hier duidelijk voor je was, en als er iets mis is, dan bied ik mijn excuses aan. Was deze info nuttig voor u, eerlijk gezegd? Ik hoop met heel mijn hart dat ja! Veel geluk in het leven, zodat je gezond bent en niet ziek, veel geluk

09.12.2016

Vaak vereisen moderne software of games dat de processor beschikt over: SSE instructies 4.1 - 4.2. Als er geen zijn, ren dan gewenste toepassing het werkt niet, een fout crasht of er gebeurt gewoon niets.

FarCry 5 zweert bij het ontbreken van SSE 4.2

Tegelijkertijd kan de processorkracht voldoende zijn voor meer of minder comfortabel spel(bijvoorbeeld sommige Xeon-processors voor socket 775 zijn nog steeds in staat om aanvaardbare FPS te leveren in nieuwe producten), en de vereiste van instructies is soms zelfs niet voor het spel zelf nodig, maar om de kopieerbeveiliging te laten werken. Denuvo-beveiliging stond bijvoorbeeld eigenaren van oude processors niet toe om Assassin "s . te spelen Creed oorsprong hoewel het spel van hebben laatste instructies niet nodig had.

Andere populaire games of hun componenten vereisen ook SSE 4.1 of 4.2: No Man Sky, Far Cry 5, Dishonored 2, Mafia 3 en andere.

Toch is er een oplossing, al is het geen 100% garantie voor succes. Om de gewenste applicatie uit te voeren, kunt u de emulator gebruiken sde extern, die kan worden gedownload via de link (kies de versie voor Windows) of onderaan dit artikel.

Hoe de SSE 4.1-4.2-emulator te gebruiken

  • Download het archief met sde external en pak het uit zodat sde.exe in de map staat met het juiste spel of programma
  • Maak een snelkoppeling voor sde.exe. Vervolgens openen we de eigenschappen van de snelkoppeling en voegen we het object toe aan de parameter - het vereiste bestand.exe... Bijvoorbeeld: D: \ Games \ No Man "s Sky \ Binaries \ sde.exe" - NMS.exe. Er moet een spatie staan ​​na het laatste aanhalingsteken, anders staat het systeem het opslaan van de snelkoppeling niet toe.
  • Ook moet u in de eigenschappen van de snelkoppeling op het tabblad "Compatibiliteit" de optie "uitvoeren als beheerder" plaatsen.
  • Sla de snelkoppeling op en voer deze uit. Verschijnt zwart raam, deze kan worden gesloten. Na een tijdje zou de vereiste applicatie moeten starten.

In de nieuwe Nehalem-microarchitectuur zette Intel zijn eerdere koers voort om het aantal ondersteunde SIMD-instructies te vergroten. De aangevulde instructieset werd uitgebreid met zeven nieuwe instructies en kreeg de naam SSE4.2 (de aanduiding SSE4.1 werd gebruikt voor het SIMD-instructiessysteem voor Penryn-processors). Tegelijkertijd vestigt Intel er specifiek de aandacht op dat de instructies die in de SSE4.2-set zijn geïntroduceerd niet zozeer gericht zijn op het versnellen van de verwerking van streaming media-inhoud, maar op andere doeleinden. Daarom hebben de nieuwe instructies die in Nehalem zijn geïntroduceerd ook het symbool ATA (Application Targeted Accelerators) gekregen. Het ATA-concept wordt zo gepresenteerd dat moderne technologische processen het mogelijk maken om sommige processortransistors niet alleen voor universele functionele blokken te gebruiken, maar ook voor specifieke behoeften, waardoor de snelheid van specifieke taken wordt verhoogd. In overeenstemming met dit concept voegt SSE4.2 bijvoorbeeld vijf instructies toe om het ontleden van XML-bestanden te versnellen. Met dezelfde instructies is het ook mogelijk om de verwerkingssnelheid van regels en teksten te verhogen. Nog twee nieuwe instructies van de SSE4.2 richten zich op totaal verschillende toepassingen. De eerste, CRC32, accumuleert de CRC32c-controlesom en de tweede, POPCNT, telt het aantal niet-nulbits in de bron. Deze opdrachten kunnen ook veel worden gebruikt in een verscheidenheid aan toepassingen en netwerktoepassingen.

Geïntegreerde geheugencontroller

Nehalem was de eerste Intel-microarchitectuur die een geheugencontroller in een processor integreerde. Het lijkt erop dat Intel-ingenieurs hier het idee van hun collega's van AMD hebben geleend, die sinds 2003 een geheugencontroller in processors bouwen. Dit is echter niet helemaal waar, aangezien de eerste processors met een geïntegreerde geheugencontroller de nooit uitgebrachte Intel Timna zouden zijn, waar in 1999 actief aan werd gewerkt. Daarnaast moeten de plagiaatbeschuldigingen ook worden afgewezen omdat de geheugencontroller die Intel voor Nehalem heeft ontwikkeld heel anders is dan de controller die wordt gebruikt in bestaande AMD-processors. Intel's benadering van het probleem bleek veel ambitieuzer. De belangrijkste eigenschap van de geheugencontroller van de Nehalem-processors is flexibiliteit. Rekening houdend met het modulaire ontwerp van de hele veelbelovende processorfamilie, die producten kan bevatten die sterk verschillen in kenmerken en marktpositionering, heeft Intel niet alleen de mogelijkheid geboden om ondersteuning voor gebufferde modules in of uit te schakelen, maar ook om het aantal kanalen te variëren en geheugensnelheid. Tegelijkertijd krijgen de eerste processors met de Nehalem-microarchitectuur, die in een vierkernversie wordt uitgebracht, een driekanaals geheugencontroller met ondersteuning voor DDR3 SDRAM. Zo zullen desktopsystemen die op de nieuwe processors zijn gebouwd, kunnen bogen op een ongeëvenaarde geheugenbandbreedte, die in het geval van gebruik van drie modules DDR3-1067 zal 25,6 GB / s bereiken. Het belangrijkste voordeel van het verplaatsen van de DRAM-controller naar de processor is echter niet zozeer de groei bandbreedte hoeveel in het verminderen van de latentie van het geheugensubsysteem. Ondanks dat Intel voorstelt om geheugen met relatief hoge latency te gebruiken bij nieuwe DDR3-processors, zullen de latencies bij het benaderen van Nehalem-geheugen in ieder geval lager zijn dan bij systemen gebaseerd op Kernprocessors 2 en met behulp van DDR3 SDRAM (en waarschijnlijk DDR2 SDRAM). Om deze woorden te bevestigen, wil ik de gegevens citeren die zijn verkregen bij het meten van de praktische parameters van het geheugensubsysteem van een op Nehalem gebaseerd systeem in het Everest 4.60-testprogramma.

Tabel 2. Geheugenwerking testen

Zelfs in de enkelkanaalsmodus kan de Nehalem-geheugencontroller betere prestaties leveren dan de geheugencontroller van de huidige LGA775-platforms. Dit is een volkomen natuurlijk resultaat, aangezien er geen tussenliggende apparaten zijn op het pad tussen de processor en het geheugen in systemen van de nieuwe generatie, terwijl eerder de noordbrug van de chipset verantwoordelijk was voor het werken met geheugen, wat zijn eigen zeer aanzienlijke vertragingen veroorzaakte veroorzaakt door de moet geheugenbussen en FSB synchroniseren ... Een ander indirect voordeel van het in de processor ingebouwde geheugen is dat de werking nu niet meer afhankelijk is van de chipset of het moederbord. Als gevolg hiervan zal Nehalem dezelfde geheugenprestaties laten zien op platforms van verschillende ontwikkelaars en fabrikanten.

Een paar maanden geleden introduceerde AMD een nieuwe architectuur die vanaf 2011 in nieuwe processors zal worden gebruikt. Nieuwe architectuur draagt ​​de naam Bulldozer en is totaal anders dan de huidige AMD64-architectuur die AMD sinds 2003 gebruikt.

De Bulldozer-architectuur zal enkele van de technologische oplossingen erven die zijn geïntroduceerd met de AMD64-architectuur, zoals een geïntegreerd geheugen en buscontroller HyperTransport voor communicatie tussen de processor en de chipset.

Bulldozer Is een architectuurcodenaam, geen specifieke processornaam. Zoals meestal het geval is, zal de eerste release van processors gericht zijn op de servermarkt, dan een release op de markt van dure high-performance computers, dan op het middensegment en uiteindelijk op de budgetmarkt .

Hoewel AMD de specificaties van de nieuwe processors niet bekendmaakte, merkten ze op dat de eerste processors voor desktop computer wordt uitgevoerd op de nieuwe socket AM3 + die compatibel zal zijn met de bestaande AM3-aansluiting. Socket AM3 + is echter niet compatibel met: moederborden voor socket AM3.

Bulldozer-architectuur zal technologie hebben die vergelijkbaar is met Intel Turbo Boost om de processor automatisch te overklokken.
Laten we, voordat we het hebben over de interne architectuur van Bulldozer, eens kijken naar de instructies die door de nieuwe architectuur worden ondersteund.

De architectuur van Bulldozer is niet alleen compatibel met de x86-instructiestandaard, maar ondersteunt ook het volgende: extra sets instructies:

  • SSE4.1 en SSE4.2
  • AVX (Advanced Vector Extensions) met twee extra instructies XOP en FMA4
  • AES (Advanced Encryption Standard) - geavanceerde encryptiestandaard
  • LWP (lichtgewichtprofilering)

SSE4.1 en SSE4.2

Eindelijk AMD-processors ondersteunt de SSE4-instructieset. AMD-processors ondersteunen deze instructieset momenteel niet, wat de prestaties verbetert in multimedia toepassingen(bijvoorbeeld toepassingen voor beeld- en videoverwerking). Op de dit moment Ondersteuning voor AMD-processors eigen set instructies genaamd SSE4a, wat niet hetzelfde is als SSE4.

AVX (Advanced Vector Extensies)

Ooit bood AMD aan om de nieuwe SSE5-instructieset te gebruiken. Dat is de reden waarom Intel besloot om zijn eigen implementatie te maken van wat SSE5 werd genoemd en deze instructie noemde - AVX (Advanced Vector Extensions). AMD besloot deze instructieset voor de Bulldozer-architectuur toe te voegen.

AVX-instructies worden ook ondersteund door nieuwe Intel-processors op Zandige architectuur Brug.

Kit AVX-instructies voegt 12 nieuwe instructies toe en vergroot de grootte van de XMM-registers van 128 bits naar 256 bits.

In de Bulldozer-architectuur besloot AMD enkele van de instructies te gebruiken die waren voorgesteld voor SSE5. Het gebruik van AVX in de Bulldozer-architectuur is dus completer dan dat van Intel. Deze Aanvullende instructies worden XOP en FMA4 genoemd. AMD merkte ook op dat AVX een subset van FMAC-opdrachten (Fused Multiply Accumulate) heeft, maar in feite maakt het deel uit van de XOP-instructieset.

AES (Advanced Encryption Standard)

Deze reeks opdrachten wordt al gebruikt in new Intel-processors, gebaseerd op de "Westmere"-architectuur (behalve Core i3), en bestaat uit zes nieuwe instructies met betrekking tot encryptie. Intel noemt deze instructieset AES-NI.

LWP (lichtgewichtprofilering)

LWP-instructies verbeteren de prestaties van multithreaded software werken voor multi-coreprocessors... De LWP bevat zes nieuwe instructies.