Sse 4.1-processorer. AMD Bulldozer arkitektur. Instruktioner

Hej alla. Låt oss prata idag om hur man tar reda på vilka SSE-instruktioner som processorn stöder. Men vad är SSE du vet? Jag vet inte, och det är inte så att jag inte vet, jag kan inte ens förstå vad det är. Jo, det vill säga, jag förstår att detta är en processorinstruktion som behövs för att optimera dess funktion, det vill säga så att den med samma frekvens av procentsatser med denna instruktion kan bearbeta fler kommandon. Men det är så, ungefär så att säga...

Om SSE Jag vet inte alls var i livet det behövs, kanske för spel? Jag vet vad Hyper-threading är (även om det inte är en processorinstruktion, det är en teknik), vad VT-x, VT-d är, vad EM64T är, jag vet inte vad SSE är! Tja, det här är pajerna

Kort sagt, killar, jag ska genast berätta för er att det är ett litet skrot med det här fodralet, jag menar att regelbundna medel Windows en sådan sak som SSE går inte att ta reda på om det är det eller inte. Här behöver du ladda ner ett speciellt program. Men oroa dig inte, det här superduperprogrammet är gratis, det väger väldigt lite, datorn laddar inte alls, men samtidigt är det MEGA ANVÄNDbart och heter CPU-Z (du kan förresten ladda ner den här: cpuid.com/softwares/cpu-z.html, detta är den officiella webbplatsen).

Så killar, laddade ner CPU-Z, installerade den och körde den sedan. Och genast kommer du att få reda på hur många av dessa SSE:er jag har:

Inte en eller två, utan så många som sex, kära vänner

Förresten, som du kan se finns det fortfarande mycket användbar information, ser du? Om du akut behöver veta något om din process, startar du snabbt CPU-Z och oj, allt du behöver finns till hands! Jag säger att CPU-Z-programmet är en bra sak! Tro mig inte? Nåväl, inga problem, jag ska bevisa det för dig nu. Titta, vet du när det eller det minnesfältet släpptes? Jo, det vill säga datumet för dess utgivning på anläggningen, så att säga. Eller är det inte intressant för dig? Jo, vissa människor är väldigt intresserade, till exempel är jag väldigt intresserad! Och nu kan CPU-Z-programmet visa sådan information! Så killar, titta, du startade CPU-Z, gå till SPD-fliken, välj kortplatsen med stapeln (till vänster), det vill säga kontakten där den är installerad och titta på informationen på den valda stapeln. Jag har en stapel för 8 spelningar i den fjärde platsen och det här är vad CPU-Z-programmet visade:

Här kan du se att min planka släpptes den 30:e veckan 2014. Det står också skrivet att min tillverkare är Hyundai Electronics, ja, det är namnet på Hynix-baren

Tja, kort sagt, CPU-Z är super, om du snabbt behöver titta på den viktigaste informationen om hårdvaran på en dator eller bärbar dator, kommer den att visa allt detta utan skämt! Kort sagt, jag rekommenderar killar!

Och ändå glömde jag att skriva något om SSE. Du kan inte aktivera eller inaktivera SSE. För denna instruktion finns antingen där eller inte. Till exempel kan Hyper-threading aktiveras/avaktiveras, men SSE är det inte!

Det är allt killar, jag hoppas att allt här var klart för er, och om något är fel så ber jag om ursäkt. Var den här informationen användbar för dig, ärligt talat? Jag hoppas av hela mitt hjärta att ja! Lycka till i livet, så att du är frisk och inte sjuk, lycka till

09.12.2016

Ofta kräver modern programvara eller spel att processorn har SSE instruktioner 4.1 - 4.2. Om det inte finns några, spring önskad applikation det fungerar inte, något fel kraschar eller så händer det bara ingenting.

FarCry 5 svär över bristen på SSE 4.2

Samtidigt kan processorkraften räcka till mer eller mindre bekvämt spel(till exempel några Xeon-processorer för socket 775 är fortfarande kapabla att leverera tolerabel FPS i nya produkter), och kravet på instruktioner är ibland nödvändigt inte ens för själva spelet, utan för att kopieringsskyddet ska fungera. Till exempel tillät Denuvo-skyddet inte ägare av gamla processorer att spela Assassin "s Trosbekännelsens ursprungäven om spelet att ha senaste instruktionerna inte krävde.

Andra populära spel eller deras komponenter kräver också SSE 4.1 eller 4.2: No Man Sky, Far Cry 5, Dishonored 2, Mafia 3 och andra.

Ändå finns det en lösning, även om den inte till 100% garanterar framgång. För att köra önskad applikation kan du använda emulatorn sde extern, som kan laddas ner från länken (välj version för Windows) eller längst ner i denna artikel.

Hur man använder SSE 4.1-4.2-emulatorn

  • Ladda ner arkivet med sde extern och packa upp det så att sde.exe ligger i mappen med rätt spel eller program
  • Skapa en genväg för sde.exe. Sedan öppnar vi egenskaperna för genvägen och lägger till objektet i parametern - den nödvändiga file.exe... Till exempel: D: \ Games \ No Man "s Sky \ Binaries \ sde.exe" - NMS.exe. Det måste finnas ett mellanslag efter det sista citattecknet, annars tillåter systemet inte att genvägen sparas.
  • I egenskaperna för genvägen på fliken "Kompatibilitet" bör du också sätta alternativet "kör som administratör".
  • Spara genvägen och kör den. Visas svart fönster, den kan stängas. Efter ett tag bör den nödvändiga applikationen starta.

I den nya Nehalem-mikroarkitekturen fortsatte Intel sin tidigare kurs med att öka antalet SIMD-instruktioner som stöds. Den påfyllda instruktionsuppsättningen utökades med sju nya instruktioner och fick namnet SSE4.2 (beteckningen SSE4.1 användes för SIMD-systemet med instruktioner för Penryn-processorer). Samtidigt uppmärksammar Intel specifikt det faktum att instruktionerna som introduceras i SSE4.2-setet inte är fokuserade så mycket på att påskynda behandlingen av strömmande mediainnehåll, utan på andra syften. Därför fick de nya instruktionerna som introducerades i Nehalem också symbolen ATA (Application Targeted Accelerators). ATA-konceptet presenteras på ett sådant sätt att moderna tekniska processer gör det möjligt att använda några av processortransistorerna inte bara för universella funktionsblock, utan också för specifika behov, vilket ökar hastigheten på specifika uppgifter. Till exempel, i enlighet med detta koncept, lägger SSE4.2 till fem instruktioner för att påskynda analysen av XML-filer. Med samma instruktioner är det också möjligt att öka hastigheten för bearbetning av rader och texter. Ytterligare två nya instruktioner från SSE4.2 är inriktade på helt andra applikationer. Den första, CRC32, ackumulerar CRC32c-kontrollsumman, och den andra, POPCNT, räknar antalet bitar som inte är noll i källan. Dessa kommandon kan också få stor användning i en mängd olika applikationer och nätverksapplikationer.

Integrerad minneskontroll

Nehalem var den första Intel-mikroarkitekturen som integrerade en minneskontroller i en processor. Det verkar som att Intels ingenjörer här lånade idén från sina kollegor från AMD, som har byggt en minneskontroller inuti processorer sedan 2003. Detta är dock inte helt sant, eftersom de första processorerna med en integrerad minneskontroller skulle vara den aldrig släppta Intel Timna, som man arbetade aktivt med 1999. Dessutom bör anklagelserna om plagiat också avfärdas eftersom minneskontrollern som utvecklats av Intel för Nehalem skiljer sig mycket från kontrollenheten som används i befintliga AMD-processorer. Intels inställning till problemet visade sig vara mycket mer ambitiös. Huvudegenskapen hos Nehalem-processorernas minneskontroller är flexibilitet. Med hänsyn till den modulära designen av hela den lovande processorfamiljen, som kan innehålla produkter som skiljer sig mycket åt i egenskaper och marknadspositionering, har Intel tillhandahållit möjligheten att inte bara aktivera eller inaktivera stöd för buffrade moduler, utan också att variera antalet kanaler och minneshastighet. Samtidigt kommer de första processorerna med Nehalem-mikroarkitekturen, som kommer att släppas i en fyrkärnig version, få en trekanalig minneskontroller med stöd för DDR3 SDRAM. Således kommer stationära system byggda på de nya processorerna att kunna skryta med en oöverträffad minnesbandbredd, som vid användning av tre moduler DDR3-1067 kommer att nå 25,6 GB/s. Den största fördelen med att flytta DRAM-kontrollern till processorn är dock inte så mycket tillväxten bandbredd hur mycket för att minska latensen för minnesdelsystemet. Trots att Intel föreslår att använda minne med relativt hög latens med nya DDR3-processorer kommer latenserna vid åtkomst till Nehalem-minnet i alla fall att vara lägre än i system baserade på Kärnprocessorer 2 och använder DDR3 SDRAM (och förmodligen DDR2 SDRAM). För att bekräfta dessa ord skulle jag vilja citera data som erhölls vid mätning av de praktiska parametrarna för minnesundersystemet i ett Nehalem-baserat system i testverktyget Everest 4.60.

Tabell 2. Testa minnesfunktion

Faktiskt, även om den arbetar i enkanalsläge, kan Nehalem-minneskontrollern visa bättre prestanda än minneskontrollern på dagens LGA775-plattformar. Detta är ett helt naturligt resultat, eftersom det inte finns några mellanliggande enheter på vägen mellan processorn och minnet i nya generationens system, medan tidigare chipsets norra brygga var ansvarig för att arbeta med minne, vilket introducerade sina egna mycket betydande förseningar orsakade av måste synkronisera minnesbussar och FSB ... En annan indirekt fördel med det inbyggda minnet i processorn är att dess funktion nu inte beror på styrkretsen eller moderkortet. Som ett resultat kommer Nehalem att visa samma minnesprestanda över plattformar från olika utvecklare och tillverkare.

För några månader sedan introducerade AMD en ny arkitektur som kommer att användas i nya processorer från och med 2011. Ny arkitektur bär Bulldozer-namnet och är helt olik den nuvarande AMD64-arkitekturen som AMD har använt sedan 2003.

Bulldozer-arkitekturen kommer att ärva några av de teknologilösningar som introducerats med AMD64-arkitekturen, såsom ett integrerat minne och busskontroller HyperTransport för kommunikation mellan processorn och styrkretsen.

BulldozerÄr ett arkitekturkodnamn, inte ett specifikt processornamn. Som vanligtvis är fallet kommer den första releasen av processorer att fokusera på servermarknaden, sedan en release för marknaden för dyra högpresterande datorer, sedan för mellanprissegmentet och i slutet för budgetmarknaden .

Även om AMD inte avslöjade specifikationerna för de nya processorerna, noterade de att de första processorerna för stationär dator kommer att utföras på den nya sockeln AM3+ som kommer att vara kompatibel med befintlig AM3-sockel. Socket AM3 + kommer dock inte att vara kompatibel med moderkort för Socket AM3.

Bulldozer-arkitekturen kommer att ha teknik som liknar Intel Turboladdning för att automatiskt överklocka processorn.
Innan vi pratar om Bulldozers interna arkitektur, låt oss titta på uppsättningen instruktioner som stöds av den nya arkitekturen.

Bulldozers arkitektur kommer, förutom att vara kompatibel med x86-instruktionsstandarden, stödja följande ytterligare uppsättningar instruktioner:

  • SSE4.1 och SSE4.2
  • AVX (Advanced Vector Extensions) med ytterligare två instruktioner XOP och FMA4
  • AES (Advanced Encryption Standard) - avancerad krypteringsstandard
  • LWP (Light Weight Profiling)

SSE4.1 och SSE4.2

Till sist AMD-processorer kommer att stödja SSE4-instruktionsuppsättningen. AMD-processorer stöder för närvarande inte denna instruktionsuppsättning, vilket förbättrar prestandan i multimediaapplikationer(till exempel applikationer för bild- och videobehandling). På det här ögonblicket Stöd för AMD-processorer eget set instruktioner som kallas SSE4a, vilket inte är detsamma som SSE4.

AVX (Advanced Vector Extensions)

Vid ett tillfälle erbjöd AMD att använda den nya SSE5-instruktionsuppsättningen. Det var därför Intel bestämde sig för att skapa en egen implementering av det som kallades SSE5 och kallade denna instruktion - AVX (Advanced Vector Extensions). AMD bestämde sig för att lägga till denna instruktionsuppsättning för Bulldozer-arkitekturen.

AVX-instruktioner kommer också att stödjas av nya Intel-processorer på Sandig arkitektur Bro.

Utrustning AVX instruktioner lägger till 12 nya instruktioner och ökar storleken på XMM-registren från 128 bitar till 256 bitar.

I Bulldozer-arkitekturen beslutade AMD att använda några av instruktionerna som föreslogs för SSE5. Därför är användningen av AVX i Bulldozer-arkitekturen mer komplett än Intels. Dessa Ytterligare instruktioner kallas XOP och FMA4. AMD noterade också att AVX har en underuppsättning av FMAC-kommandon (Fused Multiply Accumulate), men i själva verket är det en del av XOP-instruktionsuppsättningen.

AES (Advanced Encryption Standard)

Denna uppsättning kommandon används redan i nya Intel-processorer, baserad på "Westmere"-arkitekturen (förutom Core i3), och består av sex nya instruktioner relaterade till kryptering. Intel kallar denna instruktionsuppsättning AES-NI.

LWP (Light Weight Profiling)

LWP-instruktioner kommer att förbättra prestandan för multithreaded programvara jobbar för flerkärniga processorer... LWP innehåller sex nya instruktioner.