Sse 4.1-prosessorer. AMD Bulldozer-arkitektur. Bruksanvisning

Hei alle sammen. La oss snakke i dag om hvordan du finner ut hvilke SSE-instruksjoner prosessoren støtter. Men hva er SSE vet du? Jeg vet ikke, og det er ikke det at jeg ikke vet, jeg kan ikke engang forstå hva det er. Vel, det vil si, jeg forstår at dette er en prosessorinstruksjon som er nødvendig for å optimere driften, det vil si slik at den med samme frekvens av prosenter med denne instruksjonen kan behandle flere kommandoer. Men dette er sånn, grovt sett for å si det sånn...

Om SSE Jeg vet ikke i det hele tatt hvor i livet det trengs, kanskje for spill? Jeg vet hva Hyper-threading er (selv om det ikke er en prosessorinstruksjon, det er en teknologi), hva VT-x, VT-d er, hva EM64T er, jeg vet ikke hva SSE er! Vel, dette er paiene gutta

Kort sagt, folkens, jeg skal fortelle dere med en gang at det er et lite skrot med denne saken, jeg mener det vanlige midler Windows noe slikt som SSE kan ikke finne ut om det er det eller ikke. Her må du laste ned et spesielt program. Men ikke bekymre deg, dette superduper-programmet er gratis, det veier veldig lite, datamaskinen laster ikke i det hele tatt, men samtidig er det MEGA NYTTIG og navnet er CPU-Z (du kan forresten laste ned den her: cpuid.com/softwares/cpu-z.html , dette er den offisielle siden).

Så folkens, lastet ned CPU-Z, installerte den og kjør den. Og med en gang vil du finne ut hvor mange av disse SSE-ene jeg har:

Ikke en eller to, men så mange som seks, kjære karer

Forresten, som du kan se er det fortsatt mye nyttig informasjon, ser du? Hvis du akutt trenger å vite noe om prosessen din, starter du raskt CPU-Z og ups, alt du trenger er for hånden! Jeg sier at CPU-Z-programmet er en god ting! Tro meg ikke? Vel, ikke noe problem, jeg skal bevise det for deg nå. Se, vet du når denne eller den minnelinjen ble utgitt? Vel, det vil si datoen for utgivelsen på anlegget, for å si det sånn. Eller er det ikke interessant for deg? Vel, noen mennesker er veldig interessert, for eksempel er jeg veldig interessert! Og nå kan CPU-Z-programmet vise slik informasjon! Så folkens, se, du lanserte CPU-Z, gå til SPD-fanen, velg sporet med linjen (til venstre), det vil si kontakten der den er installert og se på informasjonen på den valgte linjen. Jeg har en bar for 8 spillejobber i det fjerde sporet, og dette er hva CPU-Z-programmet viste:

Her kan du se at planken min ble sluppet i 30. uke i 2014. Det står også skrevet at produsenten min er Hyundai Electronics, vel, dette er navnet på Hynix-baren

Vel, kort sagt, CPU-Z er super, hvis du raskt trenger å se på den viktigste informasjonen om maskinvaren til en datamaskin eller bærbar PC, vil den vise alt uten vitser! Kort sagt, jeg anbefaler folkens!

Og likevel glemte jeg å skrive noe om SSE. Du kan ikke aktivere eller deaktivere SSE. For denne instruksjonen er enten der eller ikke. For eksempel kan Hyper-threading aktiveres/deaktiveres, men SSE er det ikke!

Det er alt folkens, jeg håper at alt her var klart for dere, og hvis noe er galt, så beklager jeg. Var denne informasjonen nyttig for deg, ærlig talt? Jeg håper av hele mitt hjerte at ja! Lykke til i livet, slik at du er frisk og ikke syk, lykke til

09.12.2016

Ofte krever moderne programvare eller spill at prosessoren har SSE-instruksjoner 4.1 - 4.2. Hvis det ikke er noen, løp ønsket applikasjon det fungerer ikke, noen feil krasjer eller bare ingenting skjer.

FarCry 5 sverger til mangelen på SSE 4.2

Samtidig kan prosessorkraften være nok til mer eller mindre komfortabelt spill(for eksempel noen Xeon-prosessorer for socket 775 er fortsatt i stand til å levere tolerabel FPS i nye produkter), og kravet om instruksjoner er noen ganger nødvendig, ikke engang for selve spillet, men for at kopibeskyttelsen skal fungere. For eksempel tillot ikke Denuvo-beskyttelsen eiere av gamle prosessorer å spille Assassin "s Trosbekjennelses opprinnelse selv om spillet med å ha siste instruksjoner ikke krevde.

Andre populære spill eller deres komponenter krever også SSE 4.1 eller 4.2: No Man Sky, Far Cry 5, Dishonored 2, Mafia 3 og andre.

Likevel finnes det en løsning, selv om den ikke 100% garanterer suksess. For å kjøre ønsket applikasjon kan du bruke emulatoren sde ekstern, som kan lastes ned fra lenken (velg versjon for Windows) eller nederst i denne artikkelen.

Slik bruker du SSE 4.1-4.2-emulatoren

  • Last ned arkivet med sde external og pakk det ut slik at sde.exe ligger i mappen med det rette spillet eller program
  • Lag en snarvei for sde.exe. Deretter åpner vi egenskapene til snarveien og legger til objektet i parameteren - den nødvendige file.exe... For eksempel: D: \ Games \ No Man "s Sky \ Binaries \ sde.exe" - NMS.exe. Det må være et mellomrom etter siste anførselstegn, ellers vil ikke systemet tillate lagring av snarveien.
  • I egenskapene til snarveien på "Kompatibilitet"-fanen bør du også sette alternativet "kjør som administrator".
  • Lagre snarveien og kjør den. Vises svart vindu, kan den lukkes. Etter en stund skal den nødvendige applikasjonen starte.

I den nye Nehalem-mikroarkitekturen fortsatte Intel sin forrige kurs med å øke antallet SIMD-instruksjoner som støttes. Det etterfylte instruksjonssettet ble utvidet med syv nye instruksjoner og fikk navnet SSE4.2 (betegnelsen SSE4.1 ble brukt for SIMD-systemet med instruksjoner for Penryn-prosessorer). Samtidig trekker Intel spesifikt oppmerksomhet til det faktum at instruksjonene som er introdusert i SSE4.2-settet, ikke fokuserer så mye på å fremskynde behandlingen av strømmet medieinnhold, men på andre formål. Derfor fikk de nye instruksjonene introdusert i Nehalem også symbolet ATA (Application Targeted Accelerators). ATA-konseptet presenteres på en slik måte at moderne teknologiske prosesser gjør det mulig å bruke noen av prosessortransistorene ikke bare for universelle funksjonsblokker, men også for spesifikke behov, noe som øker hastigheten på spesifikke oppgaver. For eksempel, i tråd med dette konseptet, legger SSE4.2 til fem instruksjoner for å øke hastigheten på parsing av XML-filer. Ved å bruke de samme instruksjonene er det også mulig å øke hastigheten på behandling av linjer og tekster. Ytterligere to nye instruksjoner fra SSE4.2 retter seg mot helt andre applikasjoner. Den første, CRC32, akkumulerer CRC32c-sjekksummen, og den andre, POPCNT, teller antall biter som ikke er null i kilden. Disse kommandoene kan også finne bred bruk i en rekke applikasjoner og nettverksapplikasjoner.

Integrert minnekontroller

Nehalem var den første Intel-mikroarkitekturen som integrerte en minnekontroller i en prosessor. Det ser ut til at Intel-ingeniører her lånte ideen til sine kolleger fra AMD, som har bygget en minnekontroller inne i prosessorer siden 2003. Dette er imidlertid ikke helt sant, siden de første prosessorene med integrert minnekontroller skulle være den aldri utgitte Intel Timna, som det ble jobbet aktivt med i 1999. I tillegg bør plagiatbeskyldningene også avvises fordi minnekontrolleren utviklet av Intel for Nehalem er svært forskjellig fra kontrolleren som brukes i eksisterende AMD-prosessorer. Intels tilnærming til problemet viste seg å være mye mer ambisiøs. Hovedegenskapen til minnekontrolleren til Nehalem-prosessorene er fleksibilitet. Tatt i betraktning den modulære utformingen av hele den lovende prosessorfamilien, som kan inneholde produkter som varierer sterkt i egenskaper og markedsposisjonering, har Intel gitt muligheten til ikke bare å aktivere eller deaktivere støtte for bufrede moduler, men også å variere antall kanaler og minnehastighet. Samtidig vil de første prosessorene med Nehalem-mikroarkitekturen, som slippes i en firekjerners versjon, få en tre-kanals minnekontroller med støtte for DDR3 SDRAM. Dermed vil stasjonære systemer bygget på de nye prosessorene kunne skryte av en uovertruffen minnebåndbredde, som ved bruk av tre moduler DDR3-1067 vil nå 25,6 GB/s. Den største fordelen med å flytte DRAM-kontrolleren til prosessoren er imidlertid ikke så mye veksten båndbredde hvor mye i å redusere latensen til minnedelsystemet. Til tross for at Intel foreslår å bruke minne med relativt høy latens med nye DDR3-prosessorer, vil latensene ved tilgang til Nehalem-minne uansett være lavere enn i systemer basert på Kjerneprosessorer 2 og bruker DDR3 SDRAM (og sannsynligvis DDR2 SDRAM). For å bekrefte disse ordene vil jeg sitere dataene som ble oppnådd ved måling av de praktiske parametrene til minnedelsystemet til et Nehalem-basert system i testverktøyet Everest 4.60.

Tabell 2. Testing av minnedrift

Faktisk, selv om den jobber i enkanalsmodus, er Nehalem-minnekontrolleren i stand til å vise bedre ytelse enn minnekontrolleren til dagens LGA775-plattformer. Dette er et helt naturlig resultat, siden det ikke er noen mellomliggende enheter på veien mellom prosessoren og minnet i nye generasjons systemer, mens brikkesettets nordbro tidligere var ansvarlig for arbeid med minne, som introduserte sine egne svært betydelige forsinkelser forårsaket av trenger å synkronisere minnebusser og FSB ... En annen indirekte fordel med minnet innebygd i prosessoren er at funksjonen nå ikke er avhengig av brikkesettet eller hovedkortet. Som et resultat vil Nehalem vise den samme minneytelsen på tvers av plattformer fra forskjellige utviklere og produsenter.

For noen måneder siden introduserte AMD en ny arkitektur som skal brukes i nye prosessorer fra og med 2011. Ny arkitektur bærer Bulldozer-navnet og er helt forskjellig fra den nåværende AMD64-arkitekturen som AMD har brukt siden 2003.

Bulldozer-arkitekturen vil arve noen av teknologiløsningene introdusert med AMD64-arkitekturen, for eksempel et integrert minne og busskontroller HyperTransport for kommunikasjon mellom prosessoren og brikkesettet.

Bulldoser Er et arkitekturkodenavn, ikke et spesifikt prosessornavn. Som vanligvis er tilfellet, vil den første utgivelsen av prosessorer være fokusert på servermarkedet, deretter en utgivelse for markedet for dyre høyytelsesdatamaskiner, deretter for mellomprissegmentet og på slutten for markedet på budsjettnivå. .

Selv om AMD ikke avslørte spesifikasjonene til de nye prosessorene, bemerket de at de første prosessorene for stasjonær datamaskin vil bli utført på den nye kontakten AM3 + som vil være kompatibel med eksisterende AM3-kontakt. Socket AM3 + vil imidlertid ikke være kompatibel med hovedkort for Socket AM3.

Bulldozer-arkitektur vil ha teknologi som ligner på Intel Turbo Boost for å automatisk overklokke prosessoren.
Før vi snakker om den interne arkitekturen til Bulldozer, la oss se på settet med instruksjoner som støttes av den nye arkitekturen.

Bulldozers arkitektur, i tillegg til å være kompatibel med x86-instruksjonsstandarden, vil støtte følgende ekstra sett bruksanvisning:

  • SSE4.1 og SSE4.2
  • AVX (Advanced Vector Extensions) med to tilleggsinstruksjoner XOP og FMA4
  • AES (Advanced Encryption Standard) - avansert krypteringsstandard
  • LWP (Light Weight Profiling)

SSE4.1 og SSE4.2

Endelig AMD-prosessorer vil støtte SSE4-instruksjonssettet. AMD-prosessorer støtter for øyeblikket ikke dette instruksjonssettet, noe som forbedrer ytelsen i multimedieapplikasjoner(for eksempel applikasjoner for bilde- og videobehandling). På dette øyeblikket Støtte for AMD-prosessorer eget sett instruksjoner kalt SSE4a, som ikke er det samme som SSE4.

AVX (Advanced Vector Extensions)

På en gang tilbød AMD å bruke det nye SSE5-instruksjonssettet. Derfor bestemte Intel seg for å lage sin egen implementering av det som ble kalt SSE5 og kalte denne instruksjonen - AVX (Advanced Vector Extensions). AMD bestemte seg for å legge til dette instruksjonssettet for Bulldozer-arkitekturen.

AVX-instruksjoner vil også bli støttet av nye Intel-prosessorer på Sandaktig arkitektur Bro.

Sett AVX-instruksjoner legger til 12 nye instruksjoner og øker størrelsen på XMM-registrene fra 128 biter til 256 biter.

I Bulldozer-arkitekturen bestemte AMD seg for å bruke noen av instruksjonene som ble foreslått for SSE5. Dermed er bruken av AVX i Bulldozer-arkitekturen mer komplett enn Intels. Disse tilleggsinstruksjoner kalles XOP og FMA4. AMD bemerket også at AVX har et undersett av FMAC-kommandoer (Fused Multiply Accumulate), men faktisk er det en del av XOP-instruksjonssettet.

AES (Advanced Encryption Standard)

Dette settet med kommandoer er allerede brukt i nye Intel-prosessorer, basert på "Westmere"-arkitekturen (unntatt Core i3), og består av seks nye instruksjoner knyttet til kryptering. Intel kaller dette instruksjonssettet AES-NI.

LWP (Light Weight Profiling)

LWP-instruksjoner vil forbedre ytelsen til multithreaded programvare jobber for flerkjerneprosessorer... LWP inkluderer seks nye instruksjoner.