SAN-brytere. Fast konfigurasjon Ethernet-svitsjer og modulære brytere. Intel lagringssystemer

SAN-brytere

SAN-svitsjer brukes som en sentral svitsjenhet for SAN-noder. Du setter den ene enden av den fiberoptiske kabelen inn i en kontakt på serveradapteren eller diskarraykontrolleren og den andre inn i en port på svitsjen. En svitsj kan sammenlignes med et sett med ledninger som er krysskoblet for å la hver enhet på nettverket "snakke" over en ledning til en hvilken som helst annen enhet på nettverket samtidig. Det vil si at med andre ord kan alle abonnenter snakke samtidig.
En eller flere brytere koblet sammen for å danne et stoff. Ett stoff kan bestå av en eller flere brytere (opptil 239 for øyeblikket). Derfor kan et stoff defineres som et nettverk av sammenkoblede brytere. Et SAN kan bestå av flere stoffer. De fleste SAN-er består av minst to stoffer, hvorav den ene er overflødig.
Du kan koble servere og lagring til SAN ved hjelp av én bryter, men det er god praksis å bruke to brytere for å unngå tap av data og nedetid hvis en av dem svikter. Figur 1 viser en typisk struktur som bruker to brytere for å koble servere til en diskarray.

Fig 1. Den enkleste fabrikken med 2 brytere.

Etter hvert som antall servere og lagring i SAN-en din øker, legger du ganske enkelt til brytere.

Figur 2. SAN Fabric Extension

Modulære brytere

SAN-svitsjer er tilgjengelige for enhver smak fra 8 til hundrevis av porter. De fleste modulære brytere kommer med 8 eller 16 porter. Den siste trenden er muligheten til å øke antall porter på en kjøpt svitsj med en økning på 4. Et typisk eksempel på en slik svitsj er Qlogic SANbox 5200 (fig. 3). Du kan kjøpe dette produktet med 8 porter i basen, og deretter utvide til 16 i én modul og opptil 64 porter (!) I fire moduler sammenkoblet med 10 Gigabit FC.

Fig 3. Qlogic SANbox 5200 - 64-ports fire-modulstabel

Direktør eller direktørbytter

Direktører er mye dyrere enn modulære brytere og inneholder vanligvis hundrevis av porter (figur 4). Regissører kan sees i sentrum av veldig store byttede tekstiler som kjernen i nettverket. Direktørene er usedvanlig robuste og vedlikeholder hele infrastrukturen 24 timer i døgnet, 7 dager i uken. De tillater rutinemessig vedlikehold og utskifting av moduler underveis.

Ris. 4. SilkWorm 1200 128 port og McData InterPid 6140

Direktøren består av en plattform, hot-swap-portmoduler (vanligvis 12 eller 16 porter), og hot-swap-prosessormoduler (vanligvis dual-prosessor). Direktøren kan kjøpes med 32 porter og kan utvides til 128 - 140 porter.
Bedrifts-SAN-er bruker vanligvis direktører som kjernen i nettverket. Modulære brytere er koblet til dem som terminal (kant) brytere. Til disse kobler på sin side servere og lagringer. Denne topologien kalles kjerne-til-kant-topologi og lar nettverket skalere til tusenvis av porter (Figur 5).

Ris. 5. Topologi kjerne-grense ved hjelp av regissører.


SAN-rutere eller multiprotokollsvitsjer

SAN-rutere brukes til å koble eksterne SAN-øyer til et enkelt nettverk for å løse problemene med beskyttelse mot katastrofer, konsolidere lagringsressurser, organisere sikkerhetskopieringsprosedyrer for data fra eksterne avdelinger til tape- og diskressurser til hoveddatasenteret, etc. ( Fig. 6). Konsolidering av eksterne SAN-er til én enkelt ressurs er neste trinn i utviklingen av lagringsnettverk etter introduksjonen av SAN-er i hovedstrukturen og divisjonene til bedriften (figur 7).

Ris. 6: McDATA Eclipse 1620, 3300 og 4300

Ris. Trinn 7: Konsolidering av eksterne SAN-er til én enkelt ressurs

SAN-øyer kan kobles til ved hjelp av FC-protokollen og konvensjonelle modulære brytere eller styrere, via enkeltmoduskabel (mørk fiber) eller ved bruk av multiplekseringsutstyr (DWDM). Denne metoden vil imidlertid ikke tillate deg å gå utenfor byen (radius 70 km.). For ytterligere fjerning trenger du Fibre Channel over IP (FCIP, http://www.iscsistorage.com/ipstorage.htm) implementert i McData's Eclipse-rutere (Figur 6). FCIP pakker hver FC-ramme inn i en IP-pakke for transport over IP-nettverket. Mottakersiden pakker ut IP-pakken og tar ut den originale FC-rammen derfra for videre overføring over FC-lokalnettverket. Avstandene er ubegrensede her. Alt handler om hastigheten til IP-kanalen din.

FC-kabeltyper

Fiberoptisk eller kobberkabel brukes som fysisk medium for dataoverføring i FC-nettverk. Kobberkabel er en tvunnet parkabel og ble hovedsakelig brukt til lokale tilkoblinger på FC 1Gbit/s-nettverk. I moderne FC 2Gbit/s-nettverk brukes hovedsakelig fiberoptisk kabel.
Det finnes to typer fiberoptiske kabler: enkeltmodus og multimodus.

Enkeltmoduskabel (langbølge)

I en enkeltmoduskabel (SM) er det bare én vei for en lysbølge å forplante seg. Kjernestørrelsen er vanligvis 8,3 mikron. Singlemode-kabler brukes i enheter der det kreves lavt signaltap (tap) og høye datahastigheter, for eksempel lange intervaller mellom to systemer eller nettverksenheter. For eksempel mellom en server og en lagring, hvor avstanden mellom disse er flere titalls kilometer.

Maksimal avstand mellom to noder i FC 2Gbit-nettverket koblet med en enkeltmoduskabel er 80 km uten repeatere.

Multimodus (kortbølge) kabel

Multimode (MM) kabel er i stand til å overføre flere lysbølger over en enkelt fiber fordi den relativt store kjernestørrelsen tillater lys å bevege seg i forskjellige vinkler (brytning). Typiske MM kjernestørrelser er 50 µm og 62,5 µm. Multimodus fiberforbindelser er best for kortdistanseenheter. Inne på kontoret, bygning.

Den maksimale avstanden en multimoduskabel støtter 2 Gbit/s er 300 (50um) og 150m (62,5 um).

Kabelkontakttyper

FC-kabelkontakter er:

Transceiver-typer (GBIC-typer)

Enheter for å konvertere lys til et elektrisk signal og omvendt kalles transceivere. De kalles også GBICs (Gigabit Interface Connectors). Transceiveren er plassert på FC-adapterkortet (FC HBA), vanligvis er den loddet inn i den, i bryteren - i form av en flyttbar modul (se fig.) Og på lagringsenheten i en eller annen form.

Transceivere er:


SFP-LC HSSDC2

Avtakbare sender/mottakermoduler (SFP)

HSSDC2: for 1 / 2Gbit FC for kobberkabel
SFP-LC: (Small Form Factor Pluggable LC) 1 / 2Gbit FC Kort / Langbølge for fiberoptisk kabel med LC-kontakt
SFP-SC: (Small Form Factor Pluggable SC) 1 / 2Gbit FC Kort / Langbølge for fiberoptisk kabel med SC-kontakt

Hvis du administrerer din egen infrastruktur i ditt eget datasenter, bør du gå gjennom et utvalg forskjellige lagringstilbud. Valget av oppbevaringsløsning avhenger i stor grad av ditt behov. Før du fullfører et spesifikt lagringsalternativ for brukssaken din, er det litt nyttig å forstå teknologien.

Jeg skulle egentlig skrive en artikkel om objektlagring (som er det mest aktuelle skylagringsalternativet). Men før jeg går og diskuterer denne delen av lagringsarenaen, tenkte jeg at det ville være bedre å diskutere de to hovedlagringsmetodene som har eksistert i svært lang tid som har blitt brukt av bedrifter innenlands for deres behov.

Avgjørelsen for lagringstypen din vil avhenge av mange faktorer, for eksempel de nedenfor.

  • Typen data du vil lagre
  • Bruksskjema
  • Skalering
  • Til slutt, budsjettet ditt

Når du starter din karriere som systemadministrator, hører du ofte kollegene dine snakke om forskjellige lagringsmetoder som SAN, NAS, DAS, etc. Og uten litt graving må du rote med ulike oppbevaringsforhold. Forvirring oppstår ofte på grunn av likhetene mellom ulike lagringstilnærminger. Den eneste raske og enkle tommelfingerregelen for å holde deg oppdatert med faguttrykk er å fortsette å lese (spesielt konseptene bak en bestemt teknologi).

I dag skal vi diskutere to forskjellige metoder som definerer lagringsstrukturen i ditt miljø. Ditt valg av de to i arkitekturen din bør bare avhenge av din brukstilfelle og typen data du lagrer.

På slutten av denne opplæringen håper jeg du har en klar forståelse av de to viktigste lagringsmetodene og hvilke du skal velge for dine behov.

SAN (lagringsområdenettverk) og NAS (nettverkstilkoblet lagring)

Nedenfor er de viktigste forskjellene mellom hver av disse teknologiene.

  • Hvordan lageret er koblet til systemet. Kort sagt, hvordan forbindelsen gjøres mellom tilgangssystemet og lagringskomponenten (direkte tilkoblet eller nettverk)
  • Type kabel som brukes for tilkoblingen. Kort sagt, det er en type kabel som brukes til å koble systemet til en lagringskomponent (som Ethernet og Fibre Channel)
  • Hvordan input- og outputforespørsler gjøres. Kort sagt, det er protokollen som brukes til å lage I/O-forespørsler (f.eks. SCSI, NFS, CIFS, etc.)

La oss diskutere SAN først, NAS andre, og til slutt, la oss sammenligne hver av disse teknologiene for å oppklare forskjellene mellom dem.

SAN (lagringsområdenettverk)

Dagens søknader er svært ressurskrevende på grunn av forespørsler som må behandles samtidig per sekund. Ta eksemplet med et e-handelsnettsted der tusenvis av mennesker legger inn bestillinger per sekund og alle må lagres riktig i en database for senere henting. Lagringsteknologien som brukes til å lagre slike høytrafikkdatabaser, må være raske for å betjene og svare på forespørsler (kort sagt, den må være rask inn og ut).

I slike tilfeller (når du trenger høy ytelse og rask I/O), kan vi bruke SAN.

Et SAN er ikke noe mer enn et høyhastighetsnettverk som oppretter forbindelser mellom lagringsenheter og servere.

Tradisjonelt har applikasjonsservere brukt sine egne lagringsenheter koblet til dem. Samtale med disse enhetene ved hjelp av en protokoll kjent som SCSI (Small Computer System Interface). SCSI er ikke noe mer enn en standard som brukes for kommunikasjon mellom servere og lagringsenheter. Alle vanlige harddisker, båndstasjoner, etc. Bruk SCSI. I begynnelsen ble serverens lagringskrav oppfylt av lagringsenhetene som var slått på inne på serveren (serveren som ble brukt til å snakke med denne interne lagringsenheten ved hjelp av SCSI. Dette er veldig likt hvordan et vanlig skrivebord snakker med sin interne harddisk .).

Enheter som CD-er kobles til serveren (som er en del av serveren) ved hjelp av SCSI. Hovedfordelen med SCSI for å koble enheter til en server var dens høye båndbredde. Selv om denne arkitekturen er tilstrekkelig for lave krav, er det flere begrensninger, for eksempel de nedenfor.

  • Serveren kan bare få tilgang til data på enheter som er direkte knyttet til den.
    Hvis noe skjer med serveren, vil datatilgangen mislykkes (fordi lagringsenheten er en del av serveren og er koblet til den ved hjelp av SCSI)
  • Begrens antall lagringsenheter som serveren har tilgang til. I tilfelle serveren trenger mer lagringsplass, vil det ikke være mer plass å koble til siden SCSI-bussen bare kan romme et begrenset antall enheter.
  • I tillegg må serveren som bruker SCSI-lagring være nær lagringsenheten (siden parallell SCSI, som er en vanlig implementering på de fleste datamaskiner og servere, har noen avstandsbegrensninger, kan den løpe opptil 25 meter).

Noen av disse begrensningene kan overvinnes med DAS (Directly Tied Store). Det smarte som brukes til å koble lagringen direkte til serveren kan være SCSI, Ethernet, Fiber, etc.). Lav kompleksitet, lave investeringer, enkel utrulling har ført til at DAS har blitt tatt i bruk av mange for normale krav. Løsningen var god selv fra et ytelsessynspunkt når den ble brukt med raskere medier som fiber.

Selv en ekstern USB-pinne koblet til serveren er også en DAS (konseptuelt er det en DAS siden den er direkte koblet til serverens USB-buss). Men USB-pinner brukes vanligvis ikke på grunn av begrensningen av USB-busshastigheten. Vanligvis brukes SAS-medier (daisy chain SCSI) for tunge og store DAS-lagringssystemer. Internt kan lagringsenheten bruke RAID (som vanligvis er tilfellet) eller noe for å gi lagringsvolumer til serverne. SAS-lagringsalternativer er for øyeblikket tilgjengelige på 6 Gbps.

Et eksempel på en DAS-lagringsenhet er MD1220 fra Dell.

På serveren vil DAS-lagringen se veldig ut som den opprinnelige lagringen eller den eksterne lagringen du har koblet til.

Mens DAS er bra for vanlige behov og gir god ytelse, er det begrensninger som antall servere som kan få tilgang til den. Oppbevar enheten, eller la oss si at DAS-en skal være i nærheten av serveren (i samme rack eller innenfor tillatt avstand fra mediet som brukes).

Uten tvil er Direct Attached Storage (DAS) raskere enn noen annen lagringsmetode. Dette skyldes det faktum at det ikke medfører noen overhead av dataoverføring over nettverket (all dataoverføring skjer på en dedikert forbindelse mellom serveren og lagringsenheten. I utgangspunktet er det seriekoblet SCSI eller SAS). På grunn av nylige forbedringer i fiber og andre hurtigbuffermekanismer, gir SAN også bedre DAS-lignende hastighet og overgår i noen tilfeller hastigheten fra DAS.

Før vi går inn i SAN, la oss forstå noen typer og metoder for medier som brukes til å koble til lagringsenheter (når jeg snakker om lagringsenheter, vennligst ikke tenk på det som én harddisk. Ta det som en rekke stasjoner, kanskje på et eller annet nivå av RAID (tenk på det som noe sånt som Dell MD1200).

Hva er SAS (Serial Attached SCSI), FC (Fiber Channel) og iSCSI (Internet Small Computer System Interface)?

Tradisjonelt er SCSI-enheter som en intern harddisk koblet til en felles parallell SCSI-buss. Dette betyr at alle tilkoblede enheter vil bruke samme buss til å sende/motta data. Men parallellkoblinger er ikke bra for høy presisjon og utgjør problemer for høyhastighetstransmisjoner. En seriell forbindelse mellom en enhet og en server kan imidlertid øke den totale datagjennomstrømningen. SAS mellom lagringsenheter og servere bruker en dedikert 300 MB / sek diskplass. Tenk på en SCSI-buss som har samme hastighet for alle tilkoblede enheter.

SAS bruker de samme SCSI-kommandoene til å sende og motta data fra enheten. Ikke anta at SCSI bare brukes til intern lagring. Den brukes også til å koble en ekstern lagringsenhet til serveren.

Hvis dataoverføringsytelse og pålitelighet er valgene, er bruk av SAS den beste løsningen. Når det gjelder pålitelighet og feilrate, er SAS-stasjoner mye bedre enn eldre SATA-stasjoner. SAS ble designet med ytelsen i tankene som gjør den full dupleks. Dette betyr at data kan sendes og mottas samtidig fra en enhet som bruker SAS. En SAS-vertsport kan også kobles til flere SAS-stasjoner ved hjelp av utvidere. SAS bruker punkt-til-punkt kommunikasjon ved bruk av seriell kommunikasjon mellom enheter (lagringsenheter som diskstasjoner og diskarrayer) og verter.

Den første generasjonen av SAS ga 3Gb/s hastighet. Andre generasjon SAS forbedret dette til 6 Gbps. Og tredje generasjon (som for tiden brukes av mange organisasjoner for ekstremt høy båndbredde) har forbedret dette til 12 Gbps.

Fiberkanalprotokoll

Fibre Channel er en relativt ny sammenkoblingsteknologi som brukes til å overføre data raskt. Hovedformålet med designet er å gi dataoverføring ved høyere hastigheter med svært lav / ubetydelig ventetid. Den kan brukes til å koble til arbeidsstasjoner, periferiutstyr, lagringsarrayer, etc.

Hovedfaktoren som skiller en fiberoptisk kobling fra en annen tilkoblingsmetode er at den kan administrere både nettverks- og I/O-kommunikasjon over samme kobling ved å bruke de samme adapterne.

ANSI (American National Standards Institute) standardiserte fiberkanalen i løpet av 1988. Når vi sier Fiber (i Fiber-kanal) tror ikke det bare støtter optisk fibermedium. Fiber er et begrep som brukes for alle medier som brukes for en fiberlink-protokollforbindelse. Du kan til og med bruke kobbertråd for en lavere kostnad.

Merk at ANSI-fiberstandarden støtter nettverk, lagring og overføring. Fiberkanalen vet ikke hvilken type data du overfører. Den kan sende SCSI-kommandoer innkapslet i en fiberramme (den har ikke egne I/O-kommandoer for sending og mottak av minne). Hovedfordelen er at den kan inkludere mye brukte protokoller som SCSI og IP internt.

Komponentene til en fiberkanalskjøt er listet opp nedenfor. Kravet nedenfor er minimum for å oppnå en enkeltpunkttilkobling. Vanligvis kan dette brukes for en direkte forbindelse mellom lagringsarrayet og verten.

  • HBA (Main Bus Adapter) med fiberkanal
  • Driver for HBA-kort
  • HBA fiberkanalkabler

Som nevnt tidligere er SCSI-protokollen innkapslet i en fiberkanal. Derfor må vanligvis SCSI-dataene endres i et annet format som fiberen kan levere til destinasjonen. Og når mottakeren mottar dataene, overfører den dem til SCSI.

Du tenker kanskje hvorfor vi trenger denne kartleggingen og omfordelingen, hvorfor vi ikke kan bruke SCSI direkte til å levere data. Dette er fordi SCSI ikke kan levere data over lange avstander til et stort antall enheter (eller et stort antall verter).

Fiberkanalen kan brukes til å koble systemer opp til 10 km (hvis de brukes med optiske fibre kan du øke denne avstanden ved å ha repeatere mellom dem). Og du kan også overføre 30m data ved hjelp av kobbertråd for å redusere kostnadene i fiberkanalen.

Med bruken av fibersvitsjer fra mange store leverandører, har det blitt en enkel oppgave å koble til et stort antall lagringsenheter og servere (forutsatt at du har investeringsbudsjettet). Nettverksevnen til fiber har ført til avansert bruk av SAN (Storage Area Networks) for rask, langvarig og pålitelig datatilgang. Det meste av datamiljøet (som krever rask overføring av store datamengder) bruker en fiber SAN-kobling med fiberoptiske kabler.

Den nåværende fiberlinkstandarden (kalt 16GFC) kan overføre data med 1600MB/s (husk at denne standarden ble utgitt i 2011). De kommende standardene forventes å gi hastigheter på 3200 MB/s og 6400 MB/s de neste årene.

ISCSI (Small Computer Interface)

iSCSI er ikke annet enn en IP-basert standard for tilkobling av arrays og lagringsnoder. Den brukes til å overføre SCSI-trafikk over IP-nettverk. Dette er den enkleste og billigste løsningen (men ikke den beste) for å koble til en lagringsenhet.

Det er en flott teknologi for stedsuavhengig lagring. Fordi den kan koble til lagringsenheten ved hjelp av lokale nettverk, wide area network. Det er en standard for lagringsnettverk. Det krever ikke spesielle kabler og utstyr, som for et nettverk av fiberkanaler.

For et system som bruker en iSCSI-lagringsgruppe, vises lagringen som en lokalt tilkoblet stasjon. Denne teknologien kom etter fiberkanalen og ble bredt tatt i bruk på grunn av dens lave pris.

Det er en nettverksprotokoll som kjører over TCP/IP. Du kan gjette at dette ikke er særlig god ytelse sammenlignet med fiberoptikk (rett og slett fordi alt fungerer over TCP uten spesiell maskinvare eller endringer i arkitekturen din).

iSCSI introduserer en liten CPU-belastning på serveren fordi serveren må gjøre ytterligere behandling for alle lagringsforespørsler over nettverket ved bruk av vanlig TCP.

iSCSI har følgende ulemper sammenlignet med fiberoptikk

  • iSCSI introduserer litt mer ventetid over fiber på grunn av IP-header-overhead
  • Databaseapplikasjoner har små lese- og skriveoperasjoner som, når de gjøres på iSCSI,
    iSCSI, når det kjøres på samme LAN som inneholder annen vanlig trafikk (annen infrastrukturtrafikk enn iSCSI), vil resultere i lese-/skriveforsinkelse eller dårlig ytelse.
  • Maksimal hastighet / båndbredde er begrenset av hastigheten på Ethernet og nettverket ditt. Selv om du kombinerer flere lenker, skalerer den ikke til fiberlenken.

NAS (Network Attached Storage)

Den enkleste definisjonen av en NAS er "Enhver server som har egen lagring med andre på nettverket og fungerer som en filserver, er den enkleste formen for NAS."

Vær oppmerksom på at Network Attached Storage deler filer over nettverket. Ikke en nettverkslagringsenhet.

NAS-en vil bruke en Ethernet-tilkobling for å dele filer over nettverket. NAS-enheten vil ha en IP-adresse og vil da være tilgjengelig over nettverket via den IP-adressen. Når du får tilgang til filer på en filserver på Windows-systemet ditt, er det i utgangspunktet en NAS.

Hovedforskjellen er hvordan datamaskinen eller serveren din håndterer spesifikk lagring. Hvis datamaskinen ser på lagringen som en del av seg selv (i likhet med hvordan du kobler en DAS til serveren din), med andre ord, hvis serverprosessoren er ansvarlig for å administrere den tilknyttede lagringen, vil det være en slags DAS. Og hvis en datamaskin/server behandler lagringen vedlagt som en annen datamaskin som deler dataene sine over nettverket, så er det en NAS.

Direct Attached Storage (DAS) kan betraktes som et hvilket som helst annet perifert utstyr som et musetastatur osv. Siden serveren/datamaskinen er en direkte lagringsenhet. Imidlertid er NAS bare en annen server eller si at maskinvare har sine egne datafunksjoner som kan dele sin egen lagring med andre.

Til og med SAN-lagring kan også sees på som maskinvare som har sin egen prosessorkraft. Dermed er hovedforskjellen mellom NAS, SAN og DAS hvordan serveren/datamaskinen ser det. DAS-lagringsenheten vises på serveren som en del av seg selv. Serveren ser det som sin fysiske del. Selv om DAS ikke kan ligge inne på serveren (vanligvis en annen enhet med sin egen lagringsgruppe), ser serveren den som sin egen interne (DAS vises på serveren som sin egen interne lagring)

Når vi snakker om NAS, må vi kalle dem aksjer, ikke lagringsenheter. Fordi NAS-en vises på serveren som en delt mappe i stedet for en delt enhet over nettverket. Ikke glem at NAS-enheter er datamaskiner i seg selv som kan dele lagringen med andre. Når du deler en mappe med tilgangskontroll ved hjelp av SAMBA, er dens NAS.

NAS er imidlertid et billigere alternativ for dine lagringsbehov. Dette er virkelig upassende for applikasjoner på bedriftsnivå med høy ytelse. Tenk aldri på å bruke databaselagring (som bør ha høy ytelse) med en NAS. Den største ulempen med å bruke en NAS er ytelsesproblemer og nettverksavhengighet (i de fleste tilfeller brukes LAN, som brukes til normal trafikk, også til å dele lagring med NAS, noe som gjør den mer overbelastet).

Når man i fellesskap eksporterer NFS over nettverket, er det også en form for NAS.

En NAS er ikke noe mer enn en enhet/utstyr/server koblet til et TCP/IP-nettverk som har egen lagring med andre. Hvis du graver litt dypere, når en lese-/skriveforespørsel for filer sendes til en NAS-share koblet til serveren, sendes forespørselen som et CIFS (Internet Shared File System) eller NFS (Network File System) nettverk. Mottakssiden (NAS-enheten) når den mottar en NFS-forespørsel, oversetter CIFS den til et sett med lokale lagrings-I/O-kommandoer. Det er av denne grunn at en NAS-enhet har sin egen prosessorkraft.

Så NAS er lagring på filnivå (siden det i utgangspunktet er en fildelingsteknologi). Dette er fordi det skjuler selve filsystemet under panseret. Dette gir brukere et grensesnitt for å få tilgang til det delte minnet ved hjelp av NFS eller CIFS.

En vanlig NAS-bruk du kan finne er å gi hver bruker en hjemmekatalog. Disse hjemmekatalogene lagres på NAS-enheten og monteres på datamaskinen der brukeren logger på. Siden hjemmekatalogen er tilgjengelig på nettverket, kan brukeren logge på fra hvilken som helst datamaskin på nettverket.

NAS-fordeler

  • NAS har en mindre kompleks arkitektur sammenlignet med SAN
  • Det er billigere å distribuere det i en eksisterende arkitektur.
  • Ingen endringer er nødvendig i arkitekturen din, da vanlig TCP/IP-nettverk er det eneste kravet

Ulemper med NAS

  • NAS er treg
  • Lav båndbredde og høy latens, så den kan ikke brukes til høyytelsesapplikasjoner

Gå tilbake til SAN

La oss nå gå tilbake til diskusjonen om SAN (Storage Area Networks) som vi startet tidligere i begynnelsen.

Den første og viktigste utfordringen for å forstå SAN (i tillegg til det vi allerede diskuterte i begynnelsen) er det faktum at det er en lagringsløsning på blokknivå. Og SAN er optimalisert for dataoverføring på blokknivå med høyt volum. SAN fungerer best når det brukes med et fiberlink-miljø (optiske fibre og fiberlink-svitsj).

Navnet "SAN" antyder at lagringen er plassert på sitt eget dedikerte nettverk. Verter kan koble lagringsenheten til seg selv ved hjelp av enten Fiber Channel, TCP / IP (SAN bruker iSCSI når den brukes over tcp / ip-nettverk).

SAN kan sees på som en teknologi som kombinerer de beste egenskapene til både DAS og NAS. Hvis du husker, vises DAS på datamaskinen som sin egen lagringsenhet og er velkjent, DAS er også en lagringsløsning på blokknivå (hvis du husker, vi snakket aldri om CIFS eller NFS under DAS). NAS er kjent for sin fleksibilitet, grunnleggende nettverkstilgang, tilgangskontroll og mer. SAN kombinerer det beste fra to verdener fordi ...

  • SAN-lagring vises også på serveren som sin egen lagringsenhet
  • Dens lagringsløsning på blokknivå
  • God ytelse/hastighet
  • Nettverksfunksjoner ved hjelp av iSCSI

SAN og NAS er ikke konkurrerende teknologier, men er designet for ulike behov og oppgaver. Siden SAN er en lagringsløsning på blokknivå, er den best egnet for høyytelseslagring, e-postlagring mm De fleste moderne SAN-løsninger gir diskspeiling, arkiveringssikkerhetskopiering og replikeringsfunksjoner.

Et SAN er et dedikert lagringsnettverk (kan inkludere båndstasjoner, RAID-arrayer osv.) som jobber sammen for å gi overlegen lagring på blokknivå. Mens en NAS er en enkelt enhet / server / dataenhet, bruker den sin egen lagring over nettverket.

De viktigste forskjellene mellom SAN og NAS

SAN NAS
Datatilgang på blokknivå Tilgang til data på filnivå
Fibre Channel er det primære mediet som brukes med SAN-er. Ethernet er det primære mediet som brukes med NAS
SCSI er den viktigste I/O-protokollen NFS / CIFS brukes som hoved I/O-protokoll i NAS
SAN-lagring vises på datamaskinen som sin egen lagring Laste ned NAS som en delt mappe til en datamaskin
Den kan ha utmerket hastighet og ytelse når den brukes med lysledere Dette kan noen ganger forringe ytelsen hvis nettverket brukes til andre ting også (som vanligvis er tilfellet)
Brukes hovedsakelig for å lagre data på et høyere ytelsesnivå Brukes til små lesninger og skrivinger over lange avstander

I bransjen for å lære sto SAN overfor en viss hindring - utilgjengelighet av grunnleggende informasjon. Når det gjelder å studere andre infrastrukturprodukter som jeg har kommet over, er det enklere - det er prøveversjoner av programvaren, muligheten til å installere dem på en virtuell maskin, det er en haug med lærebøker, referanseguider og blogger om emnet . Cisco og Microsoft nagler svært høykvalitets lærebøker, MS, i tillegg, i det minste kjemmet sitt helvetes loftskap kalt technet, selv det er en bok om VMware, om enn en (og til og med på russisk!), Og med en effektivitet på ca 100 %. Allerede på selve lagringsenhetene kan du få informasjon fra seminarer, markedsføringsarrangementer og dokumenter, fora. På lagernettet er det stille og de døde står med fletter. Jeg fant to lærebøker, men turte ikke kjøpe. Dette er «Storage Area Networks For Dummies» (det finnes slike, viser det seg. Veldig nysgjerrige engelsktalende «dummies» i målgruppen, tilsynelatende) for halvannet tusen rubler og «Distributed Storage Networks: Architecture, Protocols and Management" - ser mer pålitelig ut, men 8200r med 40% rabatt. Sammen med denne boken anbefaler Ozon også boken The Art of Brickwork.

Jeg vet ikke hva jeg skal gi råd til en person som bestemmer seg for å studere i det minste teorien om å organisere et lagringsnettverk fra bunnen av. Som praksis har vist, kan selv dyre kurs gi null effekt. Folk i forhold til SAN er delt inn i tre kategorier: de som ikke vet hva det er i det hele tatt, som vet at et slikt fenomen ganske enkelt er der, og de som ser på spørsmålet "hvorfor gjør to eller flere fabrikker i et lagringsnettverk" " se med en slik forvirring, som om de ble spurt noe sånt som "hvorfor trenger en firkant fire hjørner?"

Jeg skal prøve å fylle ut gapet som jeg manglet - å beskrive basen og beskrive den enkelt. Jeg vil vurdere et SAN basert på dens klassiske protokoll - Fibre Channel.

Så SAN - Lagringsnettverk- designet for å konsolidere diskplassen til servere på spesielt dedikerte disklagringer. Poenget er at på denne måten brukes diskressurser mer økonomisk, er lettere å administrere og har bedre ytelse. Og i spørsmål om virtualisering og klynging, når flere servere trenger tilgang til samme diskplass, er slike lagringssystemer generelt uerstattelige.

Forresten, i SAN-terminologien, takket være oversettelsen til russisk, er det noe forvirring. SAN i oversettelse betyr "lagringsområdenettverk" - lagringssystem. Men klassisk i Russland forstås lagring som begrepet "datalagringssystem", det vil si at det er diskarrayen ( Lagringsarray), som igjen består av en kontrollblokk ( Lagringsprosessor, Lagringskontroller) og diskhyller ( Diskkabinett). Imidlertid er Storage Array i originalen bare en del av SAN, selv om noen ganger er den mest betydningsfulle. I Russland får vi at lagringssystemet (datalagringssystem) er en del av lagringssystemet (lagringsområdenettverk). Derfor kalles lagringsenheter vanligvis lagringssystemer, og lagringsnettverket - SAN (og forveksles med "Sun", men dette er bagateller).

Komponenter og vilkår

Teknologisk består SAN av følgende komponenter:
1. Noder, noder
  • Diskmatriser (datalagringssystemer) - lagringer (mål)
  • Servere er forbrukere av diskressurser (initiatorer).
2. Nettverksinfrastruktur
  • Svitsjer (og rutere i komplekse og distribuerte systemer)
  • Kabler

Egenskaper

Uten å gå i detaljer, ligner FC-protokollen Ethernet-protokollen med WWN-adresser i stedet for MAC-adresser. Bare, i stedet for to lag, har Ethernet fem (hvorav det fjerde ennå ikke er definert, og det femte er kartleggingen mellom FC-transporten og høynivåprotokollene som overføres over denne FC - SCSI-3, IP) . I tillegg bruker FC-svitsjer spesialiserte tjenester, hvis analoger for IP-nettverk vanligvis er plassert på servere. For eksempel: Domain Address Manager (ansvarlig for å tildele domene-ID til svitsjer), Name Server (lagrer informasjon om tilkoblede enheter, en slags WINS-analog inne i svitsjen), etc.

For et SAN er nøkkelparametrene ikke bare ytelse, men også pålitelighet. Tross alt, hvis databaseserveren mister nettverket i et par sekunder (eller til og med minutter) - vel, det vil være ubehagelig, men du kan overleve. Og hvis harddisken med basen eller operativsystemet faller av samtidig, vil effekten være mye mer alvorlig. Derfor er alle SAN-komponenter vanligvis duplisert - porter i lagringsenheter og servere, svitsjer, koblinger mellom svitsjer og, en nøkkelfunksjon i et SAN, sammenlignet med LAN, er duplisering på nivået av hele infrastrukturen til nettverksenheter - fabrikker.

Fabrikk (stoff- som generelt er oversatt fra engelsk som stoff, fordi begrepet symboliserer en sammenflettet ordning for tilkobling av nettverk og terminalenheter, men begrepet har allerede blitt etablert) - et sett med brytere koblet sammen med inter-switch-lenker ( ISL - InterSwitch Link).

SAN-er med høy tilgjengelighet inkluderer nødvendigvis to (og noen ganger flere) stoffer, siden stoffet i seg selv er et enkelt feilpunkt. De som minst en gang har observert konsekvensene av en ring i nettverket eller en fingernem bevegelse av tastaturet, introduserer en bryter på kjernenivå eller distribusjon i koma med en mislykket firmware eller kommando, forstår hva dette handler om.

Fabrikker kan ha samme (speilvendt) topologi eller være forskjellige. For eksempel kan en fabrikk bestå av fire brytere, og en annen av én, og kun svært kritiske noder kan kobles til den.

Topologi

Det finnes følgende typer fabrikktopologier:

Cascade- brytere er koblet i serie. Hvis det er mer enn to av dem, er det upålitelig og uproduktivt.

Ringe- lukket kaskade. Det er mer pålitelig enn bare en kaskade, men med et stort antall deltakere (mer enn 4), vil ytelsen lide. Og en enkelt feil på ISL eller en av bryterne gjør kretsen til en kaskade med alt det innebærer.

Mesh). Det skjer Full Mesh- når hver bryter kobles til hver. Den er preget av høy pålitelighet, ytelse og pris. Antall porter som kreves for inter-switch-koblinger vokser eksponentielt med hver ny svitsj som legges til kretsen. Med en viss konfigurasjon vil det ganske enkelt ikke være noen porter igjen for noder - alle vil være opptatt med ISL. Delvis mesh- enhver kaotisk sammenslåing av brytere.

Senter / Periferiutstyr (kjerne / kant)- nær den klassiske LAN-topologien, men uten distribusjonslag. Det er ikke uvanlig at lagring kobles til Core-svitsjer, og servere til Edge. Selv om et ekstra lag (lag) av Edge-svitsjer kan tildeles for lagring. Lagring og servere kan også kobles til én svitsj for å forbedre ytelsen og redusere responstiden (dette kalles lokalisering). Denne topologien er preget av god skalerbarhet og håndterbarhet.

Soneinndeling (soneinndeling, soneinndeling)

En annen teknologi som er spesifikk for SAN. Dette er definisjonen av initiator-mål-par. Det vil si hvilke servere som kan få tilgang til hvilke diskressurser, slik at det ikke skjer at alle servere ser alle mulige disker. Dette oppnås som følger:
  • de valgte parene legges til sonene som tidligere er opprettet på bryteren;
  • soner er plassert i sonesett (sonesett, sonekonfigurasjon) opprettet på samme sted;
  • sonesett er aktivert fra fabrikk.

For et første innlegg om SAN tror jeg det er nok. Jeg beklager de varierte bildene - det er ingen måte å tegne meg selv på på jobb, men det er ikke tid hjemme. Jeg hadde ideen om å tegne på papir og fotografere, men bestemte meg for at det var bedre på denne måten.

Til slutt, som et etterskrift, vil jeg liste opp grunnleggende designretningslinjer for et SAN-stoff.

  • Design strukturen slik at det ikke er mer enn tre brytere mellom to endeenheter.
  • Det er ønskelig at en fabrikk ikke består av mer enn 31 brytere.
  • Det er verdt å angi domene-ID manuelt før du legger til en ny svitsj i stoffet - det forbedrer håndterbarheten og bidrar til å unngå problemer med samme domene-ID, i tilfeller for eksempel ved å koble til en svitsj fra ett stoff til et annet.
  • Ha flere like ruter mellom hver lagringsenhet og initiativtakeren.
  • I tilfeller med udefinerte ytelseskrav, vurder forholdet mellom antall Nx-porter (for sluttenheter) og antall ISL-porter som 6: 1 (EMC-anbefaling) eller 7: 1 (Brocade-anbefaling). Dette forholdet kalles overtegning.
  • Soneanbefalinger:
    - bruk informative navn på soner og sonesett;
    - bruk WWPN-soning, ikke portbasert (basert på enhetsadresser, ikke fysiske porter til en bestemt svitsj);
    - hver sone er én initiativtaker;
    - rengjør fabrikken fra "døde" soner.
  • Ha en reserve av ledige porter og kabler.
  • Ha en reserve av utstyr (brytere). På anleggsnivå - påkrevd, eventuelt på fabrikknivå.

Vurder noen topologier for lagringsnettverk

Et enkeltbryterstoff består av én Fibre Channel-svitsj, server og lagringssystem. Vanligvis er denne topologien grunnlaget for alle standardløsninger - andre topologier lages ved å kombinere enkeltbryterceller.


Ris. 1.4.

En kaskadestruktur er et sett med celler hvis brytere er koblet til et tre ved hjelp av inter-switchforbindelser.


Ris. 1.5.

Et gitter er et sett med celler, bryteren til hver av dem er koblet til alle de andre. Hvis en (og i en rekke kombinasjoner - og flere) tilkobling svikter, brytes ikke nettverkstilkoblingen. Ulempe - høy redundans av forbindelser


Ris. 1.6.

Ringen gjentar praktisk talt gittertopologiskjemaet. Fordelene inkluderer færre tilkoblinger.


Ris. 1.7.

Konsolidering av IT-infrastruktur

Konsolidering er konsolidering av dataressurser eller styringsstrukturer i et enkelt senter.

Analyse av internasjonal erfaring lar oss i dag snakke om en klar trend mot konsolidering av IT-ressurser til selskaper. Det er hun som klarer å redusere IT-kostnadene betydelig. De oppsparte midlene kan brukes til å forbedre kvaliteten på eksisterende informasjonstjenester og introdusere nye. I tillegg til å optimalisere IT-kostnadene, kan konsolidering av IT-ressurser forbedre administrasjonen til bedrifter gjennom mer oppdatert og fullstendig informasjon om deres operasjoner. Vanligvis snakker de om konsolidering:

  • servere- flytte desentraliserte applikasjoner distribuert på forskjellige servere i selskapet til en klynge av sentraliserte homogene servere;
  • lagringssystemer- felles bruk av et sentralisert datalagringssystem av flere heterogene noder;
  • applikasjoner- vert for flere applikasjoner på en vert.

Samtidig kan to grunnleggende typer konsolidering skilles - fysisk og logisk. Fysisk konsolidering betyr geografisk flytting av servere til et enkelt sted (datasenter), og logisk konsolidering betyr sentralisering av ledelsen.

Flytting av datamaskiner til et enkelt datasenter gir komfortable forhold for utstyr og teknisk personell, samt øker nivået av fysisk beskyttelse av servere. I tillegg kan datasenteret bruke maskinvare med høyere ytelse og høyere kvalitet som ikke er kostnadseffektivt å installere i alle avdelinger. Ved å bygge datasentre kan du redusere kostnadene ved å vedlikeholde og administrere de mest kritiske serverne i bedriften din. Bladsystemer, så vel som lagringssystemer og nettverk, er et godt eksempel på utstyr som med hell kan løse problemet med å konsolidere dataressurser i organisasjoner på alle nivåer.

Den åpenbare fordelen med denne løsningen er at den forenkler tilbudet av støttepersonell og deres arbeid med å distribuere og administrere systemer, og reduserer graden av duplisering av erfarent personell. Sentralisering gjør det også enklere å bruke standardiserte konfigurasjoner og administrasjonsprosesser, lage kostnadseffektive sikkerhetskopieringssystemer for katastrofegjenoppretting og vedlikeholde forretningsforbindelser. Løsningen på problemene med å organisere høykvalitetskontroll over miljøtilstanden og sikre fysisk beskyttelse er også forenklet. Nettverkssikkerheten kan også forbedres ettersom serverne er beskyttet av en enkelt, sentralt administrert brannmur.

Den logiske typen konsolidering innebærer restrukturering av IT-infrastrukturstyringssystemet. Dette er nødvendig både for å øke skalerbarheten og håndterbarheten til et komplekst distribuert datasystem og for å forene bedriftsnettverkssegmenter. Logisk konsolidering muliggjør sentralisert styring og forening av arbeid med bedriftsressurser basert på åpne standarder. Som et resultat blir det mulig å lage globale informasjonstjenester for bedriften - LDAP-katalog, bedriftsportal eller ERP-system, som til slutt vil forbedre administrasjonen til bedriften på grunn av mer relevant og fullstendig informasjon om dens funksjon.

Logisk konsolidering av applikasjoner sentraliserer administrasjonen av forretningskritiske systemer og applikasjoner. Fordelene med logisk konsolidering er åpenbare: For det første er det frigjøring av maskinvareressurser som kan brukes i andre deler av informasjonssystemet. For det andre gjør en enklere og mer logisk struktur for IT-infrastrukturstyring den mer fleksibel og tilpasningsdyktig til fremtidige endringer.

Det homogene konsolideringsscenarioet innebærer å flytte en storskalaapplikasjon, som tidligere kjørte på flere servere, til en kraftigere (figur 1.8). Et eksempel på en slik operasjon er databaser, som ofte utvides mye etter hvert som mengden informasjon som behandles vokser. Konsolidering av data og applikasjoner på en enkelt server øker betydelig hastighet på prosessering og gjenfinning, samt øker integritetsnivået.

Heterogen konsolidering ligner i innhold på homogen, men i dette tilfellet er forskjellige applikasjoner gjenstand for forening. For eksempel kan flere forekomster av Exchange Server og SQL Server som tidligere ble kjørt på separate datamaskiner, konsolideres på en enkelt maskin. Fordelene med heterogen konsolidering er økt tjenesteskalerbarhet og bedre utnyttelse av systemressurser.


Ris. 1.8.

Som bemerket av eksperter på skyteknologier - er konsolidering av IT-infrastruktur - det første skrittet mot "skyen". For å flytte til skyen, må bedrifter først ta tak i utfordringene med en ukonsolidert IT-infrastruktur. "Uten konsolidering er det umulig å bygge effektiv prosessorientert ledelse, siden det ikke er et enkelt punkt for tjenestelevering."

Ved å analysere historien til utviklingen av informasjonsteknologi og nåværende trender, kan vi konkludere med at den evolusjonære IT-runden, som begynte med stormaskinens æra for mer enn femti år siden, har avsluttet - sammen med skyene kom vi tilbake til sentraliseringen av ressurser, men denne gangen ikke på nivå med stormaskiner med sine grønne terminaler, men på et nytt teknologisk nivå.

På en konferanse om problemene med moderne prosessorer sa professor ved Massachusetts Institute of Technology Anand Agarwal: "En prosessor er en transistor av vår tid." Det nye nivået skiller seg ved at stormaskiner også er satt sammen her, men virtuelle, og ikke fra individuelle transistorer, som for et halvt århundre siden, men fra hele prosessorer eller helt fra datamaskiner. I begynnelsen av IT "skulpturerte" mange selskaper og organisasjoner sine egne datamaskiner fra diskrete komponenter, monterte dem på selvlagde kretskort - hver organisasjon laget sin egen maskin, og det var ikke snakk om noen standardisering eller forening. Og nå, på terskelen til det andre tiåret av det 21. århundre, gjentar situasjonen seg - på samme måte samles eksterne og private skyer fra bladservere, datamaskiner og diverse nettverksutstyr. Samtidig er det samme teknologiske splittelse og mangel på forening: Microsoft, Google, IBM, Aptana, Heroku, Rackspace, Ning, Salesforce bygger globale stormaskiner, og noen lager private skyer for sine egne behov, som er de samme stormaskiner, men i mindre skala. ... Det gjenstår å anta at oppfinnelsen av den integrerte kretsen og mikroprosessoren ligger foran.