SAN-omkopplare. Fast konfiguration Ethernet-switchar och modulära switchar. Intels lagringssystem

SAN-omkopplare

SAN-switchar används som en central kopplingsenhet för SAN-noder. Du sätter in ena änden av den fiberoptiska kabeln i en kontakt på din serveradapter eller diskarraykontroller och den andra i en port på switchen. En switch kan jämföras med en uppsättning ledningar som är tvärbundna för att låta varje enhet i nätverket "prata" över en tråd med vilken annan enhet som helst i nätverket samtidigt. Det vill säga, med andra ord kan alla abonnenter prata samtidigt.
En eller flera omkopplare sammankopplade för att bilda ett tyg. Ett tyg kan bestå av en eller flera switchar (upp till 239 för närvarande). Därför kan en struktur definieras som ett nätverk av sammankopplade switchar. Ett SAN kan bestå av flera tyger. De flesta SAN består av minst två tyger, varav en är redundant.
Du kan ansluta servrar och lagring till SAN med en switch, men det är bra att använda två switchar för att undvika dataförlust och driftstopp om en av dem misslyckas. Figur 1 visar en typisk struktur som använder två switchar för att ansluta servrar till en diskarray.

Fig 1. Den enklaste fabriken med 2 brytare.

När antalet servrar och lagring i ditt SAN ökar lägger du helt enkelt till switchar.

Figur 2. SAN-tygförlängning

Modulära brytare

SAN-switchar finns för alla smaker från 8 till hundratals portar. De flesta modulära switchar kommer med 8 eller 16 portar. Den senaste trenden är möjligheten att öka antalet portar på en köpt switch med ett steg om 4. Ett typiskt exempel på en sådan switch är Qlogic SANbox 5200 (Fig. 3). Du kan köpa den här produkten med 8 portar i basen och sedan utöka till 16 i en modul och upp till 64 portar (!) I fyra moduler sammankopplade med 10 Gigabit FC.

Fig 3. Qlogic SANbox 5200 - 64-portars fyra-modulstack

Direktör eller regissörsbyten

Direktörer är mycket dyrare än modulära switchar och innehåller vanligtvis hundratals portar (Figur 4). Regissörer kan ses mitt i mycket stora switchade tyger som kärnan i nätverket. Direktörerna är exceptionellt tåliga och underhåller hela infrastrukturen 24 timmar om dygnet, 7 dagar i veckan. De möjliggör rutinunderhåll och utbyte av moduler i farten.

Ris. 4. SilkWorm 1200 128 port och McData InterPid 6140

Direktören består av en plattform, hot-swap-portmoduler (vanligtvis 12 eller 16 portar) och hot-swap-processormoduler (vanligtvis dubbelprocessor). Direktören kan köpas med 32 portar och kan utökas upp till 128 - 140 portar.
Företags-SAN använder vanligtvis direktörer som kärnan i nätverket. Modulära omkopplare är anslutna till dem som terminal (kant) switchar. Till dessa ansluter i sin tur servrar och lagringar. Denna topologi kallas kärna-till-kant-topologi och gör att nätverket kan skalas till tusentals portar (Figur 5).

Ris. 5. Topologi kärna-gräns med hjälp av direktörer.


SAN-routrar eller multiprotokollswitchar

SAN-routrar används för att ansluta avlägsna SAN-öar till ett enda nätverk för att lösa problemen med skydd mot katastrofer, konsolidera lagringsresurser, organisera säkerhetskopieringsprocedurer för data från fjärravdelningar till band- och diskresurser i huvuddatacentret, etc. ( Fig. 6). Att konsolidera fjärranslutna SAN till en enda resurs är nästa steg i utvecklingen av lagringsnätverk efter införandet av SAN i företagets huvudstruktur och divisioner (Figur 7).

Ris. 6: McDATA Eclipse 1620, 3300 och 4300

Ris. Steg 7: Konsolidera fjärranslutna SAN till en enda resurs

SAN-öar kan anslutas med FC-protokoll och vanliga modulära switchar eller direktörer, via singelmodskabel (mörk fiber) eller med multiplexeringsutrustning (DWDM). Den här metoden tillåter dig dock inte att gå utanför staden (radie 70 km.). För ytterligare borttagning behöver du Fibre Channel over IP (FCIP, http://www.iscsistorage.com/ipstorage.htm) implementerad i McData's Eclipse-routrar (Figur 6). FCIP lindar varje FC-ram i ett IP-paket för transport över IP-nätverket. Den mottagande sidan packar upp IP-paketet och tar ut den ursprungliga FC-ramen därifrån för vidare överföring över det lokala FC-nätverket. Avstånden är obegränsade här. Allt handlar om hastigheten på din IP-kanal.

FC-kabeltyper

Fiberoptisk eller kopparkabel används som ett fysiskt medium för dataöverföring i FC-nätverk. Kopparkabel är en mantlad partvinnad kabel och användes främst för lokala anslutningar på FC 1Gbit/s-nätverk. I moderna FC 2Gbit/s-nätverk används främst fiberoptisk kabel.
Det finns två typer av fiberoptiska kablar: single mode och multimode.

Singlemode kabel (långvåg)

I en enkelmodskabel (SM) finns det bara en väg för utbredningen av en ljusvåg. Kärnstorleken är vanligtvis 8,3 mikron. Singlemode-kablar används i enheter där låg signalförlust (förlust) och höga dataöverföringshastigheter krävs, såsom långa intervall mellan två system eller nätverksenheter. Till exempel mellan en server och en lagring, vars avstånd är flera tiotals kilometer.

Det maximala avståndet mellan två noder i FC 2Gbit-nätverket anslutna med en enkellägeskabel är 80 km utan repeatrar.

Multimode (kortvåg) kabel

Multimode (MM) kabel kan sända flera ljusvågor över en enda fiber eftersom den relativt stora kärnstorleken tillåter ljus att färdas i olika vinklar (brytning). Typiska MM-kärnstorlekar är 50 µm och 62,5 µm. Multimode fiberanslutningar är bäst för kortdistansenheter. Inne på kontoret, byggnad.

Det maximala avståndet en multimodekabel stöder vid 2 Gbit/s är 300 (50um) och 150m (62,5 um).

Typer av kabelanslutningar

FC-kabelkontakter är:

Transceiver-typer (GBIC-typer)

Enheter för att omvandla ljus till en elektrisk signal och vice versa kallas transceivers. De kallas även GBICs (Gigabit Interface Connectors). Transceivern är placerad på FC-adapterkortet (FC HBA), vanligtvis löds den in i den, i omkopplaren - i form av en flyttbar modul (se fig.) Och på lagringsenheten i en eller annan form.

Transceivrar är:


SFP-LC HSSDC2

Avtagbara sändtagaremoduler (SFP)

HSSDC2: för 1 / 2Gbit FC för kopparkabel
SFP-LC: (Small Form Factor Pluggable LC) 1 / 2Gbit FC Kort / Långvåg för fiberoptisk kabel med LC-kontakt
SFP-SC: (Small Form Factor Pluggable SC) 1 / 2Gbit FC Kort / Långvåg för fiberoptisk kabel med SC-kontakt

Om du hanterar din egen infrastruktur i ditt eget datacenter bör du gå igenom ett urval av olika lagringserbjudanden. Valet av förvaringslösning beror till stor del på ditt behov. Innan du slutför ett specifikt lagringsalternativ för ditt användningsfall är det lite hjälpsamt att förstå tekniken.

Jag tänkte faktiskt skriva en artikel om objektlagring (som är det senaste alternativet för molnlagring). Men innan jag går och diskuterar den här delen av lagringsarenan tänkte jag att det vore bättre att diskutera de två huvudsakliga lagringsmetoderna som har funnits sida vid sida under mycket lång tid och som har använts av företag inhemskt för deras behov.

Beslutet för din lagringstyp kommer att bero på många faktorer som de nedan.

  • Den typ av data du vill lagra
  • Användningsschema
  • Skalning
  • Slutligen, din budget

När du börjar din karriär som sysadmin hör du ofta dina kollegor prata om olika lagringsmetoder som SAN, NAS, DAS, etc. Och utan lite grävande får man krångla med olika förvaringsförhållanden. Förvirring uppstår ofta på grund av likheterna mellan olika lagringsmetoder. Den enda snabba och enkla tumregeln för att hålla sig uppdaterad med facktermer är att fortsätta läsa (särskilt begreppen bakom en viss teknik).

Idag kommer vi att diskutera två olika metoder som definierar lagringsstrukturen i din miljö. Ditt val av de två i din arkitektur bör bara bero på ditt användningsfall och vilken typ av data du lagrar.

I slutet av denna handledning hoppas jag att du har en klar förståelse för de två huvudsakliga lagringsmetoderna och vilka du ska välja för dina behov.

SAN (storage area network) och NAS (nätverksansluten lagring)

Nedan är de viktigaste skillnaderna mellan var och en av dessa tekniker.

  • Hur lagringen är ansluten till systemet. Kort sagt, hur kopplingen görs mellan åtkomstsystemet och lagringskomponenten (direkt ansluten eller nätverksansluten)
  • Den typ av kabel som används för anslutningen. Kort sagt, det är den typ av kabel som används för att ansluta systemet till en lagringskomponent (som Ethernet och Fibre Channel)
  • Hur in- och utmatningsförfrågningar görs. Kort sagt, det är protokollet som används för att göra I/O-förfrågningar (t.ex. SCSI, NFS, CIFS, etc.)

Låt oss diskutera SAN först, NAS andra, och i slutet, låt oss jämföra var och en av dessa teknologier för att reda ut skillnaderna mellan dem.

SAN (storage area network)

Dagens ansökningar är mycket resurskrävande på grund av förfrågningar som behöver behandlas samtidigt per sekund. Ta exemplet med en e-handelswebbplats där tusentals människor lägger beställningar per sekund och alla måste lagras korrekt i en databas för senare hämtning. Lagringstekniken som används för att lagra databaser med så hög trafik måste vara snabb att betjäna och svara på förfrågningar (kort sagt, den måste vara snabb in och ut).

I sådana fall (när du behöver hög prestanda och snabb I/O) kan vi använda SAN.

Ett SAN är inget annat än ett höghastighetsnätverk som gör anslutningar mellan lagringsenheter och servrar.

Traditionellt har applikationsservrar använt sina egna lagringsenheter kopplade till dem. Konversation med dessa enheter med ett protokoll som kallas SCSI (Small Computer System Interface). SCSI är inget annat än en standard som används för kommunikation mellan servrar och lagringsenheter. Alla vanliga hårddiskar, bandenheter osv. Använd SCSI. I början uppfylldes serverns lagringskrav av lagringsenheterna som var påslagna inuti servern (servern som användes för att prata med den här interna lagringsenheten med hjälp av SCSI. Det är väldigt likt hur ett vanligt skrivbord pratar med sin interna hårddisk. ).

Enheter som CD-skivor ansluter till servern (som är en del av servern) med SCSI. Den största fördelen med SCSI för att ansluta enheter till en server var dess höga bandbredd. Även om denna arkitektur är tillräcklig för låga krav, finns det flera begränsningar, som de nedan.

  • Servern kan bara komma åt data på enheter som är direkt kopplade till den.
    Om något händer med servern kommer dataåtkomsten att misslyckas (eftersom lagringsenheten är en del av servern och är ansluten till den med SCSI)
  • Begränsa antalet lagringsenheter som servern kan komma åt. Om servern behöver mer lagringsutrymme kommer det inte att finnas mer utrymme att koppla in eftersom SCSI-bussen bara kan ta emot ett begränsat antal enheter.
  • Dessutom måste servern som använder SCSI-lagring vara nära lagringsenheten (eftersom parallell SCSI, som är en vanlig implementering på de flesta datorer och servrar, har vissa avståndsbegränsningar, den kan köras upp till 25 meter).

Vissa av dessa begränsningar kan övervinnas genom att använda DAS (Directly Tied Store). Det smarta som används för att direkt ansluta lagringen till servern kan vara vilken som helst av SCSI, Ethernet, Fiber, etc.). Låg komplexitet, låga investeringar, enkel implementering har resulterat i att DAS har antagits av många för normala krav. Lösningen var bra även ur prestandasynpunkt när den användes med snabbare media som fiber.

Även ett externt USB-minne anslutet till servern är också en DAS (konceptuellt sett är det en DAS eftersom den är direkt ansluten till serverns USB-buss). Men USB-minnen används vanligtvis inte på grund av USB-bussens hastighetsbegränsning. Vanligtvis används SAS-media (daisy chain SCSI) för tunga och stora DAS-lagringssystem. Internt kan lagringsenheten använda RAID (vilket vanligtvis är fallet) eller något för att tillhandahålla lagringsvolymer på servrarna. SAS-lagringsalternativ finns för närvarande på 6 Gbps.

Ett exempel på en DAS-lagringsenhet är MD1220 från Dell.

På servern kommer DAS-lagringen att vara mycket lik den inbyggda lagringen eller externa lagringen du har anslutit.

Även om DAS är bra för normala behov och ger bra prestanda, finns det begränsningar som antalet servrar som kan komma åt den. Förvara enheten eller säg att DAS ska vara nära servern (i samma rack eller inom det acceptabla avståndet från mediet som används).

Förmodligen är Direct Attached Storage (DAS) snabbare än någon annan lagringsmetod. Detta beror på det faktum att det inte medför någon overhead av dataöverföring över nätverket (all dataöverföring sker på en dedikerad anslutning mellan servern och lagringsenheten. I grund och botten dess seriekopplade SCSI eller SAS). Men på grund av de senaste förbättringarna av fiber och andra cachningsmekanismer ger SAN också bättre DAS-liknande hastighet och överträffar i vissa fall hastigheten som tillhandahålls av DAS.

Innan vi går in i SAN, låt oss förstå några typer och metoder av media som används för att ansluta lagringsenheter (när jag pratar om lagringsenheter, vänligen se det inte som en hårddisk. Ta det som en samling enheter, kanske på någon nivå av RAID (tänk på det som något liknande Dell MD1200).

Vad är SAS (Serial Attached SCSI), FC (Fibre Channel) och iSCSI (Internet Small Computer System Interface)?

Traditionellt är SCSI-enheter som en intern hårddisk anslutna till en gemensam parallell SCSI-buss. Detta innebär att alla anslutna enheter kommer att använda samma buss för att skicka/ta emot data. Men gemensamma parallellkopplingar är inte särskilt bra för hög precision och ställer till problem för höghastighetstransmissioner. En seriell anslutning mellan en enhet och en server kan dock öka den totala datagenomströmningen. SAS mellan lagringsenheter och servrar använder dedikerade 300 MB/sek diskutrymme. Tänk på en SCSI-buss som har samma hastighet för alla anslutna enheter.

SAS använder samma SCSI-kommandon för att skicka och ta emot data från enheten. Anta inte heller att SCSI endast används för intern lagring. Den används också för att ansluta en extern lagringsenhet till servern.

Om dataöverföringsprestanda och tillförlitlighet är valet, är SAS den bästa lösningen. När det gäller tillförlitlighet och felfrekvens är SAS-enheter mycket bättre än äldre SATA-enheter. SAS designades med den prestanda i åtanke som gör den till full duplex. Det innebär att data kan skickas och tas emot samtidigt från en enhet som använder SAS. En SAS-värdport kan också ansluta till flera SAS-enheter med hjälp av förlängare. SAS använder punkt-till-punkt-kommunikation med seriell kommunikation mellan enheter (lagringsenheter som diskenheter och diskarrayer) och värdar.

Den första generationen av SAS gav 3Gb/s hastighet. Andra generationens SAS förbättrade detta till 6 Gbps. Och den tredje generationen (som för närvarande används av många organisationer för extremt hög bandbredd) har förbättrat detta till 12 Gbps.

Fiber Channel Protocol

Fibre Channel är en relativt ny sammankopplingsteknik som används för att snabbt överföra data. Huvudsyftet med dess design är att tillhandahålla dataöverföring vid högre hastigheter med mycket låg/försumbar latens. Den kan användas för att ansluta arbetsstationer, kringutrustning, lagringsmatriser, etc.

Den huvudsakliga faktorn som skiljer en fiberoptisk länk från en annan anslutningsmetod är att den kan hantera både nätverks- och I/O-kommunikation över samma länk med samma adaptrar.

ANSI (American National Standards Institute) standardiserade fiberkanalen under 1988. När vi säger Fiber (i Fiber channel) tror vi inte att det bara stöder optiskt fibermedium. Fiber är en term som används för alla media som används för en fiberlänksprotokollanslutning. Du kan till och med använda koppartråd för en lägre kostnad.

Observera att ANSI-fiberstandarden stöder nätverk, lagring och överföring. Fiberkanalen vet inte vilken typ av data du överför. Den kan skicka SCSI-kommandon inkapslade i en fiberram (den har inga egna I/O-kommandon för att skicka och ta emot minne). Den största fördelen är att den kan inkludera ofta använda protokoll som SCSI och IP internt.

Komponenterna i en fiberkanalskarv listas nedan. Kravet nedan är minimikravet för att uppnå en enkelpunktsanslutning. Detta kan vanligtvis användas för en direkt anslutning mellan lagringsarrayen och värden.

  • HBA (Main Bus Adapter) med Fibre Channel-port
  • Drivrutin för HBA-kort
  • HBA fiberkanalkablar

Som nämnts tidigare är SCSI-protokollet inkapslat i en fiberkanal. Således måste vanligtvis SCSI-data modifieras i ett annat format som fibern kan leverera till sin destination. Och när mottagaren tar emot data överför den den till SCSI.

Du kanske tänker på varför vi behöver denna kartläggning och omtilldelning, varför vi inte direkt kan använda SCSI för att leverera data. Detta beror på att SCSI inte kan leverera data över långa avstånd till ett stort antal enheter (eller ett stort antal värdar).

Fiberkanalen kan användas för att koppla ihop system upp till 10 km (om de används med optiska fibrer kan du öka detta avstånd genom att ha repeatrar mellan dem). Och du kan också överföra 30m data med koppartråd för att minska kostnaden i fiberkanalen.

Med tillkomsten av fiberswitchar från många stora leverantörer har det blivit en lätt uppgift att ansluta ett stort antal lagringsenheter och servrar (förutsatt att du har investeringsbudgeten). Nätverkskapaciteten hos fiber har lett till en avancerad användning av SAN (Storage Area Networks) för snabb, långvarig och tillförlitlig dataåtkomst. Det mesta av datormiljön (som kräver snabb överföring av stora mängder data) använder en fiber SAN-länk med fiberoptiska kablar.

Den nuvarande fiberlänkstandarden (kallad 16GFC) kan överföra data med 1600MB/s (kom ihåg att denna standard släpptes 2011). De kommande standarderna förväntas ge hastigheter på 3200 MB/s och 6400 MB/s under de kommande åren.

ISCSI (Small Computer Interface)

iSCSI är inget annat än en IP-baserad standard för att ansluta arrayer och lagringsnoder. Den används för att överföra SCSI-trafik över IP-nätverk. Detta är den enklaste och billigaste lösningen (även om den inte är den bästa) för att ansluta till en lagringsenhet.

Det är en fantastisk teknik för platsoberoende lagring. Eftersom det kan upprätta anslutning till lagringsenheten med hjälp av lokala nätverk, wide area network. Det är en standard för lagringsnätverk. Det kräver inga speciella kablar och utrustning, som i fallet med ett nätverk av fiberkanaler.

För ett system som använder en iSCSI-lagringsmatris visas lagringen som en lokalt ansluten enhet. Denna teknik kom efter fiberkanalen och användes allmänt på grund av dess låga kostnad.

Det är ett nätverksprotokoll som körs över TCP/IP. Du kanske gissar att detta inte är särskilt bra prestanda jämfört med fiberoptik (helt enkelt för att allt fungerar över TCP utan speciell hårdvara eller ändringar i din arkitektur).

iSCSI introducerar lite CPU-belastning på servern eftersom servern måste göra ytterligare bearbetning för alla lagringsförfrågningar över nätverket med vanlig TCP.

iSCSI har följande nackdelar jämfört med fiberoptik

  • iSCSI introducerar något mer latens över fiber på grund av IP-header-overhead
  • Databasapplikationer har små läs- och skrivoperationer som, när de görs på iSCSI,
    iSCSI, när det körs på samma LAN som innehåller annan vanlig trafik (annan infrastrukturtrafik än iSCSI) kommer det att resultera i läs-/skrivfördröjning eller dålig prestanda.
  • Maximal hastighet/bandbredd begränsas av hastigheten på ditt Ethernet och nätverk. Även om du kombinerar flera länkar, skalas den inte till fiberlänken.

NAS (Network Attached Storage)

Den enklaste definitionen av en NAS är "Varje server som har sin egen lagring med andra på nätverket och fungerar som en filserver är den enklaste formen av NAS."

Observera att Network Attached Storage delar filer över nätverket. Inte en nätverkslagringsenhet.

NAS:n kommer att använda en Ethernet-anslutning för att dela filer över nätverket. NAS-enheten kommer att ha en IP-adress och kommer sedan att vara tillgänglig över nätverket med den IP-adressen. När du kommer åt filer på en filserver på ditt Windows-system är det i princip en NAS.

Den största skillnaden är hur din dator eller server hanterar specifik lagring. Om datorn ser lagringen som en del av sig själv (liknande hur du ansluter en DAS till din server), med andra ord, om serverprocessorn ansvarar för att hantera den anslutna lagringen så blir det ett slags DAS. Och om en dator/server behandlar den anslutna lagringen som en annan dator som delar sina data över nätverket, så är det en NAS.

Direct Attached Storage (DAS) kan ses som vilken annan kringutrustning som helst som ett mustangentbord, etc. Eftersom servern/datorn är en direktlagringsenhet. Men NAS är bara en annan server eller säg att hårdvara har sina egna datorfunktioner som kan dela sin egen lagring med andra.

Även SAN-lagring kan också ses som hårdvara som har sin egen processorkraft. Den största skillnaden mellan NAS, SAN och DAS är alltså hur servern/datorn ser det. DAS-lagringsenheten visas på servern som en del av sig själv. Servern ser det som sin fysiska del. Även om DAS inte kan finnas inuti servern (vanligtvis en annan enhet med sin egen lagringsuppsättning), ser servern den som sin egen intern (DAS visas på servern som sin egen intern lagring)

När vi pratar om NAS måste vi kalla dem aktier, inte lagringsenheter. Eftersom NAS:en visas på servern som en delad mapp istället för en delad enhet över nätverket. Glöm inte att NAS-enheter är datorer i sig själva som kan dela sin lagring med andra. När du delar en mapp med åtkomstkontroll med SAMBA, dess NAS.

NAS är dock ett billigare alternativ för dina lagringsbehov. Detta är verkligen olämpligt för en högpresterande applikation på företagsnivå. Tänk aldrig på att använda databaslagring (som bör ha hög prestanda) med en NAS. Den största nackdelen med att använda en NAS är prestandaproblem och nätverksberoende (i de flesta fall används LAN, som används för normal trafik, också för att dela lagring med NAS, vilket gör det mer överbelastat).

När man gemensamt exporterar NFS över nätverket är det också en form av NAS.

En NAS är inget annat än en enhet / utrustning / server ansluten till ett TCP / IP-nätverk som har sin egen lagring med andra. Om du gräver lite djupare, när en läs-/skrivförfrågan för filer skickas till en NAS-resurs ansluten till en server, skickas begäran som ett CIFS (Internet Shared File System) eller NFS (Network File System)-nätverk. Mottagningssidan (NAS-enhet) när den tar emot en NFS-begäran, översätter CIFS den sedan till en lokal lagrings-I/O-kommandouppsättning. Det är av denna anledning som en NAS-enhet har sin egen processorkraft.

Så NAS är lagring på filnivå (eftersom det i grunden är en fildelningsteknik). Detta beror på att det döljer själva filsystemet under huven. Detta ger användarna ett gränssnitt för att komma åt dess delade minne med NFS eller CIFS.

En vanlig NAS-användning du kan hitta är att ge varje användare en hemkatalog. Dessa hemkataloger lagras på NAS-enheten och monteras på datorn där användaren loggar in. Eftersom hemkatalogen är tillgänglig i nätverket kan användaren logga in från vilken dator som helst i nätverket.

NAS-fördelar

  • NAS har en mindre komplex arkitektur jämfört med SAN
  • Det är billigare att installera det i en befintlig arkitektur.
  • Inga ändringar krävs i din arkitektur eftersom normalt TCP/IP-nätverk är det enda kravet

Nackdelar med NAS

  • NAS är långsam
  • Låg bandbredd och hög latens, så den kan inte användas för högpresterande applikationer

Återgå till SAN

Låt oss nu gå tillbaka till diskussionen om SAN (storage area networks) som vi startade tidigare i början.

Den första och viktigaste utmaningen för att förstå SAN (förutom det vi redan diskuterade i början) är det faktum att det är en lagringslösning på blocknivå. Och SAN är optimerat för dataöverföring på blocknivå med hög volym. SAN fungerar bäst när det används med en fiberlänkmiljö (optiska fibrer och fiberlänkswitch).

Namnet "SAN" antyder att lagringen är placerad på sitt eget dedikerade nätverk. Värdar kan ansluta lagringsenheten till sig själva med antingen Fibre Channel, TCP/IP (SAN använder iSCSI när det används över tcp/ip-nätverk).

SAN kan ses som en teknik som kombinerar de bästa egenskaperna hos både DAS och NAS. Om du kommer ihåg så dyker DAS upp på datorn som sin egen lagringsenhet och är välkänt, DAS är också en block-level lagringslösning (om du kommer ihåg så pratade vi aldrig om CIFS eller NFS under DAS). NAS är känt för sin flexibilitet, grundläggande nätverksåtkomst, åtkomstkontroll och mer. SAN kombinerar det bästa av två världar eftersom ...

  • SAN-lagring visas också på servern som sin egen lagringsenhet
  • Dess lagringslösning på blocknivå
  • Bra prestanda/hastighet
  • Nätverksfunktioner med iSCSI

SAN och NAS är inte konkurrerande teknologier, utan är designade för olika behov och uppgifter. Eftersom SAN är en lagringslösning på blocknivå är den bäst lämpad för högpresterande lagring, e-postlagring mm De flesta moderna SAN-lösningar tillhandahåller diskspegling, arkiveringsbackup och replikeringsfunktioner.

Ett SAN är ett dedikerat lagringsnätverk (kan inkludera bandenheter, RAID-arrayer, etc.) som arbetar tillsammans för att tillhandahålla överlägsen lagring på blocknivå. Medan en NAS är en enda enhet/server/datorenhet använder den sin egen lagring över nätverket.

Viktiga skillnader mellan SAN och NAS

SAN NAS
Dataåtkomst på blocknivå Få åtkomst till data på filnivå
Fibre Channel är det primära mediet som används med SAN. Ethernet är det primära lagringsmediet som används med NAS
SCSI är det huvudsakliga I/O-protokollet NFS / CIFS används som huvud I/O-protokoll i NAS
SAN-lagringen visas på datorn som sin egen lagring Ladda ner NAS som en delad mapp till en dator
Den kan ha utmärkt hastighet och prestanda när den används med ljusledare Detta kan ibland försämra prestandan om nätverket används för andra saker också (vilket vanligtvis är fallet)
Används främst för att lagra data på en högre prestandanivå Används för små läs- och skrivoperationer över långa avstånd

I branschen för att lära SAN stod inför ett visst hinder - otillgängligheten av grundläggande information. När det gäller att studera andra infrastrukturprodukter som jag har stött på är det lättare - det finns testversioner av programvaran, möjligheten att installera dem på en virtuell maskin, det finns ett gäng läroböcker, referensguider och bloggar om ämnet . Cisco och Microsoft nitar mycket högkvalitativa läroböcker, MS, dessutom kammade åtminstone sin helvetes loftskåp som heter technet, även det finns en bok om VMware, om än en (och till och med på ryska!), Och med en effektivitet på cirka 100 %. Redan på själva lagringsenheterna kan du få information från seminarier, marknadsföringsevenemang och dokument, forum. På lagernätet är det tystnad och de döda står med flätor. Jag hittade två läroböcker, men vågade inte köpa. Dessa är "Storage Area Networks For Dummies" (det finns sådana, visar det sig. Mycket nyfikna engelsktalande "dummies" i målgruppen, tydligen) för ett och ett halvt tusen rubel och "Distributed Storage Networks: Architecture, Protocols and Management" - ser mer pålitlig ut, men 8200r med 40% rabatt. Tillsammans med den här boken rekommenderar Ozon även boken The Art of Brickwork.

Jag vet inte vad jag ska råda en person som bestämmer sig för att studera åtminstone teorin om att organisera ett lagringsnätverk från grunden. Som praxis har visat kan även dyra kurser ge noll effekt. Människor i relation till SAN delas in i tre kategorier: de som inte vet vad det är, vem som vet att ett sådant fenomen helt enkelt finns där, och de som tittar på frågan "varför tittar två eller flera fabriker i ett lagringsnätverk" med sådan förvirring, som om de fick frågan något i stil med "varför behöver en fyrkant fyra hörn?"

Jag ska försöka fylla i luckan som jag saknade – att beskriva basen och beskriva den enkelt. Jag kommer att överväga ett SAN baserat på dess klassiska protokoll - Fibre Channel.

Så SAN - Lagringsnätverk- utformad för att konsolidera diskutrymmet på servrar på speciellt dedikerade disklagringar. Summan av kardemumman är att på detta sätt används diskresurser mer ekonomiskt, är lättare att hantera och har bättre prestanda. Och när det gäller virtualisering och klustring, när flera servrar behöver åtkomst till samma diskutrymme, är sådana lagringssystem i allmänhet oersättliga.

Förresten, i SAN-terminologin, tack vare översättningen till ryska, finns det viss förvirring. SAN i översättning betyder "storage area network" - lagringssystem. Men klassiskt i Ryssland förstås lagring som termen "datalagringssystem", det vill säga det är diskarrayen ( Lagringsuppsättning), som i sin tur består av ett kontrollblock ( Lagringsprocessor, Storage Controller) och diskhyllor ( Diskhölje). Men i originalet är Storage Array bara en del av SAN, även om det ibland är det viktigaste. I Ryssland får vi att lagringssystemet (datalagringssystem) är en del av lagringssystemet (storage area network). Därför kallas lagringsenheter vanligtvis lagringssystem, och lagringsnätverket - SAN (och förväxlas med "Sun", men detta är en bagatell).

Komponenter och termer

Tekniskt sett består SAN av följande komponenter:
1. Noder, noder
  • Diskarrayer (datalagringssystem) - lagringar (mål)
  • Servrar är konsumenter av diskresurser (initiatorer).
2. Nätverksinfrastruktur
  • Switchar (och routrar i komplexa och distribuerade system)
  • Kablar

Egenheter

Utan att gå in på detaljer liknar FC-protokollet Ethernet-protokollet med WWN-adresser istället för MAC-adresser. Endast, istället för två lager, har Ethernet fem (varav det fjärde ännu inte har definierats, och det femte är mappningen mellan FC-transporten och högnivåprotokollen som sänds över denna FC - SCSI-3, IP) . Dessutom använder FC-switchar specialiserade tjänster, varav analoger för IP-nätverk vanligtvis finns på servrar. Till exempel: Domain Address Manager (ansvarig för att tilldela domän-ID till switchar), Name Server (lagrar information om anslutna enheter, en slags WINS-analog inom switchen), etc.

För ett SAN är nyckelparametrarna inte bara prestanda utan även tillförlitlighet. När allt kommer omkring, om databasservern förlorar sitt nätverk i ett par sekunder (eller till och med minuter) - ja, det kommer att vara obehagligt, men du kan överleva. Och om hårddisken med basen eller operativsystemet faller av samtidigt, blir effekten mycket allvarligare. Därför är alla SAN-komponenter vanligtvis duplicerade - portar i lagringsenheter och servrar, switchar, länkar mellan switchar och, en nyckelfunktion i SAN, jämfört med LAN, är duplicering på nivån för hela infrastrukturen för nätverksenheter - fabriker.

Fabrik (tyg- som i allmänhet översätts från engelska som tyg, eftersom termen symboliserar ett sammanvävt schema för att ansluta nätverk och terminalenheter, men termen har redan etablerats) - en uppsättning växlar sammankopplade med inter-switchlänkar ( ISL - InterSwitch Link).

SAN:er med hög tillgänglighet inkluderar med nödvändighet två (och ibland fler) tyger, eftersom själva tyget är en enda punkt av misslyckande. De som åtminstone en gång har observerat konsekvenserna av en ring i nätverket eller en skicklig rörelse av tangentbordet, införa en switch på kärnnivå eller distribution i koma med en misslyckad firmware eller kommando, förstår vad det handlar om.

Fabriker kan ha samma (spegelvända) topologi eller skilja sig åt. Till exempel kan en fabrik bestå av fyra switchar, och en annan av en, och endast mycket kritiska noder kan anslutas till den.

Topologi

Det finns följande typer av fabrikstopologier:

Kaskad- omkopplare är seriekopplade. Om det finns fler än två av dem är det opålitligt och improduktivt.

Ringa- stängd kaskad. Det är mer tillförlitligt än bara en kaskad, även om med ett stort antal deltagare (mer än 4) kommer prestanda att bli lidande. Ett enda fel på ISL eller en av switcharna förvandlar kretsen till en kaskad med alla konsekvenser.

Maska). Det händer Full Mesh- när varje strömbrytare ansluts till varje. Den kännetecknas av hög tillförlitlighet, prestanda och pris. Antalet portar som krävs för inter-switchlänkar växer exponentiellt med varje ny switch som läggs till kretsen. Med en viss konfiguration kommer det helt enkelt inte att finnas några portar kvar för noder - alla kommer att vara upptagna med ISL. Partiell Mesh- varje kaotisk sammanslagning av switchar.

Center / kringutrustning (kärna / kant)- nära den klassiska LAN-topologin, men utan distributionslagret. Det är inte ovanligt att lagring ansluter till Core-switchar och servrar till Edge. Även om ett extra lager (tier) av Edge-switchar kan allokeras för lagring. Lagring och servrar kan också anslutas till en enda switch för att förbättra prestandan och minska svarstiden (detta kallas lokalisering). Denna topologi kännetecknas av god skalbarhet och hanterbarhet.

Zonindelning (zonindelning, zonindelning)

En annan teknik som kännetecknar SAN. Detta är definitionen av initiator-målpar. Det vill säga vilka servrar som kan komma åt vilka diskresurser, så att det inte händer att alla servrar ser alla möjliga diskar. Detta uppnås enligt följande:
  • de valda paren läggs till de zoner som tidigare skapats på kommutatorn;
  • zoner placeras i zonuppsättningar (zonuppsättning, zonkonfiguration) skapade på samma plats;
  • zonuppsättningar är aktiverade från fabrik.

För ett första inlägg om SAN tror jag att det räcker. Jag ber om ursäkt för de brokiga bilderna - det finns inget sätt att rita mig själv på jobbet, men det finns ingen tid hemma. Jag hade idén att rita på papper och fotografera, men bestämde mig för att det var bättre på det här sättet.

Slutligen, som ett efterskrift, kommer jag att lista grundläggande designriktlinjer för ett SAN-tyg.

  • Konstruera strukturen så att det inte finns fler än tre omkopplare mellan två ändenheter.
  • Det är önskvärt att en fabrik inte består av fler än 31 brytare.
  • Det är värt att ställa in Domän-ID manuellt innan du lägger till en ny växel i tyget - det förbättrar hanterbarheten och hjälper till att undvika problem med samma Domän-ID, i fall till exempel när en växel återansluts från ett tyg till ett annat.
  • Ha flera lika rutter mellan varje lagringsenhet och initiatorn.
  • I fall av odefinierade prestandakrav, överväg förhållandet mellan antalet Nx-portar (för slutenheter) och antalet ISL-portar som 6: 1 (EMC-rekommendation) eller 7: 1 (Brocade-rekommendation). Detta förhållande kallas överteckning.
  • Zonindelningsrekommendationer:
    - använd informativa namn på zoner och zonuppsättningar;
    - använd WWPN-zonindelning, inte portbaserad (baserat på enhetsadresser, inte fysiska portar för en specifik switch);
    - varje zon är en initiator;
    - rengör fabriken från "döda" zoner.
  • Ha en reserv av lediga portar och kablar.
  • Ha en reserv av utrustning (switchar). På platsnivå - krävs, eventuellt på fabriksnivå.

Låt oss titta på några topologier för lagringsnätverk

En enkelswitch består av en fiberkanalswitch, server och lagringssystem. Vanligtvis är denna topologi basen för alla standardlösningar - andra topologier skapas genom att kombinera enstaka switchceller.


Ris. 1.4.

En kaskadstruktur är en uppsättning celler vars switchar är anslutna till ett träd med hjälp av inter-switch-anslutningar.


Ris. 1.5.

Ett gitter är en uppsättning celler, vars omkopplare är ansluten till alla andra. Om en (och i ett antal kombinationer - och fler) anslutning misslyckas, störs inte nätverksanslutningen. Nackdel - hög redundans av anslutningar


Ris. 1.6.

Ringen upprepar praktiskt taget gittertopologischemat. Fördelarna inkluderar användningen av färre anslutningar.


Ris. 1.7.

Konsolidering av IT-infrastruktur

Konsolidering är konsolideringen av datorresurser eller ledningsstrukturer i ett enda centrum.

Analys av internationella erfarenheter låter oss tala om en tydlig trend mot konsolidering av företags IT-resurser. Det är hon som kan sänka IT-kostnaderna avsevärt. De sparade medlen kan användas för att förbättra kvaliteten på befintliga informationstjänster och införandet av nya. Förutom att optimera IT-kostnaderna kan konsolideringen av IT-resurser förbättra företagens hanterbarhet genom mer uppdaterad och komplett information om deras verksamhet. De brukar prata om konsolidering:

  • servrar- flytta decentraliserade applikationer distribuerade på olika servrar i företaget till ett kluster av centraliserade homogena servrar;
  • lagringssystem- gemensam användning av ett centraliserat datalagringssystem av flera heterogena noder.
  • applikationer- värd för flera applikationer på en värd.

Samtidigt kan två grundläggande typer av konsolidering urskiljas - fysisk och logisk. Fysisk konsolidering innebär geografisk omlokalisering av servrar till en enda plats (datacenter), och logisk konsolidering innebär centralisering av hanteringen.

Att flytta datorer till ett enda databehandlingscenter gör det möjligt att ge bekväma förhållanden för utrustning och teknisk personal, samt att öka graden av fysiskt skydd av servrar. Dessutom kan datacentret använda mer produktiv och högkvalitativ hårdvara som inte är kostnadseffektiv att installera på varje avdelning. Genom att bygga datacenter kan du minska kostnaderna för att underhålla och hantera dina mest kritiska servrar i ditt företag. Bladsystem, såväl som lagringssystem och nätverk, är ett bra exempel på utrustning som framgångsrikt kan lösa problemet med att konsolidera datorresurser i organisationer på alla nivåer.

Den klara fördelen med denna lösning är att den förenklar tillhandahållandet av stödpersonal och deras arbete med att distribuera och hantera system, och minskar graden av dubbelarbete av erfaren personal. Centralisering gör det också lättare att använda standardiserade konfigurationer och hanteringsprocesser, skapa kostnadseffektiva backupsystem för katastrofåterställning och upprätthålla affärsanslutning. Lösningen på frågorna om att organisera högkvalitativ kontroll över miljöns tillstånd och säkerställa fysiskt skydd förenklas också. Nätverkssäkerheten kan också förbättras eftersom servrarna skyddas av en enda, centralt hanterad brandvägg.

Den logiska typen av konsolidering innebär en omstrukturering av ledningssystemet för IT-infrastruktur. Detta är nödvändigt både för att öka skalbarheten och hanterbarheten hos ett komplext distribuerat datorsystem och för att förena företagsnätverkssegment. Logisk konsolidering möjliggör centraliserad hantering och förening av arbetet med företagets resurser baserat på öppna standarder. Som ett resultat blir det möjligt att skapa globala informationstjänster för företaget - LDAP-katalog, företagsportal eller ERP-system, vilket i slutändan kommer att förbättra företagets hanterbarhet på grund av mer relevant och fullständig information om dess funktion.

Logisk konsolidering av applikationer centraliserar hanteringen av affärskritiska system och applikationer. Fördelarna med logisk konsolidering är uppenbara: först och främst är det frisläppandet av hårdvaruresurser som kan användas i andra delar av informationssystemet. För det andra gör en enklare och mer logisk struktur för IT-infrastrukturhantering den mer flexibel och anpassningsbar till framtida förändringar.

Det homogena konsolideringsscenariot innebär att en storskalig applikation, som tidigare kördes på flera servrar, flyttas till en mer kraftfull (Figur 1.8). Ett exempel på en sådan operation är databaser, som ofta utökas kraftigt i takt med att mängden bearbetad information växer. Konsolidering av data och applikationer på en enda server påskyndar avsevärt bearbetning och hämtning, samt ökar integritetsnivån.

Heterogen konsolidering liknar innehållsmässigt homogen, men i det här fallet är olika applikationer föremål för förening. Till exempel kan flera instanser av Exchange Server och SQL Server som tidigare kördes på separata datorer konsolideras på en enda dator. Fördelarna med heterogen konsolidering är ökad skalbarhet för tjänster och bättre utnyttjande av systemresurser.


Ris. 1.8.

Som påpekats av experter inom molnteknik - är konsolideringen av IT-infrastrukturen det första steget mot "molnet". För att gå över till molnet måste företag först ta itu med utmaningarna med en okonsoliderad IT-infrastruktur. "Utan konsolidering är det omöjligt att bygga en effektiv processorienterad ledning, eftersom det inte finns någon enskild serviceleverans."

Genom att analysera historien om utvecklingen av informationsteknik och moderna trender kan vi dra slutsatsen att den evolutionära omgången av IT, som började med stordatorernas era för mer än femtio år sedan, stängdes - tillsammans med molnen återvände vi till centraliseringen av resurser, men den här gången inte på nivån för stordatorer med sina gröna terminaler utan på en ny teknisk nivå.

På en konferens om problemen med moderna processorer sa professor vid Massachusetts Institute of Technology Anand Agarwal: "En processor är en transistor i vår tid." Den nya nivån är annorlunda genom att stordatorer också monteras här, men virtuella, och inte från enskilda transistorer, som för ett halvt sekel sedan, utan från hela processorer eller helt från datorer. Vid IT:s gryning "skulpterade" många företag och organisationer sina egna datorer av diskreta komponenter, monterade dem på egentillverkade kretskort - varje organisation gjorde sin egen maskin, och det var ingen fråga om någon standardisering eller enande. Och nu, på tröskeln till det andra decenniet av 2000-talet, upprepar situationen sig - på samma sätt samlas externa och privata moln in från bladservrar, datorer och olika nätverksutrustning. Samtidigt finns det samma tekniska oenighet och brist på enande: Microsoft, Google, IBM, Aptana, Heroku, Rackspace, Ning, Salesforce bygger globala stordatorer, och någon skapar privata moln för sina egna behov, som är desamma stordatorer, men i mindre skala. ... Det återstår att anta att uppfinningen av en integrerad krets och en mikroprocessor ligger framför.