Vad är ett söknätverk. De bästa sökmotorerna på Internet. Ryssland och ryskspråkiga sökmotorer

Mest populär webb Sökmotorn är vår tids tjänst. Allt är förståeligt här, eftersom de dagar då representanter för de första internetanvändarna kunde observera nya produkter på Internet är långt borta.

Så mycket information dyker upp och ackumuleras att det har blivit väldigt svårt för en person att hitta exakt det han behöver. Föreställ dig hur det skulle vara att söka på Internet om den genomsnittlige användaren var tvungen att leta efter information från Gud vet var. Jag förstår inte exakt var, för manuell sökning Du hittar inte mycket information.

Sökmotor, vad är det?

Det är bra om användaren redan känner till webbplatser som kan ha nödvändig information, men vad ska man göra annars? För att göra livet lättare för en person som söker nödvändig information på Internet och uppfanns sökmotorer eller bara sökmotorer. Sökmotorn utför en mycket viktig funktion, utan vilken Internet inte skulle vara detsamma som vi är vana vid att se det - det här är att söka information på Internet.

Söksystem- detta är en speciell webbplats eller med andra ord en webbplats som förser användare, på deras begäran, med hyperlänkar till sidor på webbplatser som svarar på en given sökfråga.

För att vara lite mer exakt är det en sökning efter information på Internet, som utförs tack vare en funktionsuppsättning för mjukvara och hårdvara och ett webbgränssnitt för att interagera med användare.

För mänsklig interaktion med sökmotorn skapades ett webbgränssnitt, det vill säga ett synligt och begripligt skal. Detta tillvägagångssätt hos sökmotorutvecklare gör sökningen lättare för många människor. Som regel är det på Internet som sökningar görs med sökmotorer, men det finns också sökmotorer för FTP-servrar, enskilda arter varor på World Wide Web, eller nyhetsinformation eller andra sökvägar.

Sökningen kan utföras inte bara av textinnehållet på webbplatser, utan också av andra typer av information som en person kan söka efter: bilder, videor, ljudfiler, etc.

Hur söker en sökmotor?

Att söka på själva Internet, precis som att surfa på webbplatser, är möjligt med en webbläsare. Först efter att användaren har specificerat sin fråga i sökfältet, utförs själva sökningen direkt.

Alla sökmotorer innehåller mjukvarudel, som hela sökmekanismen är baserad på, kallas den en sökmotor - det är det mjukvarupaket och ger möjlighet att söka information. Efter att ha kontaktat en sökmotor genererar en person en sökfråga och anger den i sökfältet, sökmotorn genererar en sida med en lista över sökresultat, de mest relevanta, enligt sökmotorns åsikt, ligger högre upp.

Sökrelevans - söka efter det mest relevanta materialet för användarens begäran och placera hyperlänkar på dem på sökresultatsidan med mer exakta resultat framför andra. Fördelningen av resultat i sig kallas webbplatsrankning.

Så hur förbereder en sökmotor sitt material för publicering och hur söker sökmotorn själv efter information? Insamlingen av information på nätverket underlättas av en unik robot eller bot för varje sökmotor, som även har ett antal andra synonymer som crawler eller spindel, och själva söksystemets arbete kan delas in i tre steg:

Det första steget i en sökmotors verksamhet inkluderar genomsökning av webbplatser globalt nätverk och samla på egen hand egna servrar kopior av webbsidor. Detta skapar en enorm mängd information som ännu inte har bearbetats och som inte lämpar sig för sökresultat.

Det andra steget i sökmotorns arbete handlar om att ordna informationen som mottagits tidigare, i det första steget, från webbplatser. Sorteringen utförs på ett sådant sätt att på kortast möjliga tid kommer att bidra till den mycket högkvalitativa sökning som användarna faktiskt förväntar sig av en sökmotor. Stadiet kallas indexering, vilket innebär att sidorna redan är förberedda för leverans, och aktuell databas kommer att betraktas som ett index.

Det är just det tredje steget som bestämmer sökresultaten, efter att ha fått en förfrågan från sin kund, baserat på de nyckelord eller nära nyckelord som anges i förfrågan. Detta underlättar valet av den information som är mest relevant för begäran och dess efterföljande leverans. Eftersom det finns mycket, mycket information, utför sökmotorn rankning i enlighet med sina algoritmer.
Den bästa sökmotorn anses vara den som kan tillhandahålla det material som bäst svarar på användarens begäran. Men även här kan det finnas resultat som har påverkats av personer som är intresserade av att marknadsföra sin webbplats, även om de inte alltid visas i sökresultaten, men inte länge.

Även om världsledare redan har identifierats i många regioner, fortsätter sökmotorer att utveckla sina högkvalitativa sökningar. Hur bättre sökning de kommer att kunna tillhandahålla fler människor kommer att använda den.

Hur använder man sökmotorn?

Vad är en sökmotor och hur den fungerar är redan klart, men hur använder man den på rätt sätt? De flesta sajter har alltid ett sökfält, och bredvid det finns en Sök- eller Sök-knapp. I sökruta en fråga skrivs in, varefter du behöver trycka på sökknappen eller, som oftare, trycka Enter-tangent på tangentbordet och på några sekunder får du frågeresultatet i form av en lista.

Men det är inte alltid möjligt att få rätt svar på en sökfråga första gången. För att säkerställa att sökningen efter det du vill inte blir smärtsam måste du komponera din sökfråga korrekt och följa rekommendationerna som beskrivs nedan.

Vi komponerar sökfrågan korrekt

Följande ger tips om hur du använder sökmotorn. Att följa några knep och regler när du söker information i en sökmotor kommer att ge dig möjlighet att få önskat resultat mycket snabbare. Följ dessa riktlinjer:

  1. Korrekt stavning av ord säkerställer högsta belopp matchar den sökta informationsobjekt(Även om moderna sökmotorer redan har lärt sig att korrigera Stavningsfel, men detta råd bör inte försummas).
  2. Genom att använda synonymer i din fråga kan du täcka ett bredare sökintervall.
  3. Ibland kan det ge bättre resultat om du ändrar ett ord i frågetexten.
  4. Ge din fråga specificitet, använd exakta förekomster av fraser som ska definiera huvudessensen i sökningen.
  5. Experimentera med sökord. Att använda nyckelord och fraser kan hjälpa till att identifiera huvudpunkten, och sökmotorn kommer att ge mer relevanta resultat.

Så vad en sökmotor är är inget annat än en möjlighet att hitta information av intresse och vanligtvis använda den helt gratis, lära sig något, förstå något eller själv dra rätt slutsats. Många människor kan inte längre föreställa sig sitt liv utan röstsökning, där det inte finns något behov av att skriva text, du behöver bara säga din begäran, och informationsinmatningsenheten här är en mikrofon. Allt detta indikerar den ständiga utvecklingen av sökteknik på Internet och behovet av dem.

Sökmotorns arkitektur inkluderar vanligtvis:

Encyklopedisk YouTube

    1 / 5

    ✪ Lektion 3: Hur en sökmotor fungerar. Introduktion till SEO

    ✪ Sökmotor från insidan

    ✪ Shodan - svart Google

    ✪ Sökmotorn CHEBURASHKA kommer att ersätta Google och Yandex i Ryssland

    ✪ Lektion 1 - Hur en sökmotor fungerar

    undertexter

Berättelse

Kronologi
År Systemet Händelse
1993 W3-katalog?! Lansera
Aliweb Lansera
JumpStation Lansera
1994 WebCrawler Lansera
Infoseek Lansera
Lycos Lansera
1995 AltaVista Lansera
Daum Bas
Öppna text Webbindex Lansera
Magellan Lansera
Excitera Lansera
SAPO Lansera
Yahoo! Lansera
1996 Dogpile Lansera
Inktomi Bas
Vandrare Bas
HotBot Bas
Fråga Jeeves Bas
1997 Norrsken Lansera
Yandex Lansera
1998 Google Lansera
1999 AlltheWeb Lansera
GenieKnows Bas
Naver Lansera
Teoma Bas
Vivisimo Bas
2000 Baidu Bas
Exalead Bas
2003 Info.com Lansera
2004 Yahoo!  Sök Slutlig lansering
A9.com Lansera
Sogou Lansera
2005 MSN Sök Slutlig lansering
Ask.com Lansera
Nygma Lansera
GoodSearch Lansera
Sök mig Bas
2006 wikiseek Bas
Quaero Bas
Live sökning Lansera
ChaCha Starta (beta)
Guruji.com Starta (beta)
2007 wikiseek Lansera
Sproose Lansera
Wikia Sök Lansera
Blackle.com Lansera
2008 DuckDuckGo Lansera
Tooby Lansera
Picollator Lansera
Viewzi Lansera
Cuil Lansera
Boogami Lansera
LeapFish Starta (beta)
Forestle Lansera
VADLO Lansera
Powerset Lansera
2009 Bing Lansera
KAZ.KZ Lansera
Yebol Starta (beta)
Mugurdy Stängning
spana Lansera
2010 Cuil Stängning
Blekko Starta (beta)
Viewzi Stängning
2012 WAZZUB Lansera
2014 Satellit Starta (beta)

Tidigt i utvecklingen av Internet förde Tim Berners-Lee en lista över webbservrar på CERN-webbplatsen. Det blev fler och fler sajter, och att manuellt upprätthålla en sådan lista blev svårare och svårare. På NCSA hemsida fanns specialavdelning"Vad är nytt!" (engelska: What's New!), där de publicerade länkar till nya sajter.

Först datorprogram för att söka på Internet, det fanns ett program Archie(Engelsk archie - arkiv utan bokstaven "c"). Den skapades 1990 av Alan Emtage, Bill Heelan och J. Peter Deutsch, datavetenskapsstudenter vid McGill University i Montreal. Programmet laddade ner listor över alla filer från alla tillgängliga anonyma FTP-servrar och byggde en databas som kunde sökas efter filnamn. Archies program indexerade dock inte innehållet i dessa filer, eftersom mängden data var så liten att allt lätt kunde hittas för hand.

Utveckling och distribution nätverksprotokoll Gopher, som uppfanns 1991 av Mark McCahill vid University of Minnesota, ledde till skapandet av två nya sökprogram, Veronica och Jughead. Liksom Archie letade de efter filnamn och rubriker lagrade i indexsystem Jordekorre. Veronica (engelska) Mycket enkelt gnagarorienterat nätövergripande index till datoriserade arkiv) tillåtna nyckelordssökningar för de flesta Gopher-menytitlar i alla Gopher-listor. Jughead program Jonzys Universal Gopher Hierarchy Excavation And Display) hämtade menyinformation från specifika Gopher-servrar. Även om namnet på Archie-sökmotorn inte var relaterat till serietidningsserien "Archie", dock är Veronica och Jughead karaktärer i dessa serier.

Sommaren 1993 fanns det ännu inte ett enda system för att söka på Internet, även om många specialiserade kataloger sköttes manuellt. Oscar Nierstrasz vid universitetet i Genève skrev en serie Perl-manus som med jämna mellanrum kopierade dessa sidor och skrev om dem till ett standardformat. Detta blev grunden för W3-katalog?!, webbens första primitiva sökmotor, lanserades den 2 september 1993.

Förmodligen var den första sökroboten som skrevs i Perl "World Wide Web Wanderer"-boten av Matthew Gray i juni 1993. Denna robot skapade sökindexet "Wandex". Wanderers mål var att mäta storleken på World Wide Web och hitta alla webbsidor som innehåller orden från frågan. 1993 dök den andra sökmotorn "Aliweb" upp. Aliweb använde ingen sökrobot, utan förväntade sig istället meddelanden från webbplatsadministratörer om förekomsten av en indexfil i ett visst format på deras webbplatser.

JumpStation, skapad i december 1993 av Jonathan Fletcher, sökte och indexerade webbsidor med hjälp av en sökrobot och använde ett webbformulär som ett gränssnitt för att formulera sökfrågor. Det var det första sökverktyget på Internet som kombinerade tre essentiella funktioner sökmotor (verifiering, indexering och själva sökningen). På grund av den tidens begränsade datorresurser begränsades indexering och därför sökning till endast titlar och titlar på webbsidor som sökroboten hittade.

Sökmotorer deltog i "Dotcom Bubble" i slutet av 1990-talet. Flera företag gick ut på marknaden på ett spektakulärt sätt och genererade rekordvinster under sina börsintroduktioner. Vissa har övergett den offentliga sökmotormarknaden och börjat arbeta enbart med företagssektorn, t.ex. Norrsken.

Google antog idén att sälja sökord 1998, då var det ett litet företag som tillhandahåller en sökmotor på goto.com. Flytten markerade ett skifte för sökmotorer från att konkurrera med varandra till att bli ett av de mest lönsamma affärsföretagen på Internet. Sökmotorer började sälja de första platserna i sökresultaten till enskilda företag.

Googles sökmotor har varit framstående sedan början av 2000-talet. Företaget har uppnått en hög position tack vare goda sökresultat med hjälp av PageRank-algoritmen. Algoritmen introducerades för allmänheten i artikeln "The Anatomy of Search Engine", skriven av Sergey Brin och Larry Page, grundarna av Google. Denna iterativa algoritm rangordnar webbsidor baserat på en uppskattning av antalet hyperlänkar till en webbsida, under antagandet att "bra" och "viktiga" sidor har fler länkar än andra. Googles gränssnitt är designat i spartansk stil, där det inte finns något överflödigt, till skillnad från många av dess konkurrenter som byggt in sökmotorn i webbportalen. Googles sökmotor har blivit så populär att imiterande system har dykt upp, t.ex. Mystery Seeker(hemlig sökmotor).

Söker information på ryska

1996 genomfördes en sökning som tog hänsyn till rysk morfologi på sökmotorn Altavista och de ursprungliga ryska sökmotorerna Rambler och Aport lanserades. Den 23 september 1997 öppnades Yandex sökmotor. Den 22 maj 2014 öppnade Rostelecom den nationella sökmotorn Sputnik, som vid tiden för 2015 är i betatestning. Öppnade den 22 april 2015 ny tjänst Satellit.  Barn speciellt för barn med ökad säkerhet.

Metoder för klusteranalys och metadatasökning har blivit mycket populära. Av de internationella bilarna av denna typ är den mest kända "Clusty" företag Vivisimo. År 2005 lanserades sökmotorn Nigma i Ryssland, med stöd av Moscow State University, som stöder automatisk klustring. 2006 öppnade den ryska metamaskinen Quintura, som erbjuder visuell klustring i form av ett taggmoln. Nygma experimenterade också med visuell klustring.

Hur fungerar en sökmotor?

Huvudkomponenterna i ett söksystem: sökrobot, indexerare, sökmotor.

Vanligtvis fungerar systemen i etapper. Först hämtar sökroboten innehållet, sedan genererar indexeraren ett sökbart index, och slutligen tillhandahåller sökmotorn funktionen för att söka i den indexerade informationen. För att uppdatera sökmotorn upprepas denna indexeringscykel.

Sökmotorer fungerar genom att lagra information om många webbsidor, som de hämtar från HTML-sidor. En sökrobot eller "crawler" (eng. Crawler) är ett program som automatiskt går igenom alla länkar som finns på sidan och markerar dem. Sökroboten, baserat på länkar eller baserat på en fördefinierad lista med adresser, söker efter nya dokument som ännu inte är kända för sökmotorn. Webbplatsägaren kan exkludera vissa sidor med hjälp av robots.txt, som kan användas för att förhindra indexering av filer, sidor eller kataloger på webbplatsen.

Sökmotorn analyserar innehållet på varje sida för vidare indexering. Ord kan extraheras från titlar, sidtext eller specialfält - metataggar. En indexerare är en modul som analyserar en sida, som tidigare har delat upp den i delar, med hjälp av sina egna lexikala och morfologiska algoritmer. Alla delar av en webbsida isoleras och analyseras separat. Webbsidesdata lagras i en indexdatabas för användning i efterföljande frågor. Indexet låter dig snabbt hitta information baserat på användarens begäran. Ett antal sökmotorer som Google Store startsida hela eller delar av den, den så kallade cachen, samt olika information om webbsidan. Andra system som AltaVista system, lagra varje ord på varje sida som hittas. Att använda en cache hjälper till att påskynda hämtningen av information från redan besökta sidor. Cachade sidor innehåller alltid den text som användaren angav i sökfrågan. Detta kan vara användbart i fallet när webbsidan har uppdaterats, det vill säga att den inte längre innehåller texten från användarens begäran och sidan i cachen fortfarande är gammal. Denna situation är relaterad till förlust av länkar. linkrot) och Googles användarvänliga (användbarhet) tillvägagångssätt. Detta innebär att korta textfragment returneras från cachen som innehåller förfrågningstexten. Principen om minsta överraskning gäller vanligtvis att användaren ser de sökta orden i texterna på de mottagna sidorna (; Användarnas förväntningar). Förutom att användningen av cachade sidor gör sökningar snabbare, kan cachade sidor innehålla information som inte längre är tillgänglig någon annanstans.

Sökmotorn arbetar med utdatafilerna som tas emot från indexeraren. Sökmotorn accepterar användarfrågor, bearbetar dem med hjälp av ett index och returnerar sökresultat.

När en användare anger en fråga i en sökmotor (vanligtvis med nyckelord), kontrollerar systemet dess index och returnerar en lista över de mest relevanta webbsidorna (sorterade efter något kriterium), vanligtvis med en kort sammanfattning som innehåller dokumentets titel och ibland delar av texten. Sök indexär byggd med hjälp av en speciell metodik baserad på information utvunnen från webbsidor. Sedan 2007 låter Googles sökmotor dig söka baserat på tid, skapa de dokument du letar efter (ringa menyn "Sökverktyg" och ange tidsintervallet). De flesta sökmotorer stöder användningen av booleska operatorer AND, OR, NOT i frågor, vilket gör att du kan förfina eller utöka listan med sökord. I det här fallet kommer systemet att söka efter ord eller fraser exakt som de skrivits in. Vissa sökmotorer har alternativet ungefärlig sökning, i det här fallet utökar användarna sökområdet genom att ange avståndet till nyckelord. Det finns också konceptuell sökning, där den används Statistisk analys användandet av sökta ord och fraser i texterna på webbsidor. Dessa system gör att frågor kan skrivas på naturligt språk. Ett exempel på en sådan sökmotor är sajten ask com.

Användbarheten av en sökmotor beror på relevansen av sidorna den hittar. Medan miljontals webbsidor kan innehålla ett visst ord eller en viss fras, kan vissa vara mer relevanta, populära eller auktoritativa än andra. De flesta sökmotorer använder rankningsmetoder för att få de "bästa" resultaten till toppen av listan. Sökmotorer avgör vilka sidor som är mer relevanta och i vilken ordning resultat ska visas på olika sätt. Sökmetoder, som själva Internet, förändras över tiden. Så här uppstod två huvudtyper av sökmotorer: system med fördefinierade och hierarkiskt ordnade nyckelord och system där ett inverterat index genereras baserat på textanalys.

De flesta sökmotorer är kommersiella företag som gör vinst genom annonsering i vissa sökmotorer kan du köpa förstaplatser i sökresultat för givna sökord mot en avgift. De sökmotorer som inte tar ut pengar för den ordning de ger resultat tjänar pengar på kontextuell reklam, medan reklambudskap matcha användarens begäran. Sådan reklam visas på en sida med en lista med sökresultat, och sökmotorer tjänar pengar varje gång en användare klickar på reklammeddelanden.

Typer av sökmotorer

Det finns fyra typer av sökmotorer: robot, människodrivna, hybrid och meta.

Bestå av tre delar: sökrobot ("bot", "robot" eller "spindel"), index och sökmotorprogram. En sökrobot behövs för att genomsöka webben och skapa listor med webbsidor. Index - stort arkiv kopior av webbsidor. Mål programvara- utvärdera sökresultat. På grund av det faktum att sökroboten i denna mekanism ständigt utforskar nätverket är informationen mer relevant. De flesta moderna sökmotorer är system av denna typ.
  • mänskligt hanterade system (resurskataloger)
Dessa sökmotorer hämtar listor över webbsidor. Katalogen innehåller adress, titel och kort beskrivning webbplats. Resurskatalogen letar bara efter resultat från sidbeskrivningar som skickats till den av webbansvariga. Fördelen med kataloger är att alla resurser kontrolleras manuellt, därför blir kvaliteten på innehållet bättre jämfört med resultaten som erhålls automatiskt av den första typen av system. Men det finns också en nackdel - uppdatering av katalogdata görs manuellt och kan släpa betydligt efter det verkliga tillståndet. Sidrankningar kan inte ändras direkt. Exempel på sådana system inkluderar Yahoo katalog, dmoz och Galaxy.
  • hybridsystem
Sökmotorer som Yahoo, Google, MSN kombinerar funktionerna hos system som använder sökrobotar och system som drivs av människor.
  • metasystem
Metasökmotorer kombinerar och rangordnar resultaten från flera sökmotorer samtidigt. Dessa sökmotorer var användbara när varje sökmotor hade unikt index, och sökmotorer var mindre "smarta". Eftersom sökningen har förbättrats så mycket nu har behovet av dem minskat. Exempel: MetaCrawler och MSN-sökning.

Sökmotormarknaden

Google är den populäraste sökmotorn i världen med en marknadsandel på 68,69 %. Bing rankas tvåa med en andel på 12,26%.

De mest populära sökmotorerna i världen:

Söksystem Marknadsandel i juli 2014 Marknadsandel i oktober 2014 Marknadsandel i september 2015
Google 68,69 % 58.01 % 69.24%
Baidu 17,17 % 29.06 % 6,48%
Bing 6.22 % 8.01 % 12,26%
Yahoo! 6.74 % 4.01 % 9,19%
AOL 0,13 % 0.21 % 1,11%
Excitera 0.22 % 0,00 % 0.00%
Fråga 0,13 % 0,10 % 0,24%

Asien

I östasiatiska länder och Ryssland Google- inte den mest populära sökmotorn. I Kina är det till exempel mer populärt Soso sökmotor.

I Sydkorea sökportal egen utveckling Naver används av cirka 70 % av Yahoo!  Japan och Yahoo! Taiwan - mest populära system att söka i Japan respektive Taiwan.

Ryssland och ryskspråkiga sökmotorer

Enligt LiveInternet-data i juni 2015 om täckningen av ryskspråkiga sökfrågor:

  • Hela språket:
    • Yahoo! (0,1 %) och sökmotorer som ägs av detta företag: Inktomi,AltaVista, Hela webben
  • Engelsktalande och internationellt:
    • FrågaJeeves(Teoma-motor)
  • Rysktalande - de flesta "ryskspråkiga" sökmotorerna indexerar och söker efter texter på många språk - ukrainska, vitryska, engelska, tatariska och andra. De skiljer sig från ”all-language” system som indexerar alla dokument i rad genom att de främst indexerar resurser som finns i domänzoner där det ryska språket dominerar, eller på andra sätt begränsar sina robotar till ryskspråkiga sajter.

Vissa av sökmotorerna använder externa sökalgoritmer.

Kvantitativ data från Googles sökmotor

Antalet Internetanvändare och sökmotorer och användarkraven för dessa system växer ständigt. För att öka hastigheten på att söka efter nödvändig information innehåller stora sökmotorer Ett stort antal servrar. Servrar är vanligtvis grupperade i servercenter (datacenter). Populära sökmotorer har servercenter utspridda över hela världen.

I oktober 2012 lanserade Google projektet "Where the Internet Lives", där användare ges möjlighet att utforska företagets datacenter.

Googles sökmotor vet följande om driften av datacenter:

  • Den totala kapaciteten för alla Googles datacenter från och med 2011 uppskattades till 220 MW.
  • När Google planerade att öppna ett nytt komplex i Oregon 2008, bestående av tre byggnader med en total yta på 6,5 miljoner kvadratmeter, uppskattade Harper's Magazine att ett så stort komplex skulle förbruka mer än 100 megawatt el, jämförbart med energin konsumtion av en stad med en befolkning på 300 000 människor.
  • Ungefärligt antal Googles servrar 2012 - 1 000 000.
  • Googles utgifter för datacenter uppgick till 1,9 miljarder USD 2006 och 2,4 miljarder USD 2007.

Storleken på World Wide Web som indexerats av Google i december 2014 är cirka 4,36 miljarder sidor.

Sökmotorer som tar hänsyn till religiösa förbud

Global spridning av Internet och ökad popularitet elektroniska apparater i den arabiska och muslimska världen, särskilt i länderna i Mellanöstern och den indiska subkontinenten, bidrog till utvecklingen av lokala sökmotorer som tar hänsyn till islamiska traditioner. Sådana sökmotorer innehåller speciella filter som hjälper användare att undvika att besöka förbjudna webbplatser, till exempel webbplatser med pornografi, och tillåter dem att endast använda de webbplatser vars innehåll inte strider mot den islamiska tron. Strax före den muslimska månaden ramadan, i juli 2013, introducerades världen Halalgoogling- ett system som förser användare med endast halal "korrekta" länkar, som filtrerar sökresultat från andra sökmotorer som Google och Bing. Två år tidigare, i september 2011, lanserades sökmotorn I'mHalal för att tjäna användare i Mellanöstern. Denna söktjänst var dock tvungen att stängas snart, enligt ägaren, på grund av bristande finansiering.

Brist på investeringar och den långsamma teknikspridningen i den muslimska världen har hämmat framstegen och hämmat framgången för en seriös islamisk sökmotor. Misslyckandet med enorma investeringar i muslimska livsstilswebbprojekt, varav ett var Muxlim. Han har samlat in miljontals dollar från investerare som Rite Internet Ventures, och nu – enligt ImHalals sista inlägg innan det lades ner – pitcherar han den tvivelaktiga idén att "nästa Facebook eller Google kanske bara kommer från Mellanöstern om du." stödja vår briljanta ungdom." Men islamiska internetexperter har varit i branschen i många år för att avgöra vad som är eller inte är kompatibelt med sharia, och klassificerat webbplatser som "halal" eller "haram". Alla tidigare och nuvarande islamiska sökmotorer är helt enkelt en speciellt indexerad uppsättning data, eller så är de stora sökmotorer som Google, Yahoo och Bing, med något filtersystem som används för att förhindra användare från att komma åt haram-sajter som sajter om nakenhet, HBT, spelande och alla andra, vars ämne anses vara anti-islamiskt.

Andra trosbaserade sökmotorer inkluderar Jewogle, den judiska versionen av Google, och SeekFind.org, en kristen webbplats som innehåller filter för att skydda användare från innehåll som kan undergräva eller försvaga deras tro.

Personliga resultat och filterbubblor

Många sökmotorer, som Google och Bing, använder algoritmer för att selektivt gissa vilken information en användare skulle vilja se baserat på sin tidigare surfaktivitet. Som ett resultat visar webbplatser endast information som är förenlig med användarens tidigare intressen. Denna effekt kallas "filterbubblan".

Allt detta leder till att användarna får mycket mindre information som strider mot deras åsikter och blir intellektuellt isolerade i sin egen "informationsbubbla". Således kan "bubbeleffekten" ha Negativa konsekvenser att bilda en medborgaropinion.

Sökmotorbias

Även om sökmotorer är programmerade att rangordna webbplatser baserat på någon kombination av popularitet och relevans, indikerar experimentell forskning i verkligheten att olika politiska, ekonomiska och sociala faktorer påverkar sökresultaten.

Sådan partiskhet kan vara ett direkt resultat av ekonomiska och kommersiella processer: företag som annonserar i en sökmotor kan bli mer populära i resultaten regelbunden sökning i det. Att ta bort sökresultat som inte följer lokala lagar är ett exempel på påverkan av politiska processer. Till exempel kommer Google inte att visa vissa nynazistiska webbplatser i Frankrike och Tyskland, där förnekande av förintelsen är olagligt.

Bias kan också bli resultatet av sociala processer, eftersom sökmotorernas algoritmer ofta är utformade för att utesluta oformaterade synpunkter till förmån för mer "populära" resultat. De stora sökmotorernas indexeringsalgoritmer prioriterar amerikanska sajter.

Sökbombningar är ett exempel på ett försök att manipulera sökresultat av politiska, sociala eller kommersiella skäl.

se även

  • Qwika
  • Elektroniskt bibliotek#Listor över bibliotek och sökmotorer
  • Verktygsfält för webbutvecklare

Anteckningar

Litteratur

  • Ashmanov I. S., Ivanov A. A. Marknadsföring av webbplatser i sökmotorer. - M.: Williams, 2007. - 304 sid. - ISBN 978-5-8459-1155-1.
  • Baykov V.D. Internet. Sök efter information. Webbsida marknadsföring. - St. Petersburg. : BHV-Petersburg, 2000. - 288 sid. - ISBN 5-8206-0095-9.
  • Kolisnichenko D.N. Sökmotorer och marknadsföring av webbplatser på Internet. - M.: Dialektik, 2007. - 272 sid. - ISBN 978-5-8459-1269-5.
  • Lande D.V. Söker kunskap på Internet. - M.: Dialektik, 2005. - 272 sid. - ISBN 5-8459-0764-0.
  • Lande D.V., Snarsky A.A., Bezsudnov I.V. Internet: Navigering i komplexa nätverk: modeller och algoritmer. - M.: Librocom (Editorial URSS), 2009. - 264 sid. - ISBN 978-5-397-00497-8.
  • Chu H., Rosenthal M. Sökmotorer for the World Wide Web: En jämförande studie och utvärderingsmetodologi (engelska) // PROCEEDING OF THE ANNUAL MEETING-AMERICAN SOCIETY FOR INFORMATION SCIENCE: journal. - 1996. - Vol. 33. - S. 127-135.
  • Gandal, Neil. Konkurrensens dynamik på marknaden för sökmotorer på internet. - 2001. - Vol. 19. - P. 1103–1117. -

För att framgångsrikt kunna underhålla och utveckla vår blogg måste vi först och främst veta vilka algoritmer de fungerar efter. En tydlig förståelse av svaren på dessa frågor gör det möjligt för oss att framgångsrikt lösa problemen med marknadsföring av webbplatser i sökmotorer. Men samtalet om sökmotoroptimering av webbplatser pågår fortfarande, men för tillfället lite teori om sökmotorer.

Vad är sökmotorer på Internet?

Om vi ​​vänder oss till Wikipedia får vi reda på det här:

"En sökmotor är ett mjukvaru- och hårdvarukomplex med ett webbgränssnitt som ger möjlighet att söka information på Internet."

Och nu på ett språk vi förstår. Låt oss säga att vi akut behöver information om ett visst ämne. För att vi snabbt ska kunna hitta det har sökmotorer skapats - sajter där vi, genom att ange en sökfråga i sökformuläret, får en lista över sajter där vi med stor sannolikhet kommer att hitta det vi letar efter. Denna lista kallas sökresultat. Den kan bestå av miljontals sidor med 10 sajter på varje. Huvuduppgiften för en webbansvarig är att komma in i åtminstone de tio bästa.

Kom ihåg att när du söker efter något på Internet, hittar du det vanligtvis på den första sidan av sökresultaten, och flyttar sällan till den andra, än mindre till efterföljande. Det betyder att ju högre webbplatsen rankas, desto fler besökare kommer att besöka dess sidor. Och hög trafik (antal besökare per dag) är bland annat en möjlighet att göra bra ifrån sig.

Hur hittar internetsökmotorer information på internet och på vilken grund fördelar de platser i sökresultaten?

I några få ord, sökmotor på internet- det här är ett helt nät där spindelrobotar ständigt skannar nätverket och kommer ihåg alla texter som kommer in på Internet. Genom att analysera mottagna data väljer sökmotorer ut dokument som mest motsvarar sökfrågan, dvs relevanta, från vilka sökresultaten bildas.

Det mest intressanta är att sökmotorer inte kan läsa. Så hur hittar de information? Sökmotorernas algoritmer kokar ner till några grundläggande principer. Först och främst uppmärksammar de titeln och beskrivningen av artikeln, styckerubriker, semantiska höjdpunkter i texten och tätheten av sökord, som nödvändigtvis måste motsvara artikelns ämne. Ju mer exakt denna korrespondens, desto högre sökresultat det kommer att finnas en hemsida. Dessutom måste informationsmängden och många andra faktorer beaktas. Till exempel, vilken auktoritet en webbresurs har, vilket beror på antalet och auktoriteten för webbplatser som länkar till den. Ju större auktoritet, desto högre ranking.

En uppsättning åtgärder som syftar till att höja webbplatsens position i sökresultaten för vissa frågor kallas sökmotoroptimering. Nu är detta en hel vetenskap -. Men mer om det senare.

det här ögonblicket Det finns många sökmotorer i världen. Jag ska nämna de mest populära. I väst är dessa: Google, Bing och Yahoo. I Runet - Yandex, Mail.ru, Rambler och Nigma. I grund och botten ger användare företräde till världsledaren och den mest populära inom Ryska språket Internet blev Yandex-systemet.

Lite historia. Google skapades 1997 av en infödd i Moskva Sergey Brin och hans amerikanska vän Larry Page under sina studier vid Stanford University.

Det speciella med Google var att det tog de mest relevanta sökresultaten till de första positionerna i sökresultaten i en logisk sekvens, medan andra sökmotorer var upptagna enkel jämförelse ord i en fråga med ord på en webbsida.

Den 23 september samma år tillkännagavs och Yandex system, som sedan 2000 började existera som ett separat företag "Yandex".

Jag ska inte tråka ut dig mer, jag hoppas att det är lite tydligare nu, vad är sökmotorer på internet. Det är värt att säga att sökmotorernas algoritmer ständigt utvecklas. Varje dag blir sökmotorerna bättre på att identifiera användarnas behov och visa dem de mest relevanta i sökresultaten. relevant information, baserat på många faktorer (region, vilka frågor användaren redan har begärt, vilka webbplatser han besökte under sökprocessen, var han gick ifrån dem, etc.).

Snart kommer Google och Yandex att veta bättre än vi vad vi behöver och vad vi tänker på!

Söksystem- ett mjukvaru- och hårdvarukomplex med ett webbgränssnitt som ger möjlighet att söka information på Internet.

Alla sökmotorer förenas av det faktum att de finns på speciellt dedikerade kraftfulla servrar och är knutna till effektiva kommunikationskanaler. Sökmotorer kallas också för informationshämtningssystem (IRS). Antalet samtidigt betjänade besökare av de mest populära systemen når många tusen. De mest kända betjänar miljontals kunder per dag. I de fall en sökmotor är baserad på en katalog kallas den en katalog. Det är baserat på moderators arbete. Grunden för IRS med fulltextsökning är den automatiska insamlingen av information. Det utförs av speciella program. Dessa program undersöker regelbundet innehållet i alla Internetresurser. För att göra detta rör de sig, eller som de säger, kryper, genom olika resurser. Följaktligen kallas sådana program för robotar. Det finns andra namn: eftersom WWW är en förkortning av uttrycket World Wide Web är det naturligt att kalla ett sådant program för en spindel på engelska. - Spindel. Nyligen har andra namn använts: automatiska index eller kataloger. Alla dessa program utforskar och "laddar ner" information från olika webbadresser. Program av denna typ besöker varje resurs efter en viss tid. Ingen sökmotor kan indexera hela Internet. Därför är databaserna som innehåller adresserna till indexerade resurser olika för olika sökmotorer. Men många av dem strävar efter att om möjligt täcka hela utrymmet på World Wide Web i sitt arbete.

För att söka information med hjälp av en sökmotor formulerar användaren en sökfråga. Baserat på användarens begäran genererar sökmotorn en sökresultatsida. Sådana sökresultat kan kombinera olika typer av filer, till exempel: webbsidor, bilder, videofiler. Vissa sökmotorer hämtar även data från databaser och resurskataloger på Internet.

Baserat på sök- och tjänstemetoder finns det fyra typer av sökmotorer:

1.system som använder sökrobotar.

2. mänskligt kontrollerade system

3.hybridsystem

4.meta-system.

Söksystemets arkitektur inkluderar: en sökrobot som skannar webbplatser, en indexerare som ger snabb sökning och en sökmotor - ett grafiskt gränssnitt för användaren.

Syftet med en sökmotor är att hitta dokument som innehåller antingen nyckelord eller ord som på något sätt är relaterade till nyckelord. Sökmotorn är bättre ju fler dokument den returnerar som är relevanta för användarens fråga.

Exempel på sökmotorer

Google- en av de mest kompletta och populära utländska IPS. En utmärkande egenskap hos Googles IRS är tekniken för att bestämma graden av relevans för ett dokument genom att analysera länkar från andra källor till en given resurs. Ju fler länkar till en sida det finns på andra sidor, desto högre rankas den i Google IRS. Google använder en algoritm för att beräkna PageRank-auktoritet. PageRank är en av hjälpfaktorerna för att rangordna webbplatser i sökresultat. PageRank är inte den enda, men mycket viktigt sätt bestämma webbplatsens position i Googles sökresultat. Google använder PageRank för sidor som hittats för en fråga för att avgöra i vilken ordning dessa sidor presenteras för en besökare i sökresultat. Under 2010 lanserade företaget röstsökning i Ryssland. För att söka måste du trycka på knappen bredvid sökraden på din telefon och säga din fråga, telefonen skickar din röst till servern och webbläsaren visar en rad med din fråga igenkänd och sökresultaten för den.

Yandexär för närvarande den mest populära inhemska sökmotorn. Började arbeta 1997. Den har sin egen katalog över Internetresurser. Också den bästa sökmotorn för att identifiera illustrationer. Den engelska versionen är försedd med en katalog med Internetresurser. Den har ett omfattande system för förfrågningsgenerering. I synnerhet är det tillåtet att ange sökinstruktioner på naturligt språk - i det här fallet görs alla nödvändiga tillägg automatiskt.

Förutom webbsidor i HTML-format indexerar Yandex dokument i PDF (Adobe Acrobat), Rich Text Format (RTF), Word (.doc), Excel (.xls), PowerPoint (.ppt), RSS (bloggar och forum) .

Mail.ru sökmotor började arbeta 2007. Volymen på indexfilen våren 2009 var mer än 1,5 miljarder sidor på ryskspråkiga servrar. Förutom att söka efter texter, söker systemet efter illustrationer och videoklipp som publicerats på specialiserade "självfyllande" ryska servrar: [email protected], Flamber.Ru, 35Photo.ru, PhotoForum.ru, [email protected], RuTube, Loadup, Rambler Vision och liknande. Gogo.ru låter dig begränsa din sökning till kommersiella webbplatser, informationssajter samt forum och bloggar. Formuläret "Avancerad sökning" låter dig också begränsa dina sökningar vissa typer filer (PDF, DOC, XLS, PPT), platsen för sökorden i dokumentet eller en specifik domän. I november 2013 i Google Play en ny version av sökapplikationen från företaget Mail.Ru har dykt upp, som låter dig byta från huvudskärmen till alla sociala nätverk och innehåller snabb åtkomst för att söka efter bilder, videor och nyheter. Android-applikationen har förvandlats till en miniwebbläsare, designad för att effektivt söka efter nödvändig information. Verktyget har också lärt sig att känna igen sökfrågor som inte anges med text, utan med röst. Utvecklarna noterar också att de har skapat en speciell widget som kan placeras på huvudskärm baserad på smartphone eller surfplatta Googles system Android. Det är underförstått att detta kommer att ytterligare minska den tid som ägnas åt att söka.

AltaVista– en av de äldsta sökmotorerna intar en av de första platserna när det gäller dokumentvolym – mer än 350 miljoner. AltaVista tillåter enkla och avancerade sökningar. "Hjälp" tillåter även otränade användare att korrekt komponera enkla och komplexa frågor.

Vandrare– ett av de första ryska systemen för informationshämtning, öppnade 1996. I slutet av 2002 genomfördes en radikal modernisering, varefter Rambler återigen gick in i gruppen av ledare inom nätverkssökning. För närvarande är indexvolymen cirka 150 miljoner dokument. För att komponera komplexa frågor rekommenderas det att använda läget "Detaljerad fråga", som ger stora möjligheter att skapa sökinstruktioner med hjälp av menyalternativ.

APORT. Idag innehåller dess databas mer än 20 miljoner dokument. Systemet har ett brett utbud av sökmöjligheter. APORT har en inbyggd översättarfunktion, detta ger användaren möjlighet att formulera frågor på både ryska och engelska språk. Dessutom har APORT speciella lägen för att söka efter illustrationer och ljudfiler.

Den senaste generationens sökmotorer indexerar alla ord på en webbsida eller i en konferensartikel, medan tidigare omfattningen av indexeringen vanligtvis var begränsad till dokumentets titel, rubriker, första raderna och adress. Detta begränsade avsevärt möjligheten att identifiera material om ett smalt ämne, eftersom sökresultaten inte alltid speglade faktiska data. Genom att eliminera denna brist har moderna sökmotorer blivit mycket mer tillförlitliga än sina föregångare.

Den näst viktigaste funktionen är förbättringen av den interna sökmekanismen, uttryckt i en ökning av antalet operatörer och andra delar av frågekonstruktionen. För några år sedan användes bara två, eller i bästa fall tre klassiska booleska operatorer: AND (och), OR (eller) och NOT (inte). Nu finns det NÄRA (nära, ungefär) i Alta Vista och FÖLJAS AV (följer) i OpenText - i högsta grad användbara distansoperatörer som låter dig göra din fråga så specifik som möjligt. Många system låter dig trunkera ändelserna på termer, begränsa sökningen till det datum då dokumentet skapades, söka efter nyckelord endast i angivna delar av webbsidor (titel, rubriker, e-postadress, etc.), samt söka efter en exakt fras. Den senaste utvecklingen låter dig också upptäcka filer av en viss typ (till exempel grafik eller ljud) och är känsliga för gemener och versaler. Möjligheten att söka efter data på vilket språk som helst börjar bli vanligt. Allt detta gör det möjligt att skapa ett sökrecept med en hög grad av noggrannhet, vilket naturligtvis ökar relevansen av de erhållna resultaten.

För närvarande är de mest populära sökmotorerna Google och Yandex, låt oss jämföra dem:

    Antal sidor indexerade. Google har 8 miljarder och Yandex har bara 2 miljarder. Det vill säga fyra gånger mindre. Seger för Google.

    Sidindexeringshastighet. Google indexerar nya sidor inom 24 timmar, medan Yandex kan ta flera dagar att göra det. Google vinner igen.

    Frågans relevans. Relevans avser överensstämmelsen mellan resultaten som visas på sökmotorsidan och din fråga. Jag ska genast säga att det är svårt att avgöra vinnaren här. Google visade bra resultat i det utländska segmentet av Internet, men i Runet, har Yandex alltid legat lite före.

    Ytterligare Internettjänster. Här tillhör fördelen helt klart Yandex. Den har dussintals olika tjänster som bekvämt är grupperade i kategorier, medan Google har färre av dem, plus att den har integration med sociala medier. Googles nätverk+, som många inte gillar.

En sökmotor är en databas med viss information på internet. Många användare tror att så fort de anger en fråga i en sökmotor genomsöks hela Internet omedelbart, men det är inte alls sant. Internet skannas ständigt, av många program, data om webbplatser läggs in i en databas, där, enligt vissa kriterier, alla webbplatser och alla deras sidor distribueras till olika typer av listor och databaser. Det vill säga, det är ett slags arkivskåp med data, och sökningen sker inte på Internet, utan på detta arkivskåp.

Populära sökmotorer

Yandex är den största sökmotorn i RuNet.

Förutom sökmotorn erbjuder Yandex-företaget 77 ytterligare tjänster, varav de mest populära är Yandex-posttjänsten, Yandex-webbläsaren, Yandex-disken, trafik- och väderinformation, Yandex-pengar och mycket mer. Sökmotorn tar hänsyn till din plats när sökresultaten visas. Också sökprogram uppgraderas ständigt för att ge mer korrekta resultat utformade för att vara så informativa som möjligt för användaren.

Google är den populäraste sökmotorn i världen.

Utöver sökmotorn erbjuder Google många ytterligare tjänster, program och hårdvara, inklusive en e-posttjänst, webbläsaren Google Chrome, det största YouTube-videobiblioteket och många andra projekt. Google köper med tillförsikt upp många projekt som ger stora vinster. De flesta tjänster är inte inriktade på direktanvändare, men för att tjäna pengar på Internet och är integrerad med fokus på europeiska och amerikanska användares intressen.

Mail är en sökmotor som är populär främst på grund av sin e-posttjänst.

Det finns många ytterligare tjänster, vars nyckel är Mail som för närvarande äger det sociala nätverket Odnoklassniki. eget nätverk"My World", pengaposttjänst, många onlinespel, tre nästan identiska webbläsare med olika namn. Alla applikationer och tjänster innehåller mycket reklaminnehåll. Det sociala nätverket VKonatkte blockerar direkta övergångar till Mailtjänster, försvårande stor mängd virus.

Wikipedia.

Wikipedia är ett sökreferenssystem.

Den ideella sökmotorn, som arbetar med privata donationer, fyller därför inte sina sidor med reklam. Ett flerspråkigt projekt vars mål är att skapa ett komplett referensuppslagsverk på alla världens språk. Den har inga specifika författare och färdigställs och hanteras av volontärer från hela världen. Varje användare kan både skriva och redigera en artikel.

Officiell sida- www.wikipedia.org.

Youtube är det största biblioteket av videofiler.

Videohosting med element socialt nätverk, där varje användare kan lägga till en video. Från köptillfället av Google Ink, separat registrering för YouTube krävs inte, registrera dig bara i Googles mailtjänst.

Officiell sida - youtube.com.

Yahoo! är den näst viktigaste sökmotorn i världen.

Tillgängliga ytterligare tjänster, varav den mest kända är Yahoo mail. Som en del av att förbättra kvaliteten på sökmotorn överför Yahoo data om användare och deras frågor till Microsoft företag. Från dessa data bildas en uppfattning om användarnas intressen och en marknad för reklaminnehåll bildas. Yahoos sökmotor, som , är engagerad i förvärv av andra företag, till exempel tillhör Yahoo söktjänst Altavista och hemsida e-handel Alibaba.

Officiell sida - www.yahoo.com.

WDL är ett digitalt bibliotek.

Biblioteket samlar in böcker som ger kulturellt värde V digital form. Huvudmålet är att öka nivån på kulturellt innehåll på Internet. Tillgång till biblioteket är gratis.

Officiell sida - www.wdl.org/ru/.

Bing är en sökmotor från Microsoft.

Officiell sida - www.baidu.com.

Sökmotorer i Ryssland

Rambler är en "pro-amerikansk" sökmotor.

Ursprungligen skapades den som en internetmediaportal. Precis som många andra sökmotorer har den söktjänster för bilder, videofiler, kartor, väderprognoser, en nyhetsavdelning och mycket mer. Publishers erbjuder också en gratis webbläsare, Rambler-Nichrome.

Officiell sida - www.rambler.ru.

Nigma är en intelligent sökmotor.

En mer bekväm sökmotor på grund av närvaron av många filter och inställningar. Gränssnittet låter dig inkludera eller utesluta föreslagna liknande värden i sökningen för att få bättre resultat. När du tar emot ett sökresultat kan du också använda information från andra stora sökmotorer.

Officiell sida - www.nigma.ru.

Aport - online produktkatalog.

Tidigare en sökmotor, men efter att utveckling och innovation stoppades tappade den snabbt mark och . I för närvarande Aport är handelsplattform, där produkterna från mer än 1 500 företag presenteras.

Officiell sida - www.aport.ru.

Sputnik är en nationell sökmotor och internetportal.

Skapad av Rostelecom. För närvarande i teststadiet.

Officiell sida - www.sputnik.ru.

Metabot är en växande sökmotor.

Metabots uppgifter är att skapa en sökmotor för alla andra sökmotorer, skapa resultatpositioner med hänsyn till data från hela listan med sökmotorer. Det vill säga att det är en sökmotor för sökmotorer.

Officiell sida - www.metabot.ru.

Sökmotorn har stängts av.

Officiell sida - www.turtle.ru.

KM är en multiportal.

Till en början var sajten en multiportal med efterföljande introduktion av en sökmotor. Sökningen kan utföras både inom webbplatsen och på alla övervakade RuNet-sajter.

Officiell sida - www.km.ru.

Gogo - fungerar inte, omdirigerar till en sökmotor.

Officiell sida - www.gogo.ru.

Den ryska multiportalen, inte särskilt populär, kräver förbättring. Sökmotorn innehåller nyheter, tv, spel och en karta.

Officiell sida - www.zoneru.org.

Sökmotorn fungerar inte, utvecklarna föreslår att du använder sökmotorn.

Officiell sida - www.au.ru.