1 hva er en søkemotor. Søkemotorer: sammensetning, funksjoner, arbeidsprinsipper. En kort historie om utviklingen av søkemotorer

Internett er nødvendig for mange brukere for å få svar på forespørslene (spørsmålene) de legger inn.

Hvis det ikke fantes noen søkemotorer, ville brukerne selv måtte søke etter de nødvendige nettstedene, huske dem, skrive dem ned. I mange tilfeller vil det være svært vanskelig å finne noe som passer "manuelt", og ofte ganske enkelt umulig.

For oss gjøres alt dette rutinearbeidet med å finne, lagre og sortere informasjon på nettsteder av søkemotorer.

La oss begynne med kjente søkemotorer Runet.

Søkemotorer på Internett på russisk

1) La oss starte med den innenlandske søkemotoren. Yandex fungerer ikke bare i Russland, men jobber også i Hviterussland og Kasakhstan, i Ukraina, i Tyrkia. Det er også Yandex på engelsk.

2) Google søkemotor kom til oss fra Amerika, har en russiskspråklig lokalisering:

3) Innenlandsk søkemotor Mail.ru, som samtidig representerer det sosiale nettverket VKontakte, Odnoklassniki, også My World, de berømte Mail.ru Answers og andre prosjekter.

4) Intelligent søkemotor

Nigma (Nigma) http://www.nigma.ru/

Siden 19. september 2017 fungerer ikke det "intellektuelle" niggmaet. Det sluttet å være av økonomisk interesse for skaperne, de byttet til en annen søkemotor kalt CocCoc.

5) Det kjente selskapet Rostelecom har laget søkemotoren Sputnik.

Det er en søkemotor Sputnik, designet spesielt for barn, som jeg skrev om.

6) Rambler var en av de første innenlandske søkemotorene:

Det finnes andre kjente søkemotorer i verden:

  • Bing,
  • Yahoo!,
  • DuckDuckGo,
  • Baidu,
  • Ecosia,

La oss prøve å finne ut hvordan søkemotoren fungerer, nemlig hvordan nettsteder indekseres, analysen av indekseringsresultater og dannelsen av søkeresultater. Arbeidsprinsippene til søkemotorer er omtrent de samme: søk etter informasjon på Internett, lagring og sortering for utstedelse som svar på brukerforespørsler. Men algoritmene som søkemotorer fungerer med kan være svært forskjellige. Disse algoritmene holdes hemmelige og avsløring er forbudt.

Ved å legge inn det samme søket i søkestrenger forskjellige søkemotorer, kan du få forskjellige svar. Årsaken er at alle søkemotorer bruker sine egne algoritmer.

Formålet med søkemotorer

Først av alt må du vite at søkemotorer er kommersielle organisasjoner. Målet deres er å tjene penger. Fortjeneste kan mottas fra kontekstuell annonsering, andre typer annonsering, fra å markedsføre de ønskede nettstedene til topplinjer utstedelse. Generelt er det mange måter.

Det avhenger av hvor stor målgruppe han har, det vil si hvor mange som bruker denne søkemotoren. Jo større publikum, jo mer folk vil bli vist annonser. Følgelig vil denne annonsen koste mer. Søkemotorer kan øke publikum gjennom egen annonsering, samt ved å tiltrekke brukere ved å forbedre kvaliteten på tjenestene deres, algoritmen og søkevennligheten.

Den viktigste og vanskeligste delen her er utviklingen av en fullt funksjonell søkealgoritme som vil gi relevante resultater for de fleste brukersøk.

Søkemotorarbeid og handlinger til webmastere

Hver søkemotor har sin egen algoritme, som må ta hensyn til et stort antall forskjellige faktorer når man analyserer informasjon og kompilerer resultater som svar på en brukers forespørsel:

  • alderen til et bestemt nettsted,
  • nettstedets domeneegenskaper,
  • kvaliteten på innholdet på nettstedet og dets typer,
  • funksjoner for navigasjon og nettstedsstruktur,
  • brukervennlighet (bekvemmelig for brukere),
  • atferdsfaktorer (søkemotoren kan avgjøre om brukeren fant det han lette etter på nettstedet eller om brukeren kom tilbake til søkemotoren igjen og det er igjen på jakt etter et svar på det samme spørsmålet)
  • etc.

Alt dette er nødvendig nettopp for at utgangen på brukerens forespørsel skal være så relevant som mulig, og tilfredsstille brukerens behov. Samtidig er søkemotorens algoritmer i stadig endring og raffinering. Som de sier, det er ingen grense for perfeksjon.

På den annen side finner webmastere og SEO-er stadig opp nye måter å markedsføre sidene sine på, som ikke alltid er rettferdige. Oppgaven til algoritmeutviklerne søkemotorer- gjør endringer i det, som ikke vil tillate "dårlige" nettsteder med uærlige optimaliserere å være i TOPPEN.

Hvordan fungerer en søkemotor?

Hvordan går det nå direkte arbeid søkemotor. Den består av minst tre stadier:

  • skanning,
  • indeksering,
  • spenner.

Antall nettsteder på Internett er rett og slett astronomisk. Og hvert nettsted er informasjon informasjonsinnhold, som er laget for lesere (levende mennesker).

Skanning

Dette er en søkemotor som vandrer rundt på Internett for å samle inn ny informasjon, analysere lenker og finne nytt innhold som kan brukes til å vise brukeren som svar på hans forespørsler. For skanning har søkemotorer spesielle roboter kalt søkeroboter eller edderkopper.

Søkeroboter er programmer som automatisk modus besøke nettsider og samle informasjon fra dem. Skanning kan være primær (roboten går inn på et nytt nettsted for første gang). Etter den første innsamlingen av informasjon fra nettstedet og lagt den inn i søkemotorens database, begynner roboten å besøke sidene sine med en viss regelmessighet. Hvis det er noen endringer (lagt til nytt innhold, slettet den gamle), vil alle disse endringene bli registrert av søkemotoren.

Hovedoppgaven til søkeedderkoppen er å finne ny informasjon og gi den til søkemotoren for neste trinn av behandlingen, det vil si for indeksering.

Indeksering

Søkemotoren kan søke etter informasjon bare blant de nettstedene som allerede er lagt inn i databasen (indeksert av den). Hvis skanning er prosessen med å søke og samle informasjon som er tilgjengelig på et bestemt nettsted, er indeksering prosessen med å legge inn denne informasjonen i søkemotorens database. På dette stadiet bestemmer søkemotoren automatisk om den eller den informasjonen skal legges inn i databasen og hvor den skal legges inn, i hvilken del av databasen. For eksempel indekserer Google nesten all informasjon funnet av robotene sine på Internett, mens Yandex er mer kresen og ikke indekserer alt.

For nye nettsteder kan indekseringsstadiet være langt, så nye nettsteder kan vente lenge på besøkende fra søkemotorer. Og ny informasjon som vises på gamle, godt promoterte nettsteder kan indekseres nesten umiddelbart og nesten umiddelbart komme inn i "indeksen", det vil si i databasen med søkemotorer.

Rangering

Rangering er byggingen av informasjon som tidligere ble indeksert og lagt inn i basen av denne eller den søkemotoren, etter rangering, det vil si hvilken informasjon søkemotoren vil vise til brukerne i utgangspunktet, og hvilken informasjon som skal plasseres i "rangeringen" nedenfor. Rangering kan tilskrives tjenestestadiet av søkemotoren til klienten - brukeren.

På serverne til søkemotoren behandles den mottatte informasjonen og resultatene genereres for et stort utvalg av alle slags forespørsler. Det er her søkemotoralgoritmene kommer inn i bildet. Alle nettsteder som er inkludert i databasen er klassifisert etter emner, emner er delt inn i grupper av forespørsler. For hver av forespørsgruppene kan det utarbeides en foreløpig problemstilling som i ettertid justeres.

Hva er det

DuckDuckGo er en ganske kjent åpen kildekode-søkemotor. kildekode... Serverne er lokalisert i USA. I tillegg til sin egen robot, bruker søkemotoren resultatene fra andre kilder: Yahoo, Bing, Wikipedia.

Jo bedre

DuckDuckGo posisjonerer seg som en søkemotor som gir maksimalt personvern og konfidensialitet. Systemet samler ingen brukerdata, lagrer ikke logger (ingen søkehistorikk), bruken av informasjonskapsler er så begrenset som mulig.

DuckDuckGo samler ikke inn personlig informasjon brukere og deler den ikke. Dette er vår personvernerklæring.

Gabriel Weinberg, grunnlegger av DuckDuckGo

Hvorfor trenger du det

Alle store søkemotorer prøver å tilpasse basert på dataene om personen foran skjermen. Dette fenomenet kalles "filterboblen": brukeren ser bare de resultatene som er i samsvar med hans preferanser eller som systemet vurderer som sådan.

DuckDuckGo skaper et objektivt bilde som ikke er avhengig av din tidligere oppførsel på nettet, og eliminerer tematikk Google Ads og Yandex basert på dine spørsmål. DuckDuckGo gjør det enkelt å søke etter informasjon på fremmedspråk: Google og Yandex foretrekker som standard russiskspråklige nettsteder, selv om forespørselen er skrevet inn på et annet språk.


Hva er det

not Evil er et system som søker etter anonymt nettverk Tor. For å bruke det, må du gå til dette nettverket, for eksempel ved å starte et spesialisert nettverk med samme navn.

not Evil er ikke den eneste søkemotoren i sitt slag. Det er en LOOK (standardsøk i Tor-nettleseren, tilgjengelig fra vanlig internett) eller TORCH (en av de eldste søkemotorene i Tor-nettverket) og andre. Vi bestemte oss for ikke Evil på grunn av det entydige hintet av Google (bare se på startsiden).

Jo bedre

Søk der Google, Yandex og andre søkemotorer er stengt i prinsippet.

Hvorfor trenger du det

Det er mange ressurser på Tor-nettverket som ikke kan finnes på det lovlydige Internett. Og antallet deres vil vokse etter hvert som regjeringen strammer kontrollen over innholdet på nettet. Tor er et slags nettverk innenfor nettverket med egne sosiale nettverk, torrent-trackere, media, markedsplasser, blogger, biblioteker og så videre.

3. YaCy

Hva er det

YaCy er en desentralisert søkemotor basert på P2P-nettverk. Hver datamaskin som den viktigste programmodul, skanner Internett på egen hånd, det vil si at det er analogt med søkerobot... Resultatene er samlet i felles base som brukes av alle medlemmer av YaCy.

Jo bedre

Det er vanskelig å si om det er bedre eller dårligere her, siden YaCy er en helt annen tilnærming til organisering av søk. Fraværet av en enkelt server og bedriftseier gjør resultatene helt uavhengige av noens preferanser. Autonomien til hver node utelukker sensur. YaCy er i stand til å søke på dypnettet og ikke-indekserte offentlige nettverk.

Hvorfor trenger du det

Hvis du er tilhenger av åpen kildekode og gratis internett, upåvirket av offentlige etater og store selskaper, da er YaCy ditt valg. Den kan også brukes til å organisere søk innenfor et bedriftsnettverk eller annet autonomt nettverk. Og selv om YaCy ikke er veldig nyttig i hverdagen, er det det verdig alternativ Google når det gjelder søkeprosessen.

4. Pipl

Hva er det

Pipl er et system utviklet for å søke etter informasjon om en bestemt person.

Jo bedre

Forfatterne av Pipl hevder at deres spesialiserte algoritmer søker mer effektivt enn "vanlige" søkemotorer. Prioriterte informasjonskilder er særlig profiler i sosiale medier, kommentarer, deltakerlister og ulike databaser hvor informasjon om personer publiseres, for eksempel databaser over rettsavgjørelser. Pipls lederskap på dette området bekreftes av vurderinger fra Lifehacker.com, TechCrunch og andre publikasjoner.

Hvorfor trenger du det

Hvis du trenger å finne informasjon om en person som bor i USA, vil Pipl være mye mer effektiv enn Google... Databasene til russiske domstoler er tilsynelatende utilgjengelige for en søkemotor. Derfor takler han ikke innbyggerne i Russland så godt.

Hva er det

FindSounds er en annen spesialisert søkemotor. Søker etter forskjellige lyder (hus, natur, biler, mennesker osv.) i åpne kilder... Tjenesten støtter ikke spørringer på russisk, men det er en imponerende liste over russiskspråklige tagger du kan søke etter.

Jo bedre

Resultatene er bare lyder og ingenting mer. I søkeinnstillingene kan du stille inn ønsket format og lydkvalitet. Alle funnet lyder er tilgjengelige for nedlasting. Det søkes etter lyder etter mønster.

Hvorfor trenger du det

Hvis du raskt trenger å finne lyden av et muskettskudd, slagene til en sugende hakkespett eller skriket til Homer Simpson, så er denne tjenesten for deg. Og vi valgte dette bare fra de tilgjengelige russiskspråklige forespørslene. På engelsk er spekteret enda bredere.

Men seriøst, spesialisert tjeneste forutsetter spesialisert publikum... Men hva om det kommer godt med?

Hva er det

Wolfram | Alpha er en beregningsbasert søkemotor. I stedet for linker til artikler som inneholder søkeord, gir det et klart svar på brukerens forespørsel. Hvis du for eksempel skriver inn «sammenlign populasjonene i New York og San Francisco» på engelsk i søkeskjemaet, vil Wolfram | Alpha umiddelbart vise tabeller og grafer med en sammenligning.

Jo bedre

Denne tjenesten er bedre enn andre for å finne fakta og beregne data. Wolfram | Alpha samler inn og organiserer kunnskapen som er tilgjengelig på nettet fra ulike områder inkludert vitenskap, kultur og underholdning. Hvis denne databasen inneholder et ferdig svar på et søk, viser systemet det, hvis ikke, beregner det og viser resultatet. I dette tilfellet ser brukeren bare nødvendig informasjon og ingenting overflødig.

Hvorfor trenger du det

Hvis du for eksempel er student, analytiker, journalist eller forsker, kan du bruke Wolfram | Alpha til å finne og beregne data relatert til arbeidet ditt. Tjenesten forstår ikke alle forespørsler, men den utvikler seg hele tiden og blir smartere.

Hva er det

Dogpile-metasøkemotoren viser en kombinasjonsboks med resultater fra Søkeresultater Google, Yahoo og andre populære systemer.

Jo bedre

For det første viser Dogpile færre annonser. For det andre bruker tjenesten en spesiell algoritme for å finne og vise de beste resultatene fra forskjellige søkemotorer. Ifølge utviklerne av Dogpile er systemene deres formet av de fleste full utgave over hele internett.

Hvorfor trenger du det

Hvis du ikke finner informasjon i Google eller en annen standard søkemotor, søk etter den i flere søkemotorer samtidig ved å bruke Dogpile.

Hva er det

BoardReader er et system for tekstsøk på fora, spørsmål og svar-tjenester og andre fellesskap.

Jo bedre

Tjenesten lar deg begrense søkefeltet til sosiale plattformer... Takket være spesielle filtre kan du raskt finne innlegg og brukerkommentarer som samsvarer med dine kriterier: språk, publiseringsdato og nettstedsnavn.

Hvorfor trenger du det

BoardReader kan være nyttig for PR-spesialister og andre mediefolk som er interessert i meningene til et massepublikum om visse saker.

Endelig

Livet til alternative søkemotorer er ofte flyktig. Lifehacker spurte Sergei Petrenko, den tidligere generaldirektøren for den ukrainske avdelingen av Yandex, om de langsiktige utsiktene for slike prosjekter.


Sergey Petrenko

Tidligere daglig leder Yandex.Ukraina.

Når det gjelder skjebnen til alternative søkemotorer, er det enkelt: å være veldig nisjeprosjekter med et lite publikum, derfor uten klare kommersielle utsikter, eller omvendt, med fullstendig klarhet om deres fravær.

Hvis du ser på eksemplene i artikkelen, kan du se at slike søkemotorer enten spesialiserer seg på en smal, men etterspurt nisje, som kanskje bare så langt ikke har vokst nok til å bli merkbar på Google eller Yandex radarer, eller de tester ut en original hypotese i rangering som ennå ikke er aktuelt i vanlig søk.

For eksempel, hvis et søk på Tor plutselig viser seg å være etterspurt, det vil si at resultater derfra vil være nødvendige i det minste av en prosentandel av Googles publikum, så vil selvfølgelig vanlige søkemotorer begynne å løse problemet med hvordan for å finne og vise dem til brukeren. Hvis publikumsatferden viser at resultatene virker mer relevante for en betydelig andel brukere i et betydelig antall søk, data uten å ta hensyn til brukeravhengige faktorer, vil Yandex eller Google begynne å gi slike resultater.

"Å bli bedre" i sammenheng med denne artikkelen betyr ikke "å bli bedre i alt". Ja, i mange aspekter er heltene våre langt fra Google og Yandex (selv Bing er langt unna). Men på den annen side gir hver av disse tjenestene brukeren noe som gigantene i søkebransjen ikke kan tilby. Du kjenner sikkert også til lignende prosjekter. Del med oss ​​- vi diskuterer.

V i fjor tjenester fra Google og Yandex har blitt en del av livet vårt. I denne forbindelse lurer nok mange på hva en søkemotor er? Snakker med enkle ord, dette er programvaresystem, designet for å søke etter informasjon i Verdensomspennende Web. Resultatene presenteres vanligvis i form av en liste, ofte kalt søkeresultatsider (SERP). Informasjon kan være en kombinasjon av nettsider, bilder og andre typer filer. Noen søkemotorer inneholder også informasjon tilgjengelig i databaser eller åpne kataloger.

I motsetning til nettkataloger, som kun støttes av deres egne redaktører, inneholder søkemotorer også informasjon i sanntid ved å kjøre algoritmen på webcrawleren.

Opprinnelseshistorie

Selve søkemotorene dukket opp tidligere verdensomspennende nettverk- i desember 1990. Den første slike tjeneste ble kalt Archie, og den slo opp innholdet i FTP-filer ved kommando.

Hva er en Internett-søkemotor? Fram til september 1993 ble World Wide Web fullstendig indeksert for hånd. Det var en liste over webservere redigert av Tim Berners-Lee som var vert på CERN-nettserveren. Ettersom flere og flere servere gikk online, kunne ikke tjenesten ovenfor holde tritt med å behandle en slik mengde informasjon.

En av de første søkemotorene basert på nettsøk var WebCrawler, som kom ut i 1994. I motsetning til forgjengerne, tillot det brukere å søke etter et hvilket som helst ord på hvilken som helst nettside. Denne algoritmen har siden blitt standarden for alle store søkemotorer. Det var også den første avgjørelsen som er allment kjent for offentligheten. Også i 1994 ble Lycos-tjenesten lansert, som senere ble et stort kommersielt prosjekt.

Like etterpå dukket det opp mange søkemotorer og deres popularitet vokste betydelig. Disse inkluderer Magellan, Excite, Infoseek, Inktomi, Northern Light og AltaVista. Yahoo! var en av de mest populære måter finne websider av interesse, men søkealgoritmen fungerte i sin egen nettkatalog, ikke fulltekstkopier av sidene. Informasjonssøkere kan også bla gjennom katalogen i stedet for å søke etter nøkkelord.

En ny runde med utvikling

Google omfavner ideen om å selge søk i 1998, og startet med et lite selskap goto.com. Flyttingen hadde en betydelig innvirkning på SEO-virksomheten, som over tid ble en av de mest lønnsomme aktivitetene på Internett.

Rundt 2000 ble søkemotoren Google viden kjent. Selskapet har oppnådd bedre resultater for mange søk gjennom en innovasjon kalt PageRank. Denne iterative algoritmen evaluerer nettsider basert på lenkene deres til andre nettsteder og sider, forutsatt at gode eller ønskelige kilder ofte siteres av andre. Google opprettholdt også et minimalistisk grensesnitt for søkemotoren sin. Tvert imot har mange av konkurrentene bygget inn en søkemotor i nettportalen. Faktisk har Google blitt så populært at useriøse motorer som Mystery Seeker har dukket opp. I dag er det mange regionale versjoner av denne tjenesten, spesielt søkemotoren Google.ru, designet for russisktalende brukere.

Hvordan fungerer disse tjenestene?

Hvordan fungerer rangering og levering av resultater? Hva er søkemotorer i form av en handlingsalgoritme? De mottar informasjon gjennom webcrawling fra nettsted til nettsted. Roboten eller "edderkoppen" sjekker standard navn robots.txt-fil adressert til den, før du sender viss informasjon for indeksering. Den fokuserer på mange faktorer, nemlig overskrifter, sideinnhold, JavaScript, Cascading Style Sheets (CSS) og standard markering HTML-innhold eller metadata i HTML-metakoder.

Indeksering betyr å koble ord og andre identifiserbare symboler som finnes på nettsider til deres domenenavn og felt på HTML basert... Foreninger opprettes i offentlig database data tilgjengelig for nettsøk. En forespørsel fra en bruker kan være ett ord. Indeksen hjelper deg å finne informasjon relatert til et søk så raskt som mulig.

Noen av indekserings- og hurtigbufringsteknikkene er forretningshemmeligheter, mens webcrawling er en enkel prosess for å besøke alle nettsteder på en systematisk måte.

Mellom besøk til roboten lagres den hurtigbufrede versjonen av siden (del av eller alt innholdet som kreves for å vise det), i Arbeidsminne søkemotoren sendes raskt til den spørrende brukeren. Hvis besøket er forsinket, kan søkemotoren ganske enkelt fungere som en webproxy. I dette tilfellet kan siden avvike fra søkeindeksene. Den hurtigbufrede kilden viser versjonen hvis ord er indeksert, så det kan være nyttig hvis den faktiske siden har gått tapt.

Arkitektur på høyt nivå

Vanligvis legger en bruker inn et søk i en søkemotor i form av flere nøkkelord. Indeksen har allerede navnene på nettstedene som inneholder disse søkeordene, og de vises umiddelbart. Den virkelige belastningen ligger i å lage nettsider som er en liste over søkeresultater. Hver side i hele listen skal rangeres i henhold til informasjonen i indeksene.

I dette tilfellet krever det øverste elementet i resultatet søk, rekonstruering og merking av tekstutdrag som viser kontekst fra de samsvarende søkeordene. Dette er bare en del av behandlingen av hver nettside i søkeresultatene, og påfølgende sider (ved siden av) krever det meste av denne etterbehandlingen.

I tillegg til enkle søkeordsøk, tilbyr søkemotorer sine egne GUI eller kommandodrevne operatører og søkeparametere for å avgrense resultatene.

De gir de nødvendige kontrollene til brukeren gjennom en sløyfe tilbakemelding, ved å filtrere og veie når du spesifiserer de nødvendige dataene, tatt i betraktning hjemmesider første søkeresultater. Siden 2007 har Google.com for eksempel gjort det mulig å filtrere resultatlisten etter dato ved å klikke Vis søkeverktøy i kolonnen lengst til venstre på den opprinnelige resultatsiden og deretter velge ønsket datoperiode.

Varierende forespørsler

De fleste søkemotorer støtter bruk av logisk OG operatører, ELLER og IKKE for å hjelpe sluttbrukere avklare forespørselen. Noen operatører er for bokstaver, som lar brukeren avgrense og utvide søkeordene. Roboten søker etter ord eller fraser på samme måte som de angitte kommandoene. Noen søkemotorer tilbyr avansert søkefunksjonalitet som lar brukere bestemme avstanden mellom søkeord.

Det er også konseptbasert søk, der forskning innebærer bruk av Statistisk analyse på sider som inneholder ordene eller setningene du leter etter. I tillegg lar spørringer på naturlig språk brukeren legge inn et spørsmål på samme måte som de ville spurt en person (spesielt ask.com).

Nytten til en søkemotor avhenger av relevansen til settet med resultater den produserer. Det kan være millioner av nettsider som inneholder et bestemt ord eller uttrykk, men noen kan være mer relevante, populære eller autoritative enn andre. De fleste søkemotorer bruker rangeringsteknikker for å gi best mulig resultater.

Hvordan en søkemotor bestemmer hvilke sider som passer best for et søk, og i hvilken rekkefølge de funnet kildene skal vises, varierer veldig fra robot til robot. Disse metodene endres også over tid ettersom bruken av Internett endres og nye teknologier utvikles.

Hva er en søkemotor: varianter

Det er to hovedtyper søkemotorer. Det første er et system med forhåndsdefinerte og hierarkisk ordnede nøkkelord som folk har programmert massivt inn i det. Det andre er et system som genererer en "invertert indeks" ved å analysere de funnet tekstene.

De fleste søkemotorer er kommersielle tjenester som støttes av annonseinntekter, og som sådan lar noen av dem annonsører rangere i de viste resultatene mot en avgift. Tjenester som ikke aksepterer penger for rangeringer tjener penger ved å lansere kontekstuelle annonser ved siden av de viste nettstedene. I dag er markedsføring i søkemotorer en av de mest lukrative inntektene på nettet.

Hvilke tjenester er mest utbredt?

Google er den mest populære søkemotoren i verden med en markedsandel på 80,52 % per mars 2017.

  • Google – 80,52 %
  • Bing - 6,92 %
  • Baidu - 5,94 %
  • Yahoo! - 5,35 %

Søkemotorer i Russland og Øst-Asia

I Russland og noen østasiatiske land er ikke Google den mest populære tjenesten. Blant russiske brukere er Yandex-søkemotoren ledende i popularitet (61,9 %) sammenlignet med Google (28,3 %). I Kina er Baidu mest populær tjeneste. Søk portal Sør-Korea – Naver brukes til 70 % av landets nettsøk. Også Yahoo! i Japan og Taiwan er mest populært middel for å finne dataene du trenger.

Andre kjente russiske søkemotorer er Mail og Rambler. Med begynnelsen av utviklingen av Runet nøt de stor popularitet, men for tiden har de mistet posisjonene sine sterkt.

Søkebegrensninger og kriterier

Selv om søkemotorer er programmert til å rangere nettsteder basert på noe av deres popularitet og relevans, empirisk forskning angi ulike politiske, økonomiske og sosiale kriterier for å velge informasjonen de gir. Disse skjevhetene kan være et direkte resultat av økonomiske (for eksempel kan selskaper som annonserer en søkemotor også bli mer populære i resultatene vanlig søk) og politiske prosesser (for eksempel fjerning av søkeresultater i samsvar med lokale lover). Google vil for eksempel ikke vise noen nynazistiske nettsteder i Frankrike og Tyskland, der Holocaust-fornektelse er ulovlig.

Kristne, islamske og jødiske søkemotorer

Den globale veksten av Internett og elektroniske midler Mediedekning i den muslimske verden det siste tiåret har fått islamske tilhengere i Midtøsten og det asiatiske subkontinentet til å prøve å lage sine egne søkemotorer og filtrerte portaler som lar brukere søke trygt.

Slike tjenester inneholder filtre som videre klassifiserer nettsteder som "halal" eller "haram" basert på moderne eksperttolkninger av "Islams lov".

ImHalal var online i september 2011 og Halalgoogling i juli 2013. De bruker haram-filtre basert på algoritmer fra Google og Bing.

Andre religionsorienterte søkemotorer er Jewgle (jødisk google versjon) samt Christian SeekFind.org. De filtrerer nettsteder som benekter eller nedvurderer deres tro.

Søkesystem- et programvare- og maskinvarekompleks med et webgrensesnitt, som gjør det mulig å søke etter informasjon på Internett.

Alle søkemotorer er forent av det faktum at de er plassert på dedikerte kraftige servere og er knyttet til effektive kommunikasjonskanaler. Søkemotorer kalles også (ISS). Antallet samtidig betjente besøkende til de mest populære systemene når mange tusen. De mest kjente betjener millioner av kunder per dag. I tilfeller der en søkemotor er katalogbasert, kalles den en katalog. Den er basert på moderators arbeid. I hjertet av ISS med fulltekstsøk er automatisk innsamling av informasjon. Det utføres av spesielle programmer. Disse programmene undersøker med jevne mellomrom innholdet i alle Internett-ressurser. For å gjøre dette beveger de seg, eller som de sier, kryper over forskjellige ressurser. Følgelig kalles slike programmer roboter. Det er andre navn: siden WWW er en forkortelse av uttrykket World Wide Web, er det naturlig å kalle et slikt program en edderkopp på engelsk. - Edderkopp. Nylig har andre navn blitt brukt: automatiske indekser eller kataloger. Alle disse programmene undersøker og "laster ned" informasjon fra forskjellige nettadresser. Programmer av denne typen besøker hver ressurs etter en viss tid. Ingen søkemotor er i stand til å indeksere hele Internett. Derfor er databasene der adressene til de indekserte ressursene er samlet inn forskjellige for forskjellige søkemotorer. Likevel streber mange av dem, om mulig, for å dekke hele verdensveven i sitt arbeid.

For å søke etter informasjon ved hjelp av en søkemotor, formulerer brukeren et søk. Basert på brukerens forespørsel genererer søkemotoren en søkeresultatside. Slike søkeresultater kan kombinere ulike typer filer, for eksempel: nettsider, bilder, videofiler. Noen søkemotorer henter også data fra databaser og ressurskataloger på Internett.

I henhold til søke- og tjenestemetoder er fire typer søkemotorer delt inn:

1. Systemer som bruker søkeroboter.

2.menneskekontrollerte systemer

3.hybridsystemer

4.metasystemer.

Arkitekturen til søkemotoren inkluderer: en søkerobot som gjennomsøker internettsider, en indeksering som gir raskt søk, og en søkemotor, et grafisk grensesnitt for brukeren.

Formålet med en søkemotor er å finne dokumenter som inneholder enten nøkkelord eller ord på noen måte relatert til nøkkelord. Søkemotoren er jo bedre, jo flere dokumenter som er relevante for brukerens søk, vil den returnere.

Eksempler på søkemotorer

Google- en av de mest komplette og populære utenlandske IPS. Et særtrekk ved Google ISS er teknologien for å bestemme graden av relevans til et dokument ved å analysere koblinger fra andre kilder til denne ressursen. Jo flere lenker til en side det er på andre sider, jo høyere er rangeringen i Google IPS. Google bruker en algoritme for å beregne PageRank-autoriteten. PageRank er en av bidragsyterne til rangeringen av nettsteder i søkeresultatene. PageRank er ikke den eneste, men veldig viktig måte bestemme plasseringen av nettstedet i Googles søkeresultater. Google bruker PageRank for sider det søkes etter for å bestemme rekkefølgen disse sidene vises i søkeresultatene. I 2010 lanserte Google stemmesøk i Russland. For å utføre et søk, må du trykke på knappen på telefonen ved siden av søkefeltet og si forespørselen din, telefonen vil sende stemmen din til serveren, og nettleseren vil vise en linje med din gjenkjente forespørsel og søkeresultater for den.

Яndex Er for tiden den mest populære innenlandske søkemotoren. Begynte å jobbe i 1997. Den har sin egen katalog over Internett-ressurser. Det er også den beste søkemotoren for å identifisere illustrasjoner. Den engelskspråklige versjonen er utstyrt med en katalog over Internett-ressurser. Har et omfattende system for å generere en forespørsel. Spesielt er det tillatt å legge inn en søkeresept på et naturlig språk - i dette tilfellet gjøres alle nødvendige utvidelser automatisk.

I tillegg til HTML-nettsider, indekserer Yandex dokumenter i PDF (Adobe Acrobat), Rich Text Format (RTF), binært Word (.doc), Excel (.xls), PowerPoint (.ppt), RSS (blogger og fora).

Søkemotorselskapet Mail.ru begynte å jobbe i 2007. Volumet av indeksfilen våren 2009 var mer enn 1,5 milliarder sider plassert på russiskspråklige servere. I tillegg til å søke etter tekster, søker systemet etter illustrasjoner og videoklipp lagt ut på spesialiserte "selvfylte" russiske servere: Photo @ Mail.Ru, Flamber.Ru, 35Photo.ru, PhotoForum.ru, Video @ Mail.Ru, RuTube, Loadup, Rambler Vision og lignende. Gogo.ru lar deg begrense søket til kommersielle nettsteder, informasjonssider, samt fora og blogger. Skjemaet "Avansert søk" lar deg også begrense søk visse typer filer (PDF, DOC, XLS, PPT), plasseringen av søkeordene i dokumentet eller et spesifikt domene. I november 2013 dukket en ny versjon av søkeapplikasjonen fra Mail.Ru opp på Google Play, som lar deg gå fra hovedskjermen til et hvilket som helst sosialt nettverk og inneholder rask tilgang til å søke etter bilder, videoer og nyheter. Android-applikasjonen har blitt til en mini-nettleser, skjerpet for å effektivt finne informasjonen du trenger. Verktøyet lærte også å gjenkjenne søk satt ikke av tekst, men med stemme. Utviklerne bemerker også at de har laget en spesiell widget som kan plasseres på hovedskjermen basert på smarttelefon eller nettbrett google systemer Android. Implikasjonen er at dette vil redusere søketiden ytterligere.

AltaVista- en av de eldste søkemotorene tar en av de første plassene når det gjelder dokumentvolum - mer enn 350 millioner. AltaVista tillater enkle og avanserte søk. "Hjelp" lar selv utrente brukere lage enkle og komplekse søk på riktig måte.

Rambler- en av de første russiske IPSene, åpnet i 1996. På slutten av 2002 ble det foretatt en radikal modernisering, hvoretter Rambler igjen kom inn i ledergruppen. nettverkssøk... For tiden er volumet av indeksen rundt 150 millioner dokumenter. For å komponere komplekse spørringer, anbefales det å bruke "Detaljert spørring"-modus, som gir store muligheter for å kompilere en søkeresept ved hjelp av menyelementer.

APORT... I dag er volumet av databasen mer enn 20 millioner dokumenter. Systemet har et bredt spekter av søkemuligheter. APORT har funksjonen som en innebygd oversetter, denne lar brukeren formulere forespørsler, både på russisk og Engelsk... I tillegg har APORT spesielle moduser for å søke etter illustrasjoner og lydfiler.

Søkemotorer av siste generasjon indekserer alle ord på en nettside eller i en artikkel fra en konferanse, mens tidligere området for indeksering vanligvis var begrenset til tittelen, overskriftene, de første linjene og adressen til dokumentet. Dette begrenset betydelig muligheten til å identifisere materiale om et smalt emne, siden søkeresultatene ikke alltid reflekterte faktiske data. Ved å eliminere denne mangelen har moderne søkemotorer blitt mye mer pålitelige enn sine forgjengere.

Den nest viktigste funksjonen er forbedringen av den interne søkemotoren, uttrykt i en økning i antall operatører og andre elementer i å komponere spørringer. For noen år siden var bare to, i beste fall, tre klassiske boolske operatorer i bruk: OG (og), OR (eller) og IKKE (ikke). Nå er det NEAR (ved siden av, nær) i Alta Vista og FØLGES AV (følger) i OpenText - i høyeste grad nyttige avstandsoperatører som gjør det mulig å spesifisere spørringen så mye som mulig. Mange systemer lar deg avkorte endelsene på termer, begrense søket etter datoen dokumentet ble opprettet, søke etter nøkkelord bare i utpekte elementer på nettsider (tittel, overskrifter, e-postadresse osv.), og også søke etter den nøyaktige uttrykk. Den siste utviklingen tillater også å oppdage visse typer filer (for eksempel grafikk eller lyd) og er følsomme for små og store bokstaver. Muligheten til å søke etter data på alle språk er i ferd med å bli vanlig. Alt dette gjør det mulig å komponere en søkeresept med høy grad av nøyaktighet, noe som selvfølgelig øker relevansen til de oppnådde resultatene.

dette øyeblikket de mest populære søkemotorene Google og Yandex, la oss sammenligne dem:

    Antall indekserte sider. Google har 8 milliarder, mens Yandex bare har 2 milliarder. Det vil si fire ganger mindre. Vinner for Google.

    Sideindekseringshastighet. Google indekserer nye sider innen 24 timer, mens Yandex kan ta flere dager. Igjen vinner Google.

    Problemstillingens relevans. Relevans refererer til relevansen av resultatene som vises på søkemotorsiden for søket ditt. Jeg må si med en gang at det er vanskelig å fastslå vinneren her. Google har vist gode resultater i det utenlandske segmentet av Internett, men i Runet har Yandex alltid vært litt foran.

    Ytterligere internettjenester. Her er fordelen helt klart med Yandex. Den har dusinvis av forskjellige tjenester som er praktisk gruppert i kategorier, mens Google har færre av dem, pluss at det er integrasjon med sosiale google-nettverket+ som mange mennesker ikke liker.

En søkemotor er en database med spesifikk informasjon på Internett. Mange brukere tror at så snart de legger inn et søk i en søkemotor, begynner de umiddelbart å skanne hele Internett, men dette er slett ikke tilfelle. Internett skannes konstant, av mange programmer, data om nettsteder legges inn i en database, der, i henhold til visse kriterier, alle nettsteder og alle sidene deres er distribuert til forskjellige typer lister og databaser. Det vil si at det er et slags dataarkivskap, og søket foregår ikke på Internett, men ifølge dette arkivskapet.

Populære søkemotorer

Yandex er den største søkemotoren på russisk Internett.

I tillegg til søkemotoren tilbyr Yandex 77 tilleggstjenester, de mest populære er Yandex-posttjenesten, Yandex-nettleseren, Yandex-disken, trafikk- og værinformasjon, Yandex-penger og mye mer. Søkemotoren tar hensyn til posisjonen din når du viser søkeresultater. Samme måten søkeprogram blir stadig modernisert for å gi mer korrekte resultater, designet for det beste informasjonsinnholdet for brukeren.

Google er den mest populære søkemotoren i verden.

I tillegg til søkemotoren tilbyr Google mange tilleggstjenester, programmer og maskinvare, inkludert en posttjeneste, Google Chrome-nettleseren, det største YouTube-videobiblioteket og mange andre prosjekter. Google kjøper trygt opp mange prosjekter som genererer stor fortjeneste. De fleste tjenester er ikke rettet mot direkte bruker, men for å tjene penger på Internett og integrert med fokus på interessene til europeiske og amerikanske brukere.

Mail er en søkemotor som hovedsakelig er populær for e-posttjenesten.

Det er mange tilleggstjenester, nøkkelen til disse er Mail, for øyeblikket eier Mail-selskapet det sosiale nettverket Odnoklassniki, eget nettverk"Min verden", tjeneste Money-post, mange Online spill, tre nesten identiske nettlesere med forskjellige navn. Alle applikasjoner og tjenester har mye reklameinnhold. Sosiale nettverk "VKonatkte" blokkerer direkte overganger til Mail-tjenester, agrumenting stort beløp virus.

Wikipedia.

Wikipedia er et søkehjelpesystem.

Dette er en non-profit søkemotor drevet av private donasjoner, så den fyller ikke sider med annonser. Et flerspråklig prosjekt som tar sikte på å lage et komplett referanseleksikon på alle språk i verden. Den har ingen spesifikke bidragsytere, fullføres og administreres av frivillige fra hele verden. Hver bruker kan enten skrive eller redigere en artikkel.

Offisiell side- www.wikipedia.org.

Youtube er det største biblioteket av videofiler.

Videohosting med elementer sosialt nettverk hvor hver bruker kan legge til en video. Fra det øyeblikket du kjøper dem av Google Ink, en separat registrering for YouTube er ikke nødvendig, bare registrer deg med Googles e-posttjeneste.

Den offisielle siden er youtube.com.

Yahoo! - den nest viktigste søkemotoren i verden.

Det er tilleggstjenester, hvorav den mest kjente er Yahoo-post... Som en del av å forbedre kvaliteten på søkemotoren, overfører Yahoo data om brukere og deres forespørsler til Microsoft... Fra disse dataene dannes en ide om brukernes interesser, så vel som et marked for reklameinnhold. Søkemotoren Yahoo, så vel som, er engasjert i overtakelsen av andre selskaper, for eksempel tilhører Yahoo søketjeneste Altavista og Alibaba e-handelsside.

Den offisielle siden er www.yahoo.com.

WDL er et digitalt bibliotek.

Biblioteket samler inn bøker som gir kulturell verdi v digital form... Hovedmålet er å øke nivået av kulturelt innhold på Internett. Tilgang til biblioteket er gratis.

Den offisielle siden er www.wdl.org/ru/.

Bing er en søkemotor fra Microsoft.

Den offisielle siden er www.baidu.com.

Søkemotorer i Russland

Rambler er en "pro-amerikansk" søkemotor.

Den ble opprinnelig opprettet som en media-internettportal. Som mange andre søkemotorer har den bildesøketjenester, videofiler, kart, værmelding, nyhetsseksjon og mye mer. Utgivere tilbyr også en gratis Rambler-Nichrome-nettleser.

Den offisielle siden er www.rambler.ru.

Nigma er en intelligent søkemotor.

Mer praktisk søkemotor på grunn av tilstedeværelsen av mange filtre og innstillinger. Grensesnittet lar deg inkludere eller ekskludere foreslåtte lignende verdier i søket etter bedre resultater. Når du mottar et søkeresultat, lar det deg også bruke informasjonen til andre store søkemotorer.

Den offisielle siden er www.nigma.ru.

Aport - online varekatalog.

Tidligere tapte søkemotoren, men etter at utviklingen og innovasjonene ble avviklet, raskt terreng og. V for tiden Aport er handelsplattform hvor produktene til mer enn 1500 bedrifter presenteres.

Den offisielle siden er www.aport.ru.

Sputnik er en nasjonal søkemotor og internettportal.

Laget av Rostelecom. Den er for tiden under testing.

Den offisielle siden er www.sputnik.ru.

Metabot er en søkemotor i utvikling.

Oppgavene til Metabot er å lage en søkemotor for alle andre søkemotorer, opprette posisjoner for å utstede resultater, og ta hensyn til dataene fra hele listen over søkemotorer. Det vil si at det er en søkemotor for søkemotorer.

Den offisielle siden er www.metabot.ru.

Søkemotoren er suspendert.

Den offisielle siden er www.turtle.ru.

KM er en multiportal.

Opprinnelig var nettstedet en multiportal med den påfølgende introduksjonen av en søkemotor. Søket kan utføres både på nettstedet og på alle sporede nettsteder på det russiske Internett.

Offisiell side - www.km.ru.

Gogo - fungerer ikke, omdirigerer til en søkemotor.

Offisiell side - www.gogo.ru.

Russisk multiportal, ikke veldig populær, trenger litt arbeid. Søkemotoren inkluderer nyheter, TV, spill, et kart.

Den offisielle siden er www.zoneru.org.

Søkemotoren fungerer ikke, utviklerne foreslår å bruke søkemotoren.

Offisiell side - www.au.ru.