Cham skin søkemotor. Oversikt over programmer for søk i dokumenter og data

De har blitt en integrert del av det russiske Internett i lang tid. Søkemotorer er nå enorme og komplekse mekanismer som representerer ikke bare et verktøy for å finne informasjon, men også attraktive områder for virksomheten.

De fleste brukere av søkemotorer har aldri tenkt (eller tenkt, men ikke funnet svar) på søkemotorenes arbeidsprinsipp, om ordningen for behandling av brukerforespørsler, om hva disse systemene består av og hvordan de fungerer .. .

Denne mesterklassen tar sikte på å svare på spørsmålet om hvordan søkemotorer fungerer. Du finner imidlertid ikke faktorer som påvirker rangeringen av dokumenter her. Dessuten bør du ikke stole på en detaljert forklaring av Yandex-operasjonsalgoritmen. Han, ifølge Ilya Segalovich, er direktør for teknologier og utvikling av søkemotoren "Yandex", kan bare gjenkjennes "under tortur" av Ilya Segalovich selv ...

2. Konseptet og funksjonene til søkemotoren

En søkemotor er et programvare- og maskinvarekompleks designet for å utføre søk på Internett og svare på en brukers forespørsel, spesifisert i form av en tekstfrase (søkespørring), ved å utstede en liste med lenker til informasjonskilder, i rekkefølge etter relevans (i samsvar med forespørselen). Store internasjonale søkemotorer: "Google", "Yahoo", "MSN". På det russiske Internett er disse Yandex, Rambler og Aport.

La oss se nærmere på konseptet med et søk ved å bruke Yandex-søkemotoren som et eksempel. Søket bør formuleres av brukeren i samsvar med det han ønsker å finne, så kort og enkelt som mulig. La oss si at vi ønsker å finne informasjon i Yandex om hvordan du velger en bil. For å gjøre dette, åpne hovedsiden til "Yandex" og skriv inn teksten til søket "hvordan velge en bil". Videre er vår oppgave å åpne lenker til informasjonskilder på Internett gitt på vår forespørsel. Det er imidlertid fullt mulig å ikke finne informasjonen vi trenger. Hvis dette skjer, må du enten omformulere forespørselen din, eller så er det virkelig ingen relevant informasjon om forespørselen vår i søkemotordatabasen (dette kan være når du setter veldig "smale" søk, for eksempel "hvordan velge en bil i Arkhangelsk ")

Den primære oppgaven til enhver søkemotor er å gi folk nøyaktig den informasjonen de leter etter. Og å lære brukere å komme med «riktige» forespørsler til systemet, dvs. søk som samsvarer med prinsippene til søkemotorer er ikke mulig. Derfor lager utviklere algoritmer og prinsipper for søkemotorer som vil tillate brukere å finne informasjonen de leter etter.

Dette betyr at søkemotoren må "tenke" slik brukeren tenker når han leter etter informasjon. Når en bruker sender en forespørsel til en søkemotor, ønsker han å finne det han trenger så raskt og enkelt som mulig. Etter å ha mottatt resultatet, vurderer han arbeidet til systemet, styrt av flere grunnleggende parametere. Fant han det han lette etter? Hvis ikke, hvor mange ganger måtte han omformulere søket for å finne det han lette etter? Hvor relevant var han i stand til å finne informasjon? Hvor raskt behandlet søkemotoren forespørselen? Hvor praktiske var søkeresultatene? Var det ønskede resultatet det første eller det hundrere? Hvor mye søppel ble funnet sammen med nyttig informasjon? Vil du finne informasjonen du trenger når du går til en søkemotor, for eksempel om en uke eller om en måned?

For å tilfredsstille alle disse spørsmålene med svar, forbedrer utviklerne av søkemotorer stadig algoritmene og prinsippene for søk, legger til nye funksjoner og muligheter og prøver på alle mulige måter å fremskynde systemets arbeid.

3. Hovedkarakteristikkene til søkemotoren

La oss beskrive hovedkarakteristikkene til søkemotorer:

  • Fullstendighet

    Fullstendighet er en av hovedkarakteristikkene til en søkemotor, som er forholdet mellom antall dokumenter funnet på forespørsel og det totale antallet dokumenter på Internett som tilfredsstiller denne forespørselen. For eksempel, hvis det er 100 sider på Internett som inneholder uttrykket "hvordan velge en bil", og bare 60 av dem ble funnet for det tilsvarende søket, vil fullstendigheten av søket være 0,6. Jo mer fullstendig søket er, jo mindre sannsynlig er det at brukeren ikke finner dokumentet han trenger, forutsatt at det finnes på Internett i det hele tatt.

  • Nøyaktighet

    Nøyaktighet er et annet hovedtrekk ved en søkemotor, som bestemmes av i hvilken grad de funnet dokumentene samsvarer med brukerens forespørsel. For eksempel, hvis spørringen "hvordan velge en bil" inneholder 100 dokumenter, inneholder 50 av dem uttrykket "hvordan velge en bil", og resten inneholder bare disse ordene ("hvordan velge riktig radiobåndopptaker og installere det i en bil»), så anses søkenøyaktigheten som lik 50/100 (= 0,5). Jo mer nøyaktig søket er, jo raskere vil brukeren finne dokumentene han trenger, jo mindre forskjellige typer "søppel" vil bli møtt blant dem, jo ​​sjeldnere vil dokumentene som ble funnet ikke samsvare med forespørselen.

  • Relevans

    Relevans er en like viktig komponent i søk, som kjennetegnes ved at det går fra det øyeblikket dokumenter publiseres på Internett til de legges inn i søkemotorens indeksbase. For eksempel, neste dag etter at interessante nyheter dukket opp, vendte et stort antall brukere seg til søkemotorer med relevante spørsmål. Objektivt sett har det gått mindre enn en dag siden publiseringen av nyhetsinformasjon om dette emnet, men hoveddokumentene er allerede indeksert og er tilgjengelige for søk, takket være eksistensen av den såkalte "raskbasen" i store søkemotorer, som oppdateres flere ganger om dagen.

  • Søkehastighet

    Søkehastighet er nært knyttet til motstanden mot stress. For eksempel, ifølge Rambler Internet Holding LLC, mottar Rambler-søkemotoren i dag, i arbeidstiden, omtrent 60 søk per sekund. Slik arbeidsbelastning krever en reduksjon i behandlingstiden for en individuell forespørsel. Her er brukerens og søkemotorens interesser sammenfallende: den besøkende ønsker å få resultater så raskt som mulig, og søkemotoren må behandle spørringen så raskt som mulig for ikke å bremse utregningen av følgende spørringer.

  • Synlighet

4. En kort historie om utviklingen av søkemotorer

I den første perioden av utviklingen av Internett var antallet brukere lite, og mengden tilgjengelig informasjon var relativt liten. For det meste var det bare forskere som hadde tilgang til Internett. På dette tidspunktet var ikke oppgaven med å søke etter informasjon på Internett så presserende som nå.

En av de første måtene å organisere tilgang til informasjonsressurser på nettverket var å lage åpne kataloger over nettsteder, lenker til ressurser som ble gruppert etter emne. Det første slike prosjektet var nettstedet Yahoo.com, som åpnet våren 1994. Etter at antallet nettsteder i katalogen økte betydelig, ble muligheten til å søke etter nødvendig informasjon i katalogen lagt til. I full forstand var det ennå ikke en søkemotor, siden søkeområdet bare var begrenset til ressursene i katalogen, og ikke til alle Internett-ressurser.

Link kataloger ble mye brukt i fortiden, men har nesten fullstendig mistet sin popularitet på nåværende tidspunkt. Siden selv moderne, enorme når det gjelder volum, inneholder kataloger bare informasjon om en ubetydelig del av Internett. Den største katalogen i DMOZ-nettverket (også kalt Open Directory Project) inneholder informasjon om 5 millioner ressurser, mens Googles søkemotorbase består av mer enn 8 milliarder dokumenter.

I 1995 dukket søkemotorene Lycos og AltaVista opp. Den siste i mange år var ledende innen informasjonssøk på Internett.

I 1997 opprettet Sergey Brin og Larry Page Googles søkemotor som en del av et forskningsprosjekt ved Stanford University. Google er for tiden den mest populære søkemotoren i verden!

I september 1997 ble Yandex-søkemotoren offisielt annonsert, som er den mest populære på det russisktalende Internett.

For tiden er det tre hovedsøkemotorer (internasjonale) - Google, Yahoo og, som har sine egne databaser og søkealgoritmer. De fleste av resten av søkemotorene (som det er et stort antall av) bruker i en eller annen form resultatene fra de tre oppførte. For eksempel bruker AOL-søk (search.aol.com) en Google-base, mens AltaVista, Lycos og AllTheWeb bruker en Yahoo-base.

5. Sammensetningen og prinsippene til søkemotoren

I Russland er hovedsøkemotoren Yandex, da - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Dessuten bruker Mail.ru for øyeblikket Yandex søkemotor og database.

Nesten alle store søkemotorer har sin egen struktur som er forskjellig fra andre. Det er imidlertid mulig å skille ut hovedkomponentene som er felles for alle søkemotorer. Forskjeller i strukturen kan bare være i form av implementering av mekanismer for samspillet mellom disse komponentene.

Indekseringsmodul

Indekseringsmodulen består av tre hjelpeprogrammer (roboter):

Spider (edderkopp) - et program designet for å laste ned nettsider. Edderkoppen laster ned siden og trekker ut alle interne lenker fra den siden. HTML-koden til hver side lastes ned. Roboter bruker HTTP-protokoller for å laste ned sider. "Edderkoppen" fungerer som følger. Roboten sender "get / path / document"-forespørselen og noen andre HTTP-forespørselskommandoer til serveren. Som svar mottar roboten en tekststrøm som inneholder tjenesteinformasjon og selve dokumentet.

  • Side url
  • datoen siden ble lastet ned
  • server respons http header
  • sidetekst (html-kode)

Crawler ("reisende" edderkopp) - et program som automatisk gjennomsøker alle lenkene som finnes på siden. Fremhever alle lenker på siden. Dens oppgave er å bestemme hvor edderkoppen skal gå videre, basert på lenker eller basert på en forhåndsdefinert adresseliste. Crawler, etter lenkene som er funnet, søker etter nye dokumenter som fortsatt er ukjente for søkemotoren.

Indexer er et program som analyserer nettsider lastet ned av edderkopper. Indekseren analyserer siden inn i dens komponentdeler og analyserer dem ved hjelp av sine egne leksikalske og morfologiske algoritmer. Ulike sideelementer analyseres, for eksempel tekst, overskrifter, lenker, struktur- og stilfunksjoner, spesielle html-tagger for tjenester, etc.

Dermed lar indekseringsmodulen deg gjennomsøke et gitt sett med ressurser etter lenker, laste ned sidene som du finner, trekke ut lenker til nye sider fra de mottatte dokumentene og utføre en fullstendig analyse av disse dokumentene.

Database

En database, eller en indeks for en søkemotor, er et datalagringssystem, en informasjonsmatrise som lagrer spesielt konverterte parametere for alle dokumenter som lastes ned og behandles av indekseringsmodulen.

Søkeserver

Søkeserveren er et viktig element i hele systemet, siden kvaliteten og hastigheten på søket er direkte avhengig av algoritmene som ligger til grunn for funksjonen.

Søkemotoren fungerer som følger:

  • Forespørselen mottatt fra brukeren er gjenstand for morfologisk analyse. Informasjonsmiljøet til hvert dokument som finnes i databasen genereres (som deretter vil vises som tekstinformasjon som tilsvarer forespørselen på søkeresultatsiden).
  • De mottatte dataene sendes som inngangsparametere til en spesiell avstandsmodul. Dataene for alle dokumenter blir behandlet, som et resultat av at for hvert dokument beregnes sin egen vurdering, som karakteriserer relevansen til spørringen som er lagt inn av brukeren og de ulike komponentene i dette dokumentet som er lagret i søkemotorindeksen.
  • Avhengig av brukerens valg kan denne vurderingen justeres av tilleggsbetingelser (for eksempel såkalt "avansert søk").
  • Deretter genereres en kodebit, det vil si at for hvert funnet dokument trekkes tittelen, en kort merknad som passer best med forespørselen og en lenke til selve dokumentet ut fra dokumenttabellen, og de funnet ordene utheves.
  • De resulterende søkeresultatene overføres til brukeren i form av en SERP (Search Engine Result Page) - søkeresultatside.

Som du kan se, er alle disse komponentene nært knyttet til hverandre og fungerer i samspill, og danner en klar, ganske kompleks mekanisme for søkemotoroperasjonen, som krever store ressurser.

6. Konklusjon

La oss nå oppsummere alt det ovennevnte.

  • Den primære oppgaven til enhver søkemotor er å gi folk nøyaktig den informasjonen de leter etter.
  • De viktigste egenskapene til søkemotorer:
    1. Fullstendighet
    2. Nøyaktighet
    3. Relevans
    4. Søkehastighet
    5. Synlighet
  • Den første fullverdige søkemotoren var WebCrawler-prosjektet, publisert i 1994.
  • Søkemotoren inneholder følgende komponenter:
    1. Indekseringsmodul
    2. Database
    3. Søkeserver

Vi håper at mesterklassen vår vil tillate deg å bli kjent med konseptet med søkemotorer, for å bedre kjenne hovedfunksjonene, egenskapene og prinsippet om søkemotorer.

Søkemotoren er et av hovednivåene på Internett sammen med innholdet og nettleseren. "Yandex" -søk eller lignende systemer ("Google", "Bing", DuckDuckGo og andre) lar brukeren søke etter informasjon på World Wide Web ved å formulere en forespørsel.

Jobben til en søkemotor er å finne alle dokumenter, sider, videoer, det vil si alt innhold, for dette søket (søkeord eller frase).

Hva er den beste søkemotoren? Finnes det andre alternativer enn Google og Yandex? Hvilken Internett-søkemotor er mer egnet for å gjennomsøke engelskspråklige kilder eller for eksempel musikk? Dette er nøyaktig hva som vil bli diskutert i artikkelen.

Vurdering: markedsledere

Hvis vi snakker om verden som helhet, så er "Google" -søk den mest populære søkemotoren. Selskapet opptar nesten 70% av markedet. Den andre posisjonen i ratingen er okkupert av Bing (andel - 12,26%). Baidu-systemet kjemper om andreplassen (6,48 % per september 2015). Fra tid til annen bytter de plass.

Så, for eksempel, i 2014, ble "krefter" fordelt annerledes: den første plassen ble okkupert av Google -søk med 68,69%, den andre - av Baidu (17,7%), den tredje - av Bing med en markedsverdi på 6, 22 %.

Men de globale dataene er veldig generaliserte. Hva er den beste søkemotoren?

I Kina, for eksempel, kryper en svært liten prosentandel av befolkningen med Google, de fleste bruker det innenlandske Soso-systemet. I Sør-Korea bruker de fleste innbyggerne sin egen utvikling – internettsøkemotoren Naver. Riktignok har antallet forespørsler i dette systemet begynt å synke raskt de siste månedene.

I Japan og Taiwan er det mer sannsynlig at brukere bruker Yahoo!

Vurdering: Russisktalende systemer

Hva er den beste søkemotoren? I Russland er rangeringen av søkemotorer slett ikke lik den globale. Markedslederen i det russisktalende segmentet av Internett er Yandex, som brukes av mer enn 55% av brukerne.

Google er på andreplass med en score på 37,6 %. I følge LiveInternet-tjenesten ble dekningen av russiskspråklige søk på World Wide Web distribuert som følger:

  1. Universelle søkemotorer: Google (37,6%), Bing (0,3%), Yahoo! (0,1 %).
  2. Engelsktalende og internasjonal (AskJeeves, for eksempel).
  3. Russiskspråklige søkesystemer: Yandex (56,2 %), Mail (5,3 %), Rambler (0,5 %).

DuckDuckGo

Vi bør begynne å snakke om alternative søkemotorer med søkemotoren DuckDuckGo. Det er et ganske kjent og utbredt åpen kildekode-system. DuckDuckGos servere er lokalisert i USA. Søkeresultatene er ganske omfattende, siden systemet ikke bare bruker sine egne algoritmer, men også resultatene fra noen andre kilder, for eksempel "Wikipedia", søkemotoren "Bing" og Yahoo!

DuckDuckGo-søkemotoren sikrer maksimal sikkerhet for brukerens personlige opplysninger, personvern og konfidensialitet. Systemet samler ingen data om brukere, lagrer ikke historikk og begrenser bruken av informasjonskapsler så mye som mulig.

Forskjellen med DuckDuckGo er at dette systemet ikke personaliserer søkeresultater, slik andre systemer gjør. I "Google" eller "Yandex", for eksempel, ser brukeren bare informasjonen som er i samsvar med hans preferanser. Men DuckDuckGo skaper et ekte bilde og lar deg bli kvitt påtrengende spesifikke annonser. Søketjenesten søker enkelt etter informasjon på fremmedspråk, mens Yandex og Google som standard foretrekker russiskspråklige kilder, selv om forespørselen er skrevet inn på engelsk, tysk eller et annet språk.

Du kan tilpasse grensesnittet i systemet: du kan endre fargeskjemaet, skriftene, koblingene og andre parametere med bare noen få klikk.

Denne søkemotoren er fortsatt langt fra giganten Google, men anda er i utvikling, så det er godt mulig at DuckDuckGo i fremtiden vil ta en av de ledende posisjonene. Teamet har laget et utmerket produkt som gir anonyme, raske og funksjonelle søk som fortjener brukerens oppmerksomhet.

NotEvil

Det er et system som søker i det anonyme Tor-nettverket. Søkemotoren er forhåndsinstallert i nettleseren med samme navn. Hvorfor er ikke Evil bedre? Den "går" dit Google eller Yandex søkemotor ikke kan nå. Generelt er det mange ressurser på Tor-nettverket som ikke kan besøkes på det "vanlige" (lovlydige) Internett. Dette er en slags side i nettverket med sine egne sosiale plattformer, torrent-trackere, media, blogger, kjøpesentre, fora, biblioteker og så videre.

Forresten, notEvil er ikke den eneste søkemotoren i sitt slag. Det er også Look, som er tilgjengelig som standard i samme Tor-nettleser, og TORCH er en av de eldste søkemotorene på det anonyme nettet.

YaCy

Den gratis YaCy-søkemotoren er en helt annen tilnærming til å organisere søk på World Wide Web. Systemet fungerer etter P2P-prinsippet. Dette betyr at hver datamaskin som modulen er installert på, skanner Internett uavhengig, og deretter samles alle oppnådde resultater i en enkelt database, som kan brukes av alle YaCy-brukere.

Systemet er helt uavhengig, autonomt og sikrer anonymiteten til hver enkelt bruker. YaCy passer for tilhengere av et åpent internett som ikke er påvirket av store selskaper og offentlige etater.

I hverdagen er søkemotoren ennå ikke veldig nyttig, men på lang sikt er den et verdig alternativ til Google, selv med tanke på å organisere informasjonssøkeprosessen.

Pipl

Pipl er et system utviklet for å søke etter informasjon om en bestemt person. Utviklerne hevder at søkemotoralgoritmer søker etter folk mer effektivt enn Google eller Yandex, som er utbredt over hele verden.

De prioriterte kildene er profiler i sosiale medier, kommentarer, deltakerlister, databaser hvor ulike data om personer publiseres, for eksempel databaser over rettsavgjørelser. Men det er også en ulempe. Russiske databaser er ikke tilgjengelige for Pipl, så det vil kun være nyttig for å finne informasjon om amerikanske statsborgere.

Finn lyder

Hva er den beste søkemotoren? Hvis du trenger å finne musikk eller lyder, så er selvfølgelig FindSounds den beste. Dette er en spesialisert søkemotor som har en liste over tagger. Her kan du velge ønsket lydfilformat eller kvaliteten. Alle søkeresultater er tilgjengelige for nedlasting.

Wolfram | Alfa

Dette systemet gir ikke ut sidene der det er informasjonen brukeren trenger, men det ferdige resultatet. For eksempel kart, grafer, tabeller, korte svar. Tjenesten er perfekt egnet for å beregne data og søke etter spesifikke fakta. Søkemotoren forstår ennå ikke alle forespørsler, men den er i stadig utvikling.

Med Wolfram | Alpha er det praktisk å for eksempel sammenligne parametere for å sette opp et kamera, smarttelefon eller bærbar PC. Beregn også nivået av alkohol i blodet (systemet spør brukeren om vekt og høyde, mengden drukket, tidspunktet, og rapporterer deretter hvor mye alkohol som vil bli fullstendig utskilt fra kroppen).

Verktøyet kan konvertere sko- og klesstørrelser, telle kalorier, se valutakurser eller stemme et musikkinstrument.

Dogpile

Dogpile viser resultater fra alle vanlige søkemotorer samtidig. Tjenesten bruker en forbedret algoritme og, som utviklerne forsikrer, genererer de beste resultatene på Internett. Dessuten er det få annonser her. Du kan prøve å bruke Dogpile hvis informasjonen du trenger ikke på noen måte er i standard Google eller Yandex.

BoardReader

Dette systemet søker etter informasjon om fora, meningsmålinger, spørsmål og svar-tjenester, sosiale fellesskap, og begrenser søkefeltet til sosiale plattformer. Du kan angi filtre: språk og publiseringsdato, nettstedsnavn og lignende.

Søkemotoren kan være nyttig for reklamefolk som er interessert i publikums mening.

Endelig

Alternative søkemotorer er ofte flyktige. De dukker opp like raskt som de dør. De fleste alternative systemene i dag spesialiserer seg på en smal nisje eller tester den originale algoritmen i dannelsen av søkeresultater.

I sammenheng med å beskrive alternative søkemotorer betyr ikke kriteriet «bedre» «bedre i det hele tatt». Hver av tjenestene oppført ovenfor gir en bestemt bruker noe som ikke er tilgjengelig i Google eller Yandex. I alle fall er det interessant og nyttig for hver bruker å bli kjent med alternative alternativer (på bakgrunn av det faktum at systemet ser ut til å være praktisk talt monopolisert av søkegigantene).

En søkemotor er en database med spesifikk informasjon på Internett. Mange brukere tror at så snart de legger inn et søk i en søkemotor, begynner de umiddelbart å skanne hele Internett, men dette er slett ikke tilfelle. Internett skannes konstant, av mange programmer, data om nettsteder legges inn i en database, der, i henhold til visse kriterier, alle nettsteder og alle sidene deres er distribuert til forskjellige typer lister og databaser. Det vil si at det er et slags dataarkivskap, og søket foregår ikke på Internett, men ifølge dette arkivskapet.

Google er den mest populære søkemotoren i verden.

I tillegg til søkemotoren tilbyr Google mange tilleggstjenester, programvare og maskinvare, inkludert en e-posttjeneste, Google Chrome-nettleseren, det største youtube-videobiblioteket og mange andre prosjekter. Google kjøper trygt opp mange prosjekter som genererer stor fortjeneste. De fleste av tjenestene er ikke rettet mot direkte brukere, men mot å tjene penger på Internett og er integrert med fokus på europeiske og amerikanske brukeres interesser.

Mail er en søkemotor som hovedsakelig er populær for e-posttjenesten.

Det er mange tilleggstjenester, hvor nøkkelen er Mail, for øyeblikket eier Mail-selskapet det sosiale nettverket Odnoklassniki, sitt eget nettverk "My World", Money-mail-tjenesten, mange nettspill, tre nesten identiske nettlesere med forskjellige navn . Alle applikasjoner og tjenester har mye reklameinnhold. Det sosiale nettverket VKonatkte blokkerer direkte tilkoblinger til e-posttjenester, og samler et stort antall virus.

Wikipedia.

Wikipedia er et søkehjelpesystem.

En non-profit søkemotor drevet av private donasjoner, så den fyller ikke sider med annonser. Et flerspråklig prosjekt som har som mål å lage et komplett referanseleksikon på alle språk i verden. Den har ingen spesifikke bidragsytere, fullføres og administreres av frivillige fra hele verden. Hver bruker kan både skrive og redigere artikkelen.

Den offisielle siden er www.wikipedia.org.

Youtube er det største biblioteket av videofiler.

Videohosting med elementer fra et sosialt nettverk, hvor hver bruker kan legge til en video. Fra det øyeblikket de ble kjøpt opp av Google Ink, er det ikke nødvendig med en separat registrering for YouTube, det er nok å registrere seg hos Googles e-posttjeneste.

Den offisielle siden er youtube.com.

Yahoo! - den nest viktigste søkemotoren i verden.

Det finnes tilleggstjenester, hvorav den mest kjente er Yahoo-post. Som en del av å forbedre kvaliteten på søkemotoren, sender Yahoo data om brukere og deres forespørsler til Microsoft. Fra disse dataene dannes en ide om brukernes interesser, så vel som et marked for reklameinnhold. Søkemotoren Yahoo, samt, er engasjert i oppkjøp av andre selskaper, for eksempel eier Yahoo søketjenesten Altavista og e-handelssiden Alibaba.

Den offisielle siden er www.yahoo.com.

WDL er et digitalt bibliotek.

Biblioteket samler inn bøker som gir kulturell verdi i digital form. Hovedmålet er å øke nivået av kulturelt innhold på Internett. Tilgang til biblioteket er gratis.

Den offisielle siden er www.wdl.org/ru/.

Bing er en søkemotor fra Microsoft.

Den offisielle siden er www.baidu.com.

Søkemotorer i Russland

Rambler er en "pro-amerikansk" søkemotor.

Den ble opprinnelig opprettet som en Internett-medieportal. Som mange andre søkemotorer har den bildesøketjenester, videofiler, kart, værmelding, nyhetsseksjon og mye mer. Utgivere tilbyr også en gratis Rambler-Nichrome-nettleser.

Den offisielle siden er www.rambler.ru.

Nigma er en intelligent søkemotor.

Mer praktisk søkemotor på grunn av tilstedeværelsen av mange filtre og innstillinger. Grensesnittet lar deg inkludere eller ekskludere foreslåtte lignende verdier i søket etter bedre resultater. Når du mottar et søkeresultat, lar det deg også bruke informasjonen til andre store søkemotorer.

Den offisielle siden er www.nigma.ru.

Aport - online varekatalog.

Tidligere tapte søkemotoren, men i etterkant av at utviklingen og innovasjonene ble avviklet, raskt terreng og. For øyeblikket er Aport en handelsplattform hvor varer fra mer enn 1500 bedrifter presenteres.

Den offisielle siden er www.aport.ru.

Sputnik er en nasjonal søkemotor og internettportal.

Laget av Rostelecom. Den er for tiden under testing.

Den offisielle siden er www.sputnik.ru.

Metabot er en søkemotor i utvikling.

Oppgavene til Metabot er å lage en søkemotor for alle andre søkemotorer, opprette posisjoner for å utstede resultater, og ta hensyn til dataene fra hele listen over søkemotorer. Det vil si at det er en søkemotor for søkemotorer.

Den offisielle siden er www.metabot.ru.

Søkemotoren er suspendert.

Den offisielle siden er www.turtle.ru.

KM er en multiportal.

Opprinnelig var nettstedet en multiportal med den påfølgende introduksjonen av en søkemotor. Søket kan utføres både på nettstedet og på alle sporede nettsteder på det russiske Internett.

Offisiell side - www.km.ru.

Gogo - fungerer ikke, omdirigerer til en søkemotor.

Offisiell side - www.gogo.ru.

Russisk multiportal, ikke veldig populær, trenger litt arbeid. Søkemotoren inkluderer nyheter, TV, spill, et kart.

Den offisielle siden er www.zoneru.org.

Søkemotoren fungerer ikke, utviklerne foreslår å bruke søkemotoren.


Inntil nylig var det ikke så lett å finne den nødvendige informasjonen på World Wide Web. Men takket være den raske utviklingen og fremveksten av nye søkemotorer, har denne prosessen blitt mye mer praktisk og raskere. I vår dagens anmeldelse, 10 av de beste tjenestene for å finne ulike typer data som er i stand til å finne alt som kreves i dypet av Internett.

1. Internett-søkemotor - Bing


Bing er en velkjent Internett-søkemotor som ble etablert i juni 2009. Denne tjenesten er tilgjengelig på 40 språk. Dets månedlige antall unike besøkende er omtrent 350 millioner.

2. Internet Metasearch System - AOL Search.com


AOL Search.com er et internettsystem for metasøk som ble grunnlagt i USA i 1985. Det månedlige antallet besøkende til denne tjenesten er omtrent 75 millioner. Tim Armstrong er administrerende direktør.

3. Internett-søkemotor - DuckDuckGo


DuckDuckGo er en åpen kildekode internettsøkemotor som ble lansert i 2008 av Gabrielm Weinberg. Selskapet har hovedkontor i Valley Forge, Pennsylvania. Antall unike besøkende som bruker DuckDuckGo er omtrent 13 millioner mennesker per måned.

4. Internett-søkemotor - Ask.com


Ask.com er en Internett-søkemotor, hvis hovedfunksjon er å søke etter svar på spørsmål. Tjenesten ble grunnlagt i juni 1996 i Berkeley, California av Garrett Gruner og David Wharton. Det månedlige antallet unike besøkende til denne tjenesten er omtrent 145 millioner.

5. Internett-søkemotor – Google


Google Er den mest kjente søkemotoren på Internett, med hovedkontor i Mountain View, California, USA. Selskapet ble grunnlagt 4. september 1998 av Larry Page, Sergey Mikhailovich Brin. Dets månedlige antall unike besøkende er omtrent 1.100.000.000.

6. Metasearch Internett-system - MyWebSearch.com


MyWebSearch.com er en internett-metasøkemotor som er rangert på 73. plass på listen over de mest populære nettstedene. Dets månedlige antall unike besøkende er omtrent 60 millioner.

7. Internett-metsøkesystem - Infospace.com


Den presenterte søkemotoren ble grunnlagt i 1996. Hovedkvarteret ligger i Bellevue, Washington, USA. Månedlig antall unike besøkende Infospace.com er omtrent 24 millioner mennesker.

8. Internett-metsøkesystem - WebCrawler.com


WebCrawler.com Er en internett-metasøkemotor drevet av Yahoo og Google. Selskapet ble stiftet i april 1994. Dets månedlige antall unike besøkende er omtrent 65 millioner.

9. Internett-metsøkesystem - Info.com


Info.com er et metasøkesystem, med hovedkontor i London, hovedstaden i Storbritannia. Info.com har omtrent 13 millioner unike besøkende hver måned.

10. Internett-søkemotor - Yahoo


En søkemotor på Internett kalt - Yahoo som ble grunnlagt i januar 1994 av Jerry Yang og David Phil. Administrerende direktør i selskapet er Marissa Mayer. Dets månedlige antall unike besøkende er omtrent 300 millioner. Tjenesten har hovedkontor i Santa Clara, California, USA.

Og elskere av mobile enheter og datateknologier, det vil absolutt være interessant å se på

Hei kjære lesere av bloggsiden. , så hadde de få brukerne nok av sine egne bokmerker. Men som du husker skjedde det eksponentielt, og veldig snart ble det vanskeligere å navigere i alt dets mangfold.

Deretter dukket det opp kataloger (Yahu, Dmoz og andre), der forfatterne deres la til og sorterte forskjellige nettsteder i kategorier. Dette gjorde umiddelbart livet lettere for de daværende, ennå ikke veldig mange, brukerne av det globale nettverket. Mange av disse katalogene er fortsatt i live i dag.

Men etter en stund ble størrelsen på databasene deres så store at utviklerne først tenkte på å lage et søk i dem, og deretter på å lage et automatisert system for å indeksere alt Internett-innhold for å gjøre det tilgjengelig for alle.

De viktigste søkemotorene til det russisktalende segmentet av Internett

Som du kan forestille deg, ble denne ideen realisert med overveldende suksess, men alt viste seg imidlertid bare for en håndfull utvalgte selskaper som klarte ikke å forsvinne på Internett. Nesten alle søkemotorer som dukket opp på den første bølgen har nå enten forsvunnet, eller vegetert, eller blitt kjøpt av mer vellykkede konkurrenter.

Søkemotoren er en veldig kompleks og, viktigere, en svært ressurskrevende mekanisme (som betyr ikke bare materielle ressurser, men også menneskelige ressurser). Bak den tilsynelatende enkle, eller dens asketiske analogen fra Google, er det tusenvis av ansatte, hundretusenvis av servere og mange milliarder av investeringer som er nødvendige for at denne kolossen skal fortsette å fungere og forbli konkurransedyktig.

Å gå inn på dette markedet nå og starte fra bunnen av er mer en utopi enn et ekte forretningsprosjekt. For eksempel har et av de rikeste selskapene i verden, Microsoft, forsøkt å få fotfeste i søkemarkedet i flere tiår, og først nå begynner søkemotoren deres Bing sakte å møte forventningene deres. Og før det var det en hel rekke feil og nederlag.

Hva kan vi si om å gå inn i dette markedet uten særlig økonomisk påvirkning. For eksempel har vår innenlandske søkemotor Nigma mange nyttige og innovative ting i sitt arsenal, men deres oppmøte er tusenvis av ganger dårligere enn lederne på det russiske markedet. Ta for eksempel en titt på Yandex sitt daglige publikum:

I denne forbindelse kan vi anta at listen over de viktigste (beste og mest vellykkede) søkemotorene til Runet og hele Internett allerede er dannet, og hele intrigen ligger bare i hvem som vil spise hvem til slutt, vel, eller hvordan deres prosentandel vil bli fordelt hvis de alle overlever og holder seg flytende.

Søkemotormarkedet i Russland det er veldig godt synlig, og her kan det sannsynligvis skilles mellom to eller tre hovedspillere og et par mindre. Generelt har det utviklet seg en ganske unik situasjon i Runet, som, slik jeg forstår det, bare gjentok seg i ytterligere to land i verden.

Jeg snakker om det faktum at søkemotoren Google, etter å ha kommet til Russland i 2004, ikke har vært i stand til å gripe ledelsen så langt. Faktisk prøvde de å kjøpe Yandex rundt denne perioden, men noe fungerte ikke der, og nå er "vårt Russland" sammen med Tsjekkia og Kina stedene hvor den allmektige Google, om ikke beseiret, så i det minste møtte alvorlig motstand.

Faktisk se dagens tilstand blant de beste søkemotorene på det russiske Internett hvem som helst kan. Det vil være nok å sette inn denne URL-en i adressefeltet til nettleseren din:

Http://www.liveinternet.ru/stat/ru/searches.html?period=month;total=yes

Faktum er at de fleste av dem bruker det på nettstedene sine, og denne URL-en lar deg se statistikken over besøkende fra forskjellige søkemotorer til alle nettsteder som tilhører RU-domenesonen.

Etter å ha angitt den gitte URL-en, vil du se et bilde som ikke er veldig attraktivt og presentabelt, men det gjenspeiler godt essensen av saken. Vær oppmerksom på de fem beste søkemotorene som nettsteder på russisk mottar trafikk fra:

Ja, selvfølgelig, ikke alle ressurser med russiskspråklig innhold er plassert i denne sonen. Det finnes også SU og RF, og fellesarealer som COM eller NET er fulle av internettprosjekter med fokus på Runet, men likevel er utvalget ganske representativt.

Denne avhengigheten kan formaliseres på en mer fargerik måte, som for eksempel noen på nettverket gjorde for presentasjonen sin:

Dette endrer ikke essensen. Det er et par ledere og flere veldig, veldig hengende søkemotorer. Jeg har forresten allerede skrevet om mange av dem. Noen ganger er det ganske underholdende å kaste seg ut i en suksesshistorie eller omvendt fordype seg i årsakene til feilene til en gang lovende søkemotorer.

Så, i rekkefølge av betydning for Russland og Runet som helhet, vil jeg liste dem opp og gi dem korte egenskaper:

    Søk i Google har allerede blitt et kjent navn for mange innbyggere på planeten - det kan du lese om på lenken. Jeg likte alternativet "oversettelse av resultater" i denne søkemotoren, da du mottok svar fra hele verden, men på ditt eget språk, men nå er det dessverre ikke tilgjengelig (i hvert fall på google.ru).

    Nylig har kvaliteten på utstedelsen deres (Search Engine Result Page) også forundret meg. Personlig bruker jeg alltid først runet mirror-søkemotoren (det er, vel, jeg er vant til det), og bare når jeg ikke finner et forståelig svar der, henvender jeg meg til Google.

    Vanligvis gjorde utstedelsen deres meg glad, men i det siste har det bare forundret meg - noen ganger klatrer slikt tull ut. Det er mulig at deres kamp for å øke inntektene fra kontekstuell annonsering og konstant omstokking av søkeresultater for å diskreditere SEO-kampanje kan slå tilbake. I alle fall har denne søkemotoren en konkurrent i Runet, og hva slags.

    Jeg tror at knapt noen vil spesifikt gå til Go.mail.ru for å søke på russisk Internett. Derfor kan trafikken på underholdningsprosjekter fra denne søkemotoren være betydelig mer enn ti prosent. Eierne av slike prosjekter bør ta hensyn til dette systemet.

Men i tillegg til de uttalte lederne i søkemotormarkedet i det russisktalende segmentet av Internett, er det flere andre aktører hvis andel er ganske lav, men likevel får vi til å si noen få ord om dem. .

Runet søkemotorer fra andre sjikt


Internett-dekkende søkemotorer

I det store og hele, på skalaen til hele Internett, er det bare én seriøs aktør - Google... Dette er den ubestridte lederen, men han har fortsatt litt konkurranse.

For det første er det fortsatt det samme Bing, som for eksempel har en veldig god posisjon i det amerikanske markedet, spesielt med tanke på at motoren også brukes på alle Yahu-tjenester (nesten en tredjedel av hele det amerikanske søkemarkedet).

Vel, og for det andre, på grunn av den enorme andelen brukere fra Kina av det totale antallet Internett-brukere, kalte deres hovedsøkemotor Baidu kiler inn i fordelingen av steder på verdens Olympus. Den ble født i 2000 og utgjør nå omtrent 80 % av hele det nasjonale publikummet i Kina.

Det er vanskelig å si noe mer forståelig om Baidu, men på Internett er det vurderinger om at plassene i toppen hans er okkupert ikke bare av nettstedene som er mest relevante for søket, men også av de som har betalt for det (direkte til søkemotoren) , og ikke til SEO-kontoret). Dette gjelder selvsagt først og fremst kommersielle resultater.

Generelt sett, ser man på statistikken, blir det klart hvorfor Google der lett går til ideen om å forverre søkeresultatene sine i bytte mot økt fortjeneste fra kontekstuell annonsering. Faktisk er de ikke redde for mengde brukere, fordi de i de fleste tilfeller ikke har noe spesielt sted å gå. Denne situasjonen er litt trist, men la oss se hva som skjer videre.

Forresten, for å komplisere livet til optimalisere ytterligere, og kanskje for å opprettholde sjelefreden til brukerne av denne søkemotoren, har Google nylig brukt kryptering ved overføring av forespørsler fra brukerens nettleser til søkefeltet. Snart vil det ikke lenger være mulig å se i statistikken til besøkstellere, for hvilke forespørsler brukere kom til deg fra Google.

Selvfølgelig, i tillegg til søkemotorene i denne publikasjonen, er det ikke tusen andre - regionale, spesialiserte, eksotiske, etc. Det vil ikke være mulig å prøve å liste opp og beskrive dem alle innenfor rammen av én artikkel, og det er sannsynligvis ikke nødvendig. Jeg vil heller si noen ord om hvor vanskelig det er å lage en søkemotor og hvor ikke enkelt og ikke billig å holde det oppdatert.

Det overveldende flertallet av systemene opererer etter lignende prinsipper (les om og om) og forfølger samme mål - å gi brukerne svar på spørsmålet deres. Dessuten må dette svaret være relevant (tilsvarende spørsmålet), uttømmende og, som ikke er uviktig, relevant (første friskhet).

Det er ikke så lett å løse dette problemet, spesielt med tanke på at søkemotoren må analysere innholdet på milliarder av Internett-sider i farten, filtrere ut unødvendige og danne en liste (problem) fra resten, der svarene som er best egnet for brukerens spørsmål vil først gå.

Denne svært komplekse oppgaven løses ved foreløpig innsamling av informasjon fra disse sidene ved hjelp av ulike indekseringsroboter... De samler inn lenker fra allerede besøkte sider og laster opp informasjon fra dem til bunnen av søkemotoren. Det finnes roboter som indekserer tekst (vanlige og raske roboter som lever av nyheter og hyppig oppdaterte ressurser slik at siste data alltid presenteres i resultatene).

I tillegg er det bildeindekseringsroboter (for deres påfølgende visning i), favorittikoner, sidespeil (for deres påfølgende sammenligning og mulig liming), roboter som sjekker funksjonaliteten til Internett-sider som brukere eller gjennom verktøy for webansvarlige (her kan du lese om, og) ...

Selve indekseringsprosessen og den påfølgende prosessen med å oppdatere indeksbasene er ganske tidkrevende. Selv om Google gjør det mye raskere enn konkurrentene, i alle fall Yandex, som tar en uke eller to å gjøre dette (les om).

Vanligvis bryter søkemotoren ned tekstinnholdet på en Internett-side i separate ord, som fører til grunnleggende grunnleggende, slik at du senere kan gi riktige svar på spørsmål stilt i forskjellige morfologiske former. Alt det ekstra body-settet i form av HTML-tagger, mellomrom osv. ting slettes, og de resterende ordene sorteres alfabetisk og deres plassering i dette dokumentet er angitt ved siden av dem.

Slik shnyaga kalles en invers indeks og lar deg søke ikke på nettsider, men på strukturerte data som ligger på søkemotorens servere.

Antallet slike servere hos Yandex (som stort sett bare søker etter russiskspråklige nettsteder og litt etter ukrainsk og tyrkisk) er i titalls eller til og med hundretusener, og for Google (som søker på hundrevis av språk) - i millioner. .

Mange servere har kopier, som tjener både til å øke sikkerheten til dokumenter og bidra til å øke hastigheten på forespørselsbehandlingen (ved å balansere belastningen). Estimer kostnadene ved å vedlikeholde hele denne gården.

Brukerens forespørsel vil bli dirigert av lastbalanseren til serversegmentet som for øyeblikket er minst lastet. Deretter utføres analysen av regionen der brukeren av søkemotoren sendte forespørselen sin, og den analyseres morfologisk. Hvis et lignende søk nylig ble lagt inn i søkefeltet, blir data fra hurtigbufferen sendt til brukeren for ikke å laste serveren igjen.

Hvis forespørselen ennå ikke er bufret, sendes den til området der søkemotorens indeksbase er plassert. Som svar vil du motta en liste over alle Internett-sider som i det minste har en relasjon til forespørselen. Ikke bare direkte forekomster tas i betraktning, men også andre morfologiske former, så vel som osv. tingene.

Deres trenger å rangere, og på dette stadiet kommer algoritmen (kunstig intelligens) inn. Faktisk multipliseres brukerens forespørsel med alle mulige alternativer for tolkningen, og svar på mange forespørsler søkes samtidig (på grunn av bruken av spørringsspråkoperatører, hvorav noen også er tilgjengelige for vanlige brukere).

Som regel inneholder søkeresultatene én side fra hvert nettsted (noen ganger flere). er nå svært komplekse og tar hensyn til mange faktorer. I tillegg, for å korrigere dem, og brukes, som manuelt evaluerer referansenettstedene, som lar deg justere driften av algoritmen som helhet.

Generelt er det klart at dette er en mørk sak. Vi kan snakke lenge om dette, men det er også underforstått at brukertilfredshet med en søkemotor oppnås, å, så vanskelig det er. Og det vil alltid være de som ikke liker noe, som for eksempel du og meg, kjære lesere.

Lykke til! Vi sees snart på sidene til bloggsiden

du kan se flere videoer ved å gå til
");">

Du kan være interessert

Yandex People - hvordan søke etter folk på sosiale nettverk Apometer er en gratis tjeneste for sporing av endringer i søkeresultater og oppdateringer av søkemotorer DuckDuckGo er en søkemotor som ikke følger deg
Hvordan sjekke Internett-hastighet - online tilkoblingstest på en datamaskin og telefon, SpeedTest, Yandex og andre målere
Yandex og Google-bilder, samt søk etter bildefil i Tineye og Google