Технология за търсене на информация в Интернет: Системи за търсене на информация в Интернет. Системи за търсене на хора. Допълнителни опции за търсене в Yandex

В момента Интернет обединява стотици милиони сървъри, които хостват милиарди различни сайтове и отделни файлове, съдържащи различни видове информация. Това е огромно хранилище на информация.

Търсенето на информация е една от най-често срещаните и в същото време сложни задачи, с които всеки потребител трябва да се изправи в мрежата. Въпреки това, ако за обикновен потребител познаването на ефективни методи за извличане на информация е желано, но не задължително качество, то за професионалистите в областта на производството и дизайна, организационните и управленски, изследователски и дизайнерски дейности, способността за бързо навигиране в интернет ресурсите и намирането на необходимите източници е една от основните квалификации. Има различни методи за търсене на информация в Интернет.

Търсене по известен адрес.

Това е най-бързият метод за търсене, но може да се използва само ако потребителят знае точно адреса на информационния ресурс, съдържащ необходимата му информация. Адресите на уеб страници се дават в специални указатели, печатни издания и др. Знаейки адреса, достатъчно е да го въведете в адресната лента на браузъра.

Например:

− Mgudt.ru - Московски университет по дизайн и технологии;

− Sssu.ru - Южноруски държавен университет по икономика и услуги;

− Assol.org - CAD за облекло, софтуер за проектиране на чанти, дизайн на обувки;

− Saprgrazia.com - високи компютърни технологии на шивашката индустрия;

− Comtense.ru - софтуер и оборудване за автоматизация на проектирането и технологичната подготовка на производството на шивашки и трикотажни изделия;

− Moda.ru, fg.ru, sarafan.ru - модни тенденции;

− Microcoft.com и Microcoft.com/rus - уебсайт на Microcoft Corporation и руската му версия;

− Rarlab.com - WinRAR архиватор;

− 7-zip.org - безплатен 7-ZIP архиватор;

− Office.microsoft.com/rus – официален уебсайт на Microsoft Office;

− Abbyy.ru/finereader - Fine Reader (програма за разпознаване на шаблони);

− Adobe.com/ru/products/photoshop - графичен редактор Adobe Photoshop;

− Avast.ru - безплатна антивирусна програма Avast! (руска версия);

− Free-av.com - безплатна антивирусна програма Avira Antivir;

− Drweb.ru - DrWeb антивирусна програма;

− Avp.ru - антивирусна програма на Kaspersky;

− Agnitum.ru - Agnitum Outpost Firewail и Outpost Security Suite;

− Microcoft.com/rus/windows/internet-explorer - браузър Internet Explorer;


− Opera.com - браузър Opera;

− Ritlabs.com - Програмата Bat mail;

− Icq.com - услуга за незабавни съобщения (уеб пейджър) ICQ;

− Icq.rambler.com - руска версия на ICQ;

− Skype.com - Skype IP-телефонна програма;

− Yandex.ru, rambler.ru, google.ru - руски търсачки;

− Google.com, bing.com – международни търсачки;

− Filesearch.ru - търсене на FTP сървъри;

− Mail.ru, mail.yandex.ru, mail.rambler.ru, pochta.ru, e-mail.ru - руски безплатни пощенски сървъри;

− Narod.ru, boom.ru, westhost.ru, by.ru - безплатен хостинг на руски сървъри;

− Ixbt.ru - компютърни новини, прегледи на хардуера;

− Maps.google.com - подробни карти на целия свят, до къщата;

− Maps.yandex.ru - подробни карти на най-големите градове в Русия и Украйна. Информация за задръствания;

− Wikipedia.org и ru.wikipedia.org – безплатна енциклопедия на Wikipedia и нейния руски раздел;

− Slovari.yandex.ru, rubricon.com, krugosvet.ru, mega.km.ru - онлайн енциклопедии и речници;

− Books.ru, ozon.ru, market.yandex.ru, foto.ru - онлайн магазини;

− Rvb.ru - руска виртуална библиотека;

Навигация с хипервръзки. Уебсайтовете в Интернет са свързани помежду си с помощта на хипервръзки. Ако адресът на желаната уеб страница не е наличен, можете да използвате друга страница с връзка към нея. Когато използвате други методи за търсене, има смисъл да видите дали намереният сайт има раздел с връзки (ресурси, други сайтове и т.н.). Често в този раздел можете да намерите адреси на още няколко ресурса, тематично свързани с това. Но този метод за търсене отнема доста време и с помощта на този метод можете да търсите документи, които са близки само по значение до текущия документ.

Ако нямаме адрес или връзки, се обръщаме към търсачки.

Достъп до сървъра за търсене (търсачката).За търсене на информация в Интернет са разработени специални системи за извличане на информация. Търсачките имат редовен адрес и се показват като уеб страница, съдържаща специални инструменти за организиране на търсене (низ за търсене, тематичен каталог, връзки). За да се обадите на търсачка, просто въведете нейния адрес в адресната лента на вашия браузър.

Според метода на организиране на търсенето на информация могат да се разграничат три типа системи за търсене на информация: тематични каталози (рубрикатори), речникови търсачки, метатърсачки.

Тематични каталози(рубрикатори) - търсачки, които използват йерархична (дървовидна) организация на информацията, структурирана по теми. Когато търси информация, потребителят преглежда тематични заглавия и избира желания клон, като постепенно стеснява полето за търсене.

Търсачката на Aport (www.aport.ru) разполага с най-пълния многостепенен йерархичен тематичен каталог с рускоезични интернет ресурси. Тематични директории на търсачката Aport са показани на Фигура 18.1. Каталогът съдържа подробна анотация на съдържанието на уеб сайтовете и посочване на географското им местоположение.

Ориз. 18.1. Тематични директории на търсачката Aport

Ако търсите информация по широка тема (образование, музика, медицина и т.н.), за да получите обща представа за наличните ресурси по дадена тема, тогава е препоръчително да се обърнете към указателя. Ако трябва да намерите конкретен сайт или документ, тогава директорията ще бъде неефективен инструмент за търсене.

Например, за да намерите информация за YURGUES в тематичния каталог на Aport, трябва да преминете доста дълъг път през рубриките Наука и образование / Образование / Висше професионално образование / Университети / Икономика и управление / Други. След това все още трябва да намерите желаната връзка в азбучен списък от 15 страници. Но от друга страна, този път даде възможност да се формира обща представа за разнообразието на руските образователни ресурси.

В допълнение към директориите с общо предназначение, в мрежата има много специализирани директории (по определени теми).

Речникови търсачкиса мощни автоматични софтуерни и хардуерни системи. Основата на търсачките са така наречените търсачки, или индекси. Специални програми за роботи (известни още като "паяци") автоматично периодично проверяват интернет въз основа на определени алгоритми, като индексират намерените документи. Данните за местоположението на тази или онази информация се въвеждат в специални справочници-индекси. Създадените индексни бази данни се използват от търсачките, за да предоставят на потребителя достъп до информация, публикувана в уеб възлите. Потребителят, в рамките на съответния интерфейс, формулира разследване, който се обработва от системата.

Разследване- това е ключова дума или фраза, формирана според определени правила - използвайки езика на заявката, който потребителят въвежда в лентата за търсене. За формиране на различни заявки се използват специални символи ("", ~), математически символи (*, +, -, ?), логически оператори (операции) Or, And, Not, оператор за близост Near.

След това резултатите от обработката на заявката се показват в прозореца на браузъра. В резултат на това на потребителя се предлагат онези адреси (URL), на които е намерена търсената дума или група от думи в момента на сканиране. Списъкът с връзки, предлагани на потребителя, се класира по уместност.Релевантнодокумент е документ, чието семантично съдържание съответства на заявка за информация.

Всяка връзка в списъка с резултати от търсенето съдържа фрагмент(англ. snippet - фрагмент, откъс) - няколко реда от намерения документ, сред които има желаните ключови думи. Преди да кликнете върху връзката, препоръчително е да оцените уместността на фрагмента за темата на заявката. След това, като кликнете върху връзката към конкретен сайт, си струва да видите главната страница. По правило първата страница е достатъчна, за да разберете дали сте дошли на адреса или не. Ако да, направете допълнителни търсения за необходимата информация на избрания сайт (в секции на сайта), ако не, върнете се към резултатите от търсенето и опитайте следващата връзка.

Този тип търсене е най-гъвкавият и мощен и ви позволява да търсите в мрежата информация по най-разнообразни, включително високоспециализирани теми.

Понастоящем в развитието на търсачките се наблюдава тенденция към комбиниране на автоматични индексни търсачки и ръчно съставени каталози на интернет ресурси. Ресурсите на тези системи успешно се допълват взаимно и комбинацията от техните възможности е съвсем логична. Повечето съвременни търсачки са смесени.

Днес има доста търсачки, както международни, така и местни. Първият индексира всички документи, публикувани в интернет подред. Вторият индексира ресурси, разположени в домейн зони с преобладаване на руския език. Ако потребителят е изправен пред задачата да намери нещо в рускоезичната част на мрежата, тогава най-вероятно най-успешният резултат ще бъде търсенето с рускоезични търсачки. На първо място, защото рускоезичните сървъри за търсене, за разлика от англоезичните, извършват търсения, като се отчита морфологията на руския език. Най-популярните търсачки са показани в Таблица 26.

1. Въведение

Всяка година обемът на Интернет се увеличава многократно, така че вероятността за намиране на необходимата информация се увеличава драстично. Интернет обединява милиони компютри, много различни мрежи, броят на потребителите се увеличава с 15-80% годишно. И въпреки това все по-често при достъп до Интернет основният проблем не е липсата на необходимата информация, а възможността да се намери. По правило обикновеният човек поради различни обстоятелства не може или не иска да отдели повече от 15-20 минути в търсене на отговора, от който се нуждае. Ето защо е особено важно правилно и компетентно да научите, изглежда, просто нещо - къде и как да търсите, за да получите ЖЕЛАНИТЕ отговори.

За да намерите необходимата информация, трябва да намерите нейния адрес. За това има специализирани сървъри за търсене (индексни роботи (търсачки), тематични интернет директории, системи за метатърсене, услуги за търсене на хора и др.). Този майсторски клас разкрива основните технологии за търсене на информация в Интернет, предоставя общи характеристики на инструментите за търсене, разглежда структурата на заявките за търсене за най-популярните рускоезични и англоезични търсачки.

2. Технологии за търсене

Уеб-технологията World Wide Web (WWW) се счита за специална технология за подготовка и поставяне на документи в Интернет. WWW включва уеб страници, електронни библиотеки, каталози и дори виртуални музеи! При такова изобилие от информация остро възниква въпросът: „Как да се ориентираме в такова огромно и мащабно информационно пространство?“
Инструментите за търсене идват на помощ при решаването на този проблем.

2.1 Инструменти за търсене

Инструментите за търсене са специален софтуер, чиято основна цел е да осигури най-оптималното и висококачествено търсене на информация за интернет потребителите. Инструментите за търсене се хостват на специални уеб сървъри, всеки от които изпълнява определена функция:

  1. Анализ на уеб страници и въвеждане на резултатите от анализа на едно или друго ниво на базата данни на сървъра за търсене.
  2. Търсене на информация по заявка на потребителя.
  3. Предоставяне на удобен за потребителя интерфейс за търсене на информация и преглед на резултата от търсенето от потребителя.

Методите на работа, използвани при работа с тези или други инструменти за търсене, са почти еднакви. Преди да продължите да ги обсъждате, помислете за следните понятия:

  1. Интерфейсът на инструмента за търсене е представен като страница с хипервръзки, низ за заявка (низ за търсене) и инструменти за активиране на заявка.
  2. Индексът на търсачката е информационна база, съдържаща резултат от анализа на уеб страниците, съставен по определени правила.
  3. Заявката е ключова дума или фраза, която потребителят въвежда в лентата за търсене. Специални знаци ("", ~), математически символи (*, +, ?) се използват за формиране на различни заявки.

Схемата за търсене на информация в Интернет е проста. Потребителят въвежда ключова фраза и активира търсенето, като по този начин получава селекция от документи според формулираната (дадена) заявка. Този списък с документи се класира според определени критерии, така че в горната част на списъка да са онези документи, които най-много отговарят на заявката на потребителя. Всеки от инструментите за търсене използва различни критерии за класиране на документи, както при анализа на резултатите от търсенето, така и при формирането на индекса (попълване на индексната база данни от уеб страници).

По този начин, ако посочите заявка със същия дизайн в низа за търсене за всеки инструмент за търсене, можете да получите различни резултати от търсенето. За потребителя е от голямо значение кои документи ще се появят в първите две-три дузини документи според резултатите от търсенето и доколко тези документи отговарят на очакванията на потребителя.

Повечето инструменти за търсене предлагат два начина за търсене − просто търсене(просто търсене) и подробно търсене(разширено търсене) със и без специален формуляр за заявка. Нека разгледаме и двата типа търсене на примера на англоезична търсачка.

Например, AltaVista е полезна за произволни заявки, "Нещо за онлайн степени в информационните технологии", докато инструментът за търсене на Yahoo ви позволява да получавате световни новини, информация за валутния курс или прогноза за времето.

Овладяването на критериите за прецизиране на заявката и усъвършенстваните техники за търсене ви позволява да повишите ефективността на търсенето и бързо да намерите необходимата информация. На първо място, можете да увеличите ефективността на търсенето, като използвате логически оператори (операции) Or, And, Near, Not, математически и специални символи в заявките. С помощта на оператори и/или символи потребителят свързва ключовите думи в желаната последователност, за да получи най-подходящия резултат от търсенето за заявката. Формулярите за заявка са показани в Таблица 1.

маса 1

Една проста заявка дава редица връзки към документи, т.к списъкът включва документи, съдържащи една от думите, въведени при искането, или проста фраза (виж таблица 1). Операторът и ви позволява да посочите, че всички ключови думи трябва да бъдат включени в съдържанието на документа. Въпреки това броят на документите все още може да е голям и прегледът им може да отнеме много време. Ето защо в някои случаи е много по-удобно да се използва операторът на близкия контекст, който показва, че думите трябва да бъдат разположени в достатъчна близост в документа. Използването близо до значително намалява броя на намерените документи. Наличието на символа "*" в низа на заявката означава, че думата ще се търси по нейната маска. Например, нека получим списък с документи, съдържащи думи, започващи с "gov", ако напишем "gov*" в низа на заявката. Това могат да бъдат думите правителство, губернатор и т.н.

Също толкова популярната търсачка Rambler поддържа статистика за трафика на връзки от собствената си база данни, същите логически оператори И, ИЛИ, НЕ, метазнака * (подобно на знака * в AltaVista, който разширява обхвата на заявката), символите за коефициенти + и - са поддържа се за увеличаване или намаляване на думите за значение, въведени в заявката.

Нека разгледаме най-популярните технологии за търсене на информация в Интернет.

2.2 Търсачки

Уеб търсачките са сървъри с огромна база данни от URL адреси, които автоматично осъществяват достъп до WWW страници на всички тези адреси, разглеждат съдържанието на тези страници, формират и записват ключови думи от страниците в тяхната база данни (индексни страници).

Освен това роботите на търсачките следват връзките, които срещат на страниците, и ги индексират повторно. Тъй като почти всяка WWW страница има много връзки към други страници, с такава работа търсачката в крайния резултат може теоретично да заобиколи всички сайтове в Интернет.

Именно този тип инструменти за търсене е най-известният и популярен сред всички потребители на Интернет. Всички знаят имената на добре познати уеб търсачки (търсачки) - Yandex, Rambler, Aport.

За да използвате този тип инструмент за търсене, трябва да отидете до него и да въведете в лентата за търсене ключовата дума, която ви интересува. След това ще получите изход от връзките, съхранени в базата данни на търсачката, които са най-близо до вашата заявка. За да направите търсенето най-ефективно, обърнете внимание на следните точки предварително:

  • решават по темата на искането. Какво точно търсиш в крайна сметка?
  • обърнете внимание на езика, граматиката, използването на различни не азбучни знаци, морфологията.Важно е също правилно формулирането и въвеждането на ключови думи. Всяка търсачка има своя собствена форма за отправяне на заявка – принципът е един и същ, но използваните символи или оператори могат да се различават. Необходимите формуляри за заявка също варират в зависимост от сложността на софтуера на търсачката и услугите, които предоставят. По един или друг начин всяка търсачка има раздел „Помощ“ („Помощ“), където всички правила на синтаксиса, както и препоръки и съвети за търсене, са обяснени по достъпен начин (екранна снимка на страниците на търсачката).
  • използвайте възможностите на различни търсачки. Ако не можете да го намерите в Yandex, опитайте Google. Използвайте услугите за разширено търсене.
  • за да изключите документи, съдържащи определени термини, използвайте знака "-" преди всяка такава дума. Например, ако искате информация за произведенията на Шекспир, с изключение на "Хамлет", тогава въведете заявката във формата: "Шекспир-Хамлет". И за да сте сигурни, че определени връзки непременно са включени в резултатите от търсенето, използвайте символа "+". Така че, за да намерите връзки конкретно за продажба на автомобили, имате нужда от заявката "продажба + кола". За да увеличите ефективността и точността на вашето търсене, използвайте комбинации от тези символи.
  • всяка връзка в списъка с резултати от търсенето съдържа - няколко реда от намерения документ, сред които има вашите ключови думи. Преди да кликнете върху връзката, оценете уместността на фрагмента спрямо темата на заявката. След като щракнете върху връзката към конкретен сайт, разгледайте внимателно главната страница. По правило първата страница е достатъчна, за да разберете дали сте дошли на адреса или не. Ако да, направете допълнителни търсения за необходимата информация на избрания сайт (в секции на сайта), ако не, върнете се към резултатите от търсенето и опитайте следващата връзка.
  • не забравяйте, че търсачките не произвеждат независима информация (освен обяснения за себе си). Търсачката е само посредник между собственика на информацията (уебсайта) и Вас. Базите данни се актуализират непрекъснато, в тях се въвеждат нови адреси, но все още остава изоставането от информацията, която наистина съществува в света. Просто защото търсачките не работят със скоростта на светлината.

Най-известните уеб търсачки включват Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Сред рускоговорящите могат да се откроят Yandex, Rambler, Aport.

Търсачките са най-големите и най-ценните, но далеч не единствените източници на информация в мрежата, защото освен тях има и други начини за търсене в интернет.

2.3 Указатели

Каталогът с интернет ресурси е йерархичен каталог, който се актуализира и попълва постоянно, съдържащ множество категории и отделни уеб сървъри с кратко описание на съдържанието им. Методът за търсене в каталога предполага „преместване надолу по стъпките“, тоест преминаване от по-общи категории към по-конкретни. Едно от предимствата на тематичните директории е, че обясненията към връзките са дадени от създателите на директорията и напълно отразяват нейното съдържание, тоест ви дава възможност да определите по-точно как съдържанието на сървъра отговаря на целта на вашето търсене.

Пример за тематичен рускоезичен каталог е ресурсът http://www.ulitka.ru/.

На главната страница на този сайт има тематичен рубрикатор,

с помощта на които потребителят влиза в рубриката с връзки към интересуващите го продукти.

Освен това някои тематични директории ви позволяват да търсите по ключови думи. Потребителят въвежда желаната ключова дума в лентата за търсене

и получава списък с връзки с описания на сайтове, които най-много отговарят на неговата заявка. Трябва да се отбележи, че това търсене не се извършва в съдържанието на WWW-сървърите, а в тяхното кратко описание, съхранявано в директорията.

В нашия пример директорията също има възможност да сортира сайтове по брой посещения, по азбучен ред, по дата на влизане.

Други примери за указатели на руски език:
[email protected]
Уеблист
Vsego.ru
Сред англоезичните указатели са:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Колекции от връзки

Колекциите от връзки са връзки, сортирани по тема. Те са доста различни един от друг по отношение на съдържанието, така че за да намерите селекция, която най-добре отговаря на вашите интереси, трябва да преминете през тях сами, за да формирате собствено мнение.

Като пример ще дадем селекция от връзки "Съкровищата на Интернет" АД "Релком"

Потребителят, като щракне върху някоя от секциите, които го интересуват

  • СЪДЪРЖАНИЕ

    За автомобилистите

    • Астрономия и астрология
    • Твоят дом
    • Вашите домашни любимци
    • Децата са цветята на живота
    • Свободно време
    • Градове в интернет
    • Здраве и медицина
    • Информационни агенции и услуги
    • краеведски музей и др.
    • Автомобилна електроника.
    • Античен автомобилен музей.
    • Съвет за правна защита на собствениците на автомобили.
    • sportdrive.

    Предимството на този тип инструменти за търсене е тяхната насоченост, обикновено подборът включва редки интернет ресурси, избрани от конкретен уебмастър или собственик на уеб страница.

    2.5 Адресни бази данни

    Адресните бази данни са специални сървъри за търсене, които обикновено използват класификации по вид дейност, по предоставяни продукти и услуги и по география. Понякога те се допълват от търсене по азбучен ред. Записите на базата данни съхраняват информация за сайтове, които предоставят информация за имейл адреса, организацията и пощенския адрес срещу заплащане.

    Най-голямата англоезична адресна база данни може да се нарече: http://www.lookup.com/ -

    Влизайки в тези поддиректории, потребителят намира връзки към сайтове, които предлагат информация от интерес за него.

    Широко достъпните и официални бази данни с адреси в Руската федерация са неизвестни за нас.

    2.6 Търсене в Gopher архиви

    Gopher е взаимосвързана система от сървъри (пространство Gopher), разпределени в Интернет.

    Най-богатата литературна библиотека е събрана в пространството Gopher, но материалите не са достъпни за отдалечен преглед: потребителят може само да преглежда йерархично организираното съдържание и да избира файл по заглавие. С помощта на специална програма (Veronica) такова търсене може да се извърши автоматично с помощта на заявки въз основа на ключови думи.

    До 1995 г. Gopher беше най-динамичната интернет технология: темпът на растеж на броя на свързаните сървъри изпреварва темпа на растеж на сървърите на всички други видове Интернет. В мрежата на EUnet/Relcom сървърите Gopher не са получили активно развитие и днес почти никой не ги помни.

    2.7 FTP система за търсене на файлове (FTP търсене)

    Търсачката на FTP файлове е специален тип интернет търсачка, която ви позволява да намерите файлове, налични на "анонимни" FTP сървъри. Протоколът FTP е предназначен за прехвърляне на файлове през мрежа и в този смисъл той функционално е един вид аналог на Gopher.

    Основният критерий за търсене е името на файла, определено по различни начини (точно съвпадение, подниз, регулярен израз и т.н.). Този тип търсене, разбира се, не може да се конкурира с търсачките по отношение на възможностите, тъй като съдържанието на файловете не се взема предвид по никакъв начин по време на търсенето, а файловете, както знаете, могат да получат произволни имена. Ако обаче трябва да намерите някаква добре позната програма или стандартно описание, тогава с голяма степен на вероятност съдържащият го файл ще има подходящото име и можете да го намерите с помощта на един от сървърите за FTP търсене:

    FileSearch търси файлове на FTP сървъри по имената на самите файлове и директории. Ако търсите програма или нещо друго, тогава на WWW-сървърите най-вероятно ще намерите тяхното описание, а от FTP-сървърите можете да ги изтеглите за себе си.

    2.8 Търсачка в пресконференции на Usenet

    USENET NEWS е телеконферентната система на интернет общността. На Запад тази услуга се нарича новини. Близък аналог на телеконферентната връзка са така наречените "ехо" в мрежата FIDO.

    От гледна точка на абонатите на телеконференция, USENET е табло за бюлетини, което има секции, в които можете да намерите статии за всичко - от политика до градинарство. Това табло за бюлетини е достъпно чрез компютър, подобно на имейла. Без да напускате компютъра си, можете да четете или публикувате статии на определена конференция, да намерите полезни съвети или да се присъедините към дискусии. Естествено, артикулите заемат място на компютрите, така че не се съхраняват вечно, а периодично се унищожават, освобождавайки място за нови. В световен мащаб най-добрата услуга за намиране на информация в конференции на Usenet е сървърът на Google Groups (Google Inc.).

    Google Groups е безплатна онлайн общност и услуга за дискусионни групи, която предлага най-големия архив от съобщения на Usenet в Интернет (повече от милиард съобщения). За повече информация относно условията за ползване на услугата, моля, посетете http://groups. google.com/intl/ru /googlegroups/tour/index.html

    Сред рускоговорящите се открояват сървърът USENET World System и телеконференциите на Relcom. Точно както в други услуги за търсене, потребителят въвежда низ за заявка, а сървърът генерира списък с конференции, съдържащи ключови думи. След това трябва да се абонирате за избраните конференции в новинарската програма. Има и подобен руски FidoNet Online сървър: Fido конференции на WWW.

    2.9 Системи за мета търсене

    За бързо търсене в базите данни на няколко търсачки наведнъж е по-добре да се обърнете към системите за метатърсене.

    Мета търсачките са търсачки, които изпращат вашата заявка до огромен брой различни търсачки, след което обработват резултатите, премахват дублиращи се адреси на ресурси и представят по-широк спектър от това, което е представено в Интернет.

    Най-популярната мета-търсачка в света е Search.com.

    Unified Search.com търсачка от CNET, Inc. включва почти две дузини търсачки, връзки към които са изпълнени с целия интернет.

    Използвайки този тип инструменти за търсене, потребителят може да търси информация в различни търсачки, но отрицателната страна на тези системи може да се нарече тяхната нестабилност.

    2.10 Системи за търсене на хора

    Системите за търсене на хора са специални сървъри, които ви позволяват да търсите хора в Интернет, потребителят може да посочи пълното име. човек и да получите неговия имейл адрес и URL. Трябва обаче да се отбележи, че търсачките за хора обикновено вземат информация за имейл адреси от отворени източници, като форуми на Usenet. Сред най-известните системи за търсене на хора са:

    Намиране на имейл адреси

    в специални полета за търсене на информация за контакт (Име. Град, Фамилия, Телефонен номер), можете да намерите информацията, която ви интересува.

    Търсачките за хора са наистина големи сървъри, техните бази данни съдържат около 6 000 000 адреса.

    3. Заключение

    Разгледахме основните технологии за търсене на информация в Интернет и представихме в общи линии инструментите за търсене, които в момента съществуват в Интернет, както и структурата на заявките за търсене за най-популярните рускоезични и англоезични търсачки и, Обобщавайки горното, искаме да отбележим, че единна оптимална схема за търсене на информация в Интернет не съществува. В зависимост от конкретната информация, от която се нуждаете, можете да използвате подходящите инструменти за търсене и услуги. И качеството на резултатите от търсенето зависи от това колко компетентно са избрани услугите за търсене.

  • Федерална агенция за образование

    Смоленски държавен университет

    Технологии за търсене на информация в Интернет.

    Смоленск


    Въведение…………………………………………………………………………..

    1. Класификация на търсачките ……………………………………………

    2.Методи на търсене………………………………………………………………………………..

    2.1.Просто търсене………………………………………………………………………………………..

    2.2.Разширено търсене………………………………………………………………………….

    3.Тематична директория на Yahoo.……………………………………………………

    4.Автоматичен индекс на Alta Vista………………………………………………………

    5.Търсене на информация в конференции (Usenet)…………………………………………..

    6. Услуги за вътрешно търсене …………………………………………..

    6.1.Rambler…………………………………………………………………………………………….

    7.Търсене на файлове ……………………………………………………………………..

    8. Източници на специализирана информация ………………………………

    9. Търсене на лица в Интернет …………………………………………………………

    10. Метатърсене………………………………………………………………………………..

    11. Ефективно търсене на информация………………………………………………………

    Заключение…………………………………………………………………………………………….

    Литература……………………………………………………………………………………………..

    Въведение

    Всеки, който някога се е опитвал да намери точната информация в интернет, със сигурност ще се съгласи, че този процес е като търсене на игла в купа сено. Глобалният интернет съдържа огромно количество информация, която се разраства бързо всеки ден. Поради това често се оказва, че задачата за намиране на необходимата информация в този информационен океан е изключително сложна и човек трябва да може ефективно да използва различни търсачки (програми за търсене в мрежата). Трябва да се има предвид, че „търсенето е изкуство“.

    1. Класификация на търсачките

    Има много различни търсачки, собственост на различни компании. На първо място се разграничават така наречените тематични директории (например Yahoo) и автоматични индекси (например AltaVista), въпреки че трябва да се има предвид, че редица търсачки заемат някаква междинна позиция между тези два „полюса “, тоест те съдържат елементи и от двата класа. Всяка от търсачките има собствена обширна база данни с адреси (местоположение) на различни уеб документи и търсенето на връзки към информацията, от която се нуждаем, става не в самите уеб документи, а в тази база данни.

    Тематични каталози и автоматични индекси се различават преди всичко по това как се формират и попълват техните бази данни: дали хората участват в този процес, или всичко се случва напълно автоматично.

    Бази данни от предметни директории се съставят и систематично актуализират от експерти в съответните области на базата на нови уеб документи, открити в Интернет чрез специални програми за търсене. Каталогът с предмети представя на интернет потребителя дървовидна структура от категории (секции и подраздели), на чието най-горно ниво са събрани най-общите понятия като наука, изкуство, бизнес и др., и елементите на най-ниското ниво са връзки към отделни уеб страници и сървъри, заедно с кратко описание на тяхното съдържание. Този йерархичен каталог може да бъде обходен, като се започне от по-общи категории (концепции) до по-тесни, по-специализирани.

    Например, за да намерите информация за състоянието на научните изследвания в теорията на суперструните, можете да слезете по следната „стълба“ от понятия:

    наука (наука)

    физика (физика)

    Теоретична физика (теоретична физика)

    теории

    Струнни теории


    Резултатът ще бъде списък със сайтове, сред които сайтът Superstrings представлява най-голям интерес. Щракването върху хипервръзката Superstrings ни отвежда до началната страница на сайта със съответното заглавие, където можете да намерите онлайн учебник по теория на суперструните, различни връзки за по-нататъшно четене, речник на суперструните и т.н.

    Основното предимство на тематичните директории е голямата стойност на информацията, получена от потребителя, което се осигурява от наличието на "човешки фактор" в процеса на анализиране и сортиране на нови уеб страници. От друга страна, тематичните каталози имат съществен недостатък, отново свързан с човешкия фактор, тъй като поради ограничените човешки възможности техните бази данни покриват само малка част от цялото информационно уеб пространство (под 1%). Така, въпреки полезността на тематичните директории, използването само на търсачки от този тип често се оказва явно недостатъчно.

    Обобщена таблица на избрани тематични каталози

    List.Ru Aport Yandex Rambler Yahoo! относно
    основни характеристики 19 секции от най-високо ниво 14 секции от най-високо ниво 10 основни раздела, 7 комбинирани, допълнителна класификация 56 раздела 14 основни раздела 36 раздела
    Сортиране на ресурси в рамките на раздел Азбука, рейтинг на ръководствата, популярност (посещаемост), дата Азбука, посещаемост, лига, оценка на броя на връзките към този ресурс, потребителско мнение Азбука, добавена дата, индекс на цитати по присъствие по азбучен ред чрез платени връзки
    Булеви оператори Използва се език на търсачката Aport Използва се език на търсачката Yandex Използва се езикът на търсачката Rambler. Не Не
    Търсене по фраза " " " "
    Префикси +, - +, -
    Итеративно търсене (в резултатите) Има търсене в рамките на категорията След като влезете, щракнете върху Още...
    заместване на част от дума * * (не винаги правилно)

    За разлика от предметните директории, базите данни за автоматични индекси се създават и попълват напълно автоматично от някои специални, вътрешни търсачки, които преглеждат интернет сайтове (сайтове) денонощно в търсене на новопоявили се уеб документи. От всеки такъв документ роботът извлича всички нови връзки, съдържащи се в него и ги добавя към своята адресна база данни, в резултат на което програмата на робота има възможност да преглежда определен брой нови уеб документи за нея. Във всеки нов уеб документ роботът анализира всички думи в него и в секцията на базата данни, съответстваща на всяка дадена дума, запомня адреса (URL) на документа, където е била срещната тази дума. Така базата данни, създадена от автоматичния индекс, всъщност съхранява информация за това кои уеб документи съдържат определени думи. За разлика от тематичните директории, автоматичните индекси покриват до 25% от общото уеб пространство.

    Автоматичният индекс има отделна търсачка за предоставяне на потребителски интерфейс. Тази система може да търси в базата данни за даден набор от ключови думи, за да намери и покаже на екрана адресите на компютъра на потребителя и кратка информация за всички уеб страници, които съдържат даден набор от ключови думи. По този начин автоматичният индекс се състои от три части: робот, база данни, която този робот събира, и интерфейс за търсене в тази база данни. Потребителят работи с последния компонент. По силата на тази организация, автоматичният индекс не прави никаква класификация или оценка на информацията.

    Интерфейсът за автоматичен индекс позволява на потребителя да посочи набор от ключови думи, които от негова гледна точка са характерни за документите, които търси, и по този начин му позволяват да намери доста ограничен брой потенциално подходящи уеб страници. Като такива могат да се използват някои специфични термини и техните комбинации, доста редки фамилни имена и др.

    Успехът при намирането на необходимата информация до голяма степен се определя от правилния избор на ключови думи, защото в противен случай търсачката може да върне хиляди и милиони връзки към неподходящи уеб документи.

    Трябва да се има предвид, че начинаещият потребител има много различни изненади, понякога достигащи до анекдотични ситуации.

    Ако за автоматични индекси търсенето по ключови думи е единственият начин за намиране на необходимата информация, то в тематични директории (например в Yahoo!) този инструмент е алтернативен начин за търсене заедно с пътуване през системата (дървото) от вложени категории .

    Някои видове услуги за търсене са услуги за оценка. Те предоставят на клиента готов списък с някои връзки, които са били достъпни най-често от други потребители на Интернет. Когато става въпрос за теми от обществен интерес, като новини, музика и др., подобни статистически препоръки са много удобни и полезни. Такива услуги по-специално се предоставят от местната услуга на Rambler.

    2. Техники за търсене

    2.1. Просто търсене

    Всяка търсачка (PS) предоставя свои собствени методи за търсене и има свои собствени характеристики в правилата за запис на комбинации от ключови думи. Въпреки това, има общи елементи, които са еднакво валидни за повечето търсачки. Обикновено всички SE позволяват да се търсят в уеб документи за ключови думи, които са специфични за търсения документ. Изборът на такива думи често е нетривиална задача.

    По правило посочването на една ключова дума не е достатъчно и тогава възниква въпросът как да посочите съответните им комбинации. Нека например искаме да получим информация за руския носител на Нобелова награда за 2000 г. Жорес Алферов. Посочване само на фамилното име в полето за търсене

    ще доведе до откриването на огромен брой документи, повечето от които нямат нищо общо с физиката, която ни интересува. Чрез въвеждане на две ключови думи в полето за търсене

    разделени с интервал, трябва да имаме предвид, че различните търсачки реагират на този знак по различни начини. Повечето UA третират пространството като логически оператор "или" (ИЛИ) (това включва Yahoo, AltaVista и др.). Следователно търсенето по комбинацията от думи Zhorez Alferov няма да намали, а, напротив, ще увеличи броя на документите, открити от търсачката: всички документи ще бъдат намерени, където или думата Zhorez, или думата Alferov, или и двете тези думи се срещат заедно.

    В такива случаи, за по-адекватно търсене, можете да използвате затварянето на ключови думи в кавички, които определят точната комбинация от символи, поставени в тях:

    "Жорез Алферов".

    Това обаче няма да намери документи, които включват комбинация от тези думи в различен ред (Алферов Жорез), тъй като всичко, поставено в кавички, е една фраза и търсачката търси документи за абсолютно точно съвпадение на всички знаци от това фраза.

    За да намерим само онези уеб страници, които съдържат всички наши ключови думи едновременно, трябва да поставим знак плюс пред всяка от тях. Например,

    Жорез + Алферов

    ще доведе до намиране на уеб документи, където и думата Zhorez, и думата Alferov задължително присъстват, и то не само в произволен ред, но и на всяко разстояние един от друг (в последния случай може да няма логическа връзка между тези думи в намереният документ).

    Знакът минус преди дума изключва всички документи, които я съдържат, което може да бъде много полезно в някои случаи. Например, ако трябва да намерим различни произведения на геометрична, но не и вълнова оптика, тогава можем да зададем следната комбинация от ключови думи

    Светлина+оптика-вълна

    Трябва да се има предвид, че много думи могат да имат една и съща основа, но различни окончания (например посочване на множествено число на английски, падеж, завършващ на руски и т.н.). В тази връзка много търсачки, след като са получили заявка под формата на поредица от ключови думи, я нормализират: те изхвърлят от тази заявка всички думи, състоящи се от по-малко от четири знака (например английският предлог на), а също така отхвърлят различни окончания и наставки.

    Например, за да не пропуснете документ, който включва фразата "В геометричната оптика, светлинен лъч ...", търсачката може да намали (нормализира) горната заявка във формата

    Светлина+оптика*-вълни* (1)

    Тук знакът звездичка (*) обозначава всяка комбинация от знаци след корена на съответните думи.

    Тъй като не всички PS извършват такава първоначална обработка на заявката на клиента, препоръчително е сами да зададете заявката във формата (1), тоест да използвате символа „звездичка“, за да посочите възможни вариации в окончанията на ключовите думи.

    Има разлика, която трябва да имате предвид, когато използвате големи (главни) и малки (малки) букви в ключови думи. Обикновено търсенето с малки букви взема предвид съвпаденията както когато текстът съдържа голяма буква, така и когато е малка. Писането на ключови думи с главни букви означава търсене на документи, съдържащи думата в тази форма.

    Може да бъде много полезно да търсите ключови думи само в заглавията на уеб страниците, тъй като значението на заглавието на документ обикновено е по-голямо от значението на неговия текст. В различни PS търсенето на ключови думи само в заглавията на уеб страниците се определя с помощта на различни служебни думи: в AltaVista тази дума е title:, в Yahoo! - t: в Rambler - $ title: и т.н.

    2.2. подробно търсене

    Простите методи за търсене не винаги ни позволяват да намерим нужните ни уеб документи с достатъчна ефективност и следователно търсачките предоставят на клиента възможност да използва така наречените инструменти за разширено търсене. Заявките за разширено търсене са изградени от ключови думи, свързани с логически оператори, и имат формата, подобна на булевите изрази, използвани в езиците за програмиране.

    В този случай, в допълнение към стандартните логически операции ИЛИ („или“), И („и“) и НЕ (отрицание), операцията БЛИЗО се използва (и е много ефективна!) за определяне на степента на близост до всяка от тях. други ключови думи в уеб документ.

    При изпълнение на сложни заявки е важно да се разбере реда, в който се изпълняват горните операции, тоест какъв е техният приоритет. В последователността ИЛИ, И, НЕ, БЛИЗО, приоритетът на операциите се увеличава отляво надясно. Редът на изпълнение на отделни елементи от сложна заявка може да се променя с помощта на скоби, както е обичайно при писане на булеви изрази в програмирането.

    За разлика от простите инструменти за търсене, инструментите за разширено търсене са много по-стандартизирани в търсачките. Голямо предимство на разширеното търсене е и гъвкавостта на опциите за изграждане на заявки, предлагани на клиента, а значителен недостатък е много по-бавната му работа в сравнение с обикновеното търсене.

    ИЛИ (операторът "или") изпълнява същата функция като символа за интервал в простите заявки за търсене в повечето PS. Например молба

    търси документи, които съдържат или храста на думите, или режимите на думи, или и двете.

    И (операцията "и") води до намиране на документи, в които и двете думи, свързани с тази операция, със сигурност ще се появят, но те могат да бъдат на произволно разстояние една от друга. В резултат на това може да се окаже, че няма логическа връзка между двете дадени ключови думи в документа. Например в отговор на искане

    Търсачката AltaVista дава връзки не само към съответните научни трудове по нелинейна динамика, но и към отделни глави от добре познатия научнофантастичен роман на Х. Уелс „Борбата на световете“, които, разбира се, нямат нищо общо с предмета на търсенето.

    NOT е оператор за отрицание, който ви позволява да изключите онези уеб документи, които съдържат ненужна фраза (по този начин този оператор при сложно търсене играе същата роля като знака минус при обикновено търсене).

    NEAR (логическа операция, показваща колко близки са ключовите думи една до друга) е една от най-удобните команди за разширено търсене. В различните търсачки концепцията за близост на думите е различна. Например, AltaVista разглежда близки думи, които са разделени с не повече от десет други думи. Някои други PS позволяват изрична индикация за степента на близост при писане на операцията NEAR, тоест те ви позволяват да определите максималния разрешен брой външни думи, които могат да стоят между две ключови думи, свързани с тази операция.

    Преглед на заявката


    ще доведе до търсене на документи, в които двете посочени ключови думи са достатъчно близки една до друга и следователно най-вероятно свързани по значение. Например, текстът на уеб страница може да съдържа фразата: "Храсти на нормални режими...".

    Жорес ДО Алферов

    ще доведе до търсене на документи, които съдържат фразите Жорес Иванович Алферов, Алферов Жорес Иванович и др. Имайте предвид, че при използване на операцията NEAR е невъзможно да се посочи реда на ключовите думи в документа, което обаче по-скоро не е недостатък, но предимство и това ясно се вижда от току-що дадената заявка.

    Както вече споменахме, използвайки горните логически операции, можете да посочите заявка за търсене под формата на сложен логически израз.

    Въпреки съществуването на някои общи принципи за организиране на търсенето на уеб документи, различните PS могат да се различават значително един от друг по отношение на възможностите, предоставени на клиента, по външния вид на основните им страници и т.н., поради което е желателно да се запознаят с тях при работа директно в мрежата.Интернет.

    Като пример, по-долу е много кратко, схематично описание на две от най-популярните в момента SEs Yahoo (тема директория) и AltaVista (автоматичен индекс).

    3. Тематична директория на Yahoo

    Тази система беше една от първите, които се появиха в мрежата, а днес Yahoo си сътрудничи с много производители на инструменти за извличане на информация и на различните му сървъри се използва различен софтуер. Търсачката на Yahoo може да бъде достъпна чрез http://www.yahoo.com.

    Имайте предвид, че браузърите обикновено позволяват възможността за въвеждане на непълен адрес. Например, за да се обадите на Yahoo, можете да въведете само думата Yahoo в полето за адрес, а останалата част от адреса се добавя автоматично от браузъра.

    Началната страница на Yahoo предоставя на клиента достъп до два основни метода за работа с тази търсачка - търсене на уеб документи по ключови думи, чието зададено поле е вляво от бутона "Търсене" ("Търсене"), и търсене използвайки йерархично дърво от различни раздели (категории) по-долу.

    Имайте предвид, че и в двата случая търсенето на връзка към желания уеб документ се извършва в една и съща база данни, но по различни начини.

    Като щракнете върху името на раздела от тематичния каталог, който ни интересува, ще видим нова страница на Yahoo, която има точно същата структура като главната страница: съдържа поле за търсене по ключови думи и списък с подраздели на секцията, която имаме избрани и др.

    На началната страница на Yahoo можете също да видите реклами, различни допълнителни категории, например новини, които съдържат по-специално информация за времето и др.

    Ако общият брой връзки, намерени от Yahoo, е достатъчно голям, тогава списъкът с тези връзки се разделя на части. По подразбиране тази част съдържа 20 връзки, но този номер може да бъде променен чрез достъп до страницата с опции за търсене, чийто бутон за стартиране се намира до бутона „Търсене“. Там можете също да предефинирате ролята на интервала между ключовите думи (независимо дали се счита за логическа операция ИЛИ или логическа операция И) и т.н.

    На страницата с опции има и превключвател, който ви позволява да включвате или изключвате режима за търсене на цели думи. В режим Substrings Yahoo ще намери всички връзки, в които думата, която посочихме, е не само сама по себе си, но е и част от други думи, например търсенето на думата "art" (art) ще работи върху думата "department “ (отдел, отдел и др.) г.). По подразбиране режимът на поднизове е настроен, така че потребителят да не е принуден да въвежда всяко съществително в единствено и множествено число (т.е. със завършване "-s") и т.н. Напротив, в режима на пълни думи са подредени от нас ключови думи само ако са разделени от двете страни с интервали или препинателни знаци.

    Търсачката на Yahoo търси в няколко различни бази данни за съвпадащи връзки към документи, предимно имена на категории и заглавия на уеб сайтове. Ако нужните ви връзки не бъдат намерени по този начин, Yahoo автоматично ще търси в базата данни за отделни уеб страници. Клиентът може да поръча търсене в една от тези бази данни, като щракне върху бутоните под полето за въвеждане на ключова дума. Резултатите от търсенето на Yahoo се подреждат от Yahoo според няколко критерия, които определят класирането на дадена връзка. По-висока оценка се дава на документи, в които ключовите думи се появяват повече пъти, в които се появяват в заглавието или ако връзката съответства на по-висок раздел в дървото на категориите.

    В края на страницата с резултати от търсенето Yahoo предлага да използва няколко други търсачки, ако клиентът не е доволен от резултатите от това търсене. Такива връзки са удобни с това, че системата Yahoo при достъп до тях сама ще въведе нашите ключови думи във формата на заявка на друга търсачка, наречена така. В заключение, Yahoo предоставя около милион връзки към уеб страници и това е малко над 0,1% от цялото уеб пространство.

    4. Автоматичен индекс на Alta Vista

    Тази търсачка може да бъде извикана на адрес: http://altavista.digital.com (за много браузъри е достатъчно да въведете само думата altavista).

    Alta Vista има една от най-големите бази данни в класа на автоматичните индекси и най-мощните и гъвкави правила за изграждане на заявки. В същото време Alta Vista има както проста система за търсене, така и разширена система за търсене, чийто бутон се намира под полето за въвеждане на ключова дума.

    Възможно е също да се търси информация с помощта на каталога на категориите, който е подобен на системния каталог на Yahoo, освен това търсенето по ключови думи може да се извършва само в рамките на определена категория.

    Уеб документи могат да се търсят за ключови думи в база данни за WWW страници или в база данни на дискусионни групи (Usenet). За да изберете една от тези бази данни - съдържание на WWW или Usenet - има падащ списък, който може да бъде извикан с бутона, разположен под заглавната лента на тази система на главната й страница.

    Когато използвате простата система за търсене на Alta Vista, трябва да се отбележи, че тя се различава от съответния инструмент Yahoo PS. Всъщност по подразбиране Alta Vista, за разлика от Yahoo, търси поява на цели думи: подреденият термин трябва да стои самостоятелно в уеб документа и да не е част от други низове от знаци. Ако трябва да намерите всички срещания на дадена ключова дума, дори когато е част от други думи, трябва да използвате символа * (този символ може да се появи само в края на ключовата дума и да замества не повече от пет букви). Например, заявка като Ada* ще върне документи, съдържащи думите "Ada", "Adam", "Adagio" и т.н.

    Търсачката Alta Vista, подобно на повечето други търсачки, предлага на клиента редица допълнителни функции, по-специално ви позволява да намерите само онези уеб документи, в които дадените ключови думи се срещат само в хипертекстови връзки, заглавия на документи, в техния URL адрес адреси (което прави възможно намирането на всички уеб страници, намиращи се на сървъра с даден адрес) и т.н. За целта Alta Vista използва специални команди: Anchor, title и т.н. Тези функции могат да се използват както поотделно, така и заедно с всяка друг приятел.

    Формата за разширено търсене (разширено търсене) се различава от формата на обикновена заявка по наличието на две полета. Вторият от тях - Критерии за класиране на резултатите - е напълно подобен на полето за въвеждане на простата форма за търсене и в него можете да използвате същите специални изрази, кавички и знаци +, -, *. Тук обаче това поле играе само спомагателна роля, определяйки реда на сортиране на резултатите: първи ще бъдат изброени документи, съдържащи ключови думи от полето за класиране.

    Ключови думи за реалното търсене трябва да бъдат въведени в първото от полетата - Критерии за избор. Заявките в това поле се изграждат съгласно правилата, които описахме по-рано с помощта на операциите БЛИЗО, НЕ, И, ИЛИ. Освен това в долната част на формуляра за търсене има поле за въвеждане на дати, които ви позволяват да зададете периода от време, в който са създадени или променени интересуващите ни документи.

    Нека да отбележим за особеностите на търсенето на документи на руски език в Alta Vista, че няма смисъл да търсите документи по руски ключови думи в каталога на Yahoo, тъй като служителите на тази услуга не говорят руски.

    5. Намиране на информация в конференции (Usenet)

    WWW-страниците са най-големият и най-ценният, но не и единственият източник на информация в Интернет. Голям интерес представлява системата за телеконферентна връзка Usenet, в която всеки ден се публикуват повече от 100 хиляди съобщения от цял ​​свят.

    Ако клиент се интересува от конкретна тема, той може просто да се абонира за съответната дискусионна група. Ако обаче иска да не обсъжда проблема си с живи хора, а просто да разбере какво е известно по даден въпрос, можете да използвате автоматични системи за търсене в съдържанието на Usenet. Alta Vista поддържа отделен индекс от повече от 10 000 телеконференции, за да търсите, в които трябва само да преместите превключвателя за търсене от „Web“ на „Usenet“ (всички правила за съставяне на заявка и опции за настройка са еднакви и в двете случаи). Резултатите от търсенето са сортиран списък със заглавия на статии, пълният текст на всяка от които може да бъде получен чрез щракване върху заглавието.

    Сървърът DejaNews (http://www.dejanews.com) се счита за най-добрата услуга за намиране на информация в конференции на Usenet по целия свят. Сред рускоговорящите се откроява сървърът RusNews (http://news.corvis.ru), който също е сървър за новини, съдържащ повече от 2000 дискусионни групи. Има и подобен руски сървър TELA-search (http://tela.dux.ru/news.html).

    Напълно уникален източник на информация са документите с отговори на често задавани въпроси (Често задавани въпроси, ЧЗВ). Този жанр въпроси и отговори перфектно въвежда напълно неподготвен читател в самата същност на въпроса. Докато първоначално списъците с често задавани въпроси съществуваха само за дискусионни групи, сега документи със заглавие „ЧЗВ“ се използват за клиенти на голямо разнообразие от сървъри и услуги. Статии и рецензии са написани в този жанр и фирмите и организациите популяризират своите цели и стремежи. Ако клиентът трябва бързо да се запознае с нова област на науката, технологиите, културата или политиката, добре е да започнете, като прочетете раздела „Често задавани въпроси“ на съответната дискусионна група на Usenet. И въпреки че по този начин човек не може да придобие твърде фундаментални знания, човек може бързо да свикне с терминологията, да научи за най-наболелите проблеми и често да получи почти изчерпателен списък с литература.

    6. Услуги за вътрешно търсене

    Руският сектор на Интернет в момента се развива бързо и въпреки че местните търсачки все още изостават от съответните чуждестранни системи по отношение на обема на техните каталози и индекси, в някои отношения (предимно в използването на нови технологии при обработката на резултатите от търсенето) те не отстъпват на чуждестранните си колеги, а в някои случаи ги и превъзхождат.

    Нека посочим на първо място автоматичния индекс Aport 2000 и тематичния каталог @Rus (Atrus), разположени на следните адреси: http://www.aport.ru/ и http://www.atrus.ru /, респ. Тези две системи са в партньорство. Всъщност, когато Aport 2000 показва адреса на определена уеб страница в резултат на търсене, той може да бъде придружен от кратко описание на съответния уеб сайт, взето от директорията @Rus. От друга страна, при попълване на каталог Atrus активно се използват средствата на търсачката Aport. От гледна точка на клиента обаче тези търсачки са все още независими средства за получаване на информация. Нека да разгледаме някои от техните предимства. Aport 2000 използва най-ефективната в момента система за рейтинг, базирана на броя на връзките, водещи към даден ресурс (по индекс на цитиране). Търсачката Atrus предоставя на клиента удобен каталог-портал "My @Rus", който потребителят може да конфигурира за бързо получаване на най-нужната му информация. Инструментите за настройка на тази директория също ви позволяват да изключите всичко излишно на главната страница на търсачката, което прави работата с нея особено бърза и удобна.

    6.1. Рамблер ( http://www.rambler.ru )

    Търсачката Rambler има един от най-големите индекси в Русия, но спечели основната си популярност предимно като рейтингова система. Тя ви позволява бързо да идентифицирате набора от уеб сайтове, които предоставят информация по дадена тема, и да оцените тяхната популярност по броя на посещенията от различни интернет клиенти през последните 24 часа. Въпреки че броят на посещенията на даден уеб сайт не винаги е показателен за истинската стойност на информацията, която съдържа, за теми от обществен интерес може да се вярва на този рейтинг на популярност.

    По подразбиране се намират само онези документи, в които са намерени всички ключови думи, които сме посочили, тоест пространството между думите се възприема като логическа операция И. Въпреки това, тази стойност на пространството може да бъде отменена, за да съответства на логическата операция ИЛИ (както е по подразбиране в Yahoo или Alta Vista). За да направите това, във формата за разширено търсене изберете опцията „Запитване на думи: всякакви“.

    За да изключите документи, съдържащи определени думи, последните трябва да бъдат посочени в съответното поле на формуляра за разширено търсене.

    6.2. Yandex ( http :// www . yandex . en )

    Търсачката Yandex се откроява със своите мощни усъвършенствани инструменти за търсене, както и с редица технологични постижения, например наличието на интелигентен морфологичен разбор, което е особено важно за руския език. Независимо от формата, в която е написана ключовата дума в заявката, Yandex ще вземе предвид всички нейни форми. Например, ако ключовата дума е отивам, има връзки към уеб документи, съдържащи думите отивам, отивам и дори ходем. Възможно е обаче да се търси и по точната словоформа, за която пред тази словоформа трябва да се постави удивителен знак “!”.

    Няколко думи, въведени в заявката, разделени с интервали, означават, че всички те трябва да бъдат включени в едно изречение на документа, който се търси (тоест, интервалът работи като знак за логическата операция И).

    Трябва да се има предвид, че в Yandex PS операцията AND може да бъде определена и изрично с помощта на символа „&“ (но не с помощта на думата AND!). Удвояването на този знак, т.е. използването на знака „&&“, води до разпространение на действието на операцията И върху целия документ (т.е. думите, свързани с &&, трябва да присъстват в целия документ). Символът на операцията ИЛИ в разглежданата търсачка е знакът „|“ (но не самата дума ИЛИ).

    В Yandex PS можете да регулирате разстоянието, на което дадените ключови думи се намират една от друга в уеб документ. Например молба

    физическо/(-2 4) възпитание

    означава, че думата физически може да бъде разположена както отляво на думата образование (най-много на две думи от нея), така и отдясно (най-много на четири думи от нея).

    CompTek, който създаде Yandex PS, предоставя безплатно за корпоративни клиенти (организации) лека версия на програмата Yandex.Site, която индексира съдържанието на уеб сайт. Това е полезно за тези собственици на уеб сайтове, които биха искали да създадат локална система за търсене на информация в собствения си сайт.

    Търсачката на Yandex има много добро описание в секцията „Помощ“, което силно се препоръчва да разгледате, преди да използвате тази система.

    7. Търсене на файлове

    Сред специалните системи за търсене на файлове в Интернет има аналози на разглежданите по-рано тематични директории (като Yahoo) и автоматични индекси (като Alta Vista). Разбира се, тези търсачки не предоставят на клиента самите файлове, а само списъци с връзки към тях.

    Една от най-популярните услуги за търсене от тип директория за намиране на файлове е shareware.com на http://www.shareware.com. Тази система категоризира файловете само според това за каква операционна система са, но запазва описания на всички файлове, написани от човека. Началната страница на shareware.com е структурирана подобно на страниците на търсачките, които вече прегледахме. Той предлага на клиента различни видове търсения, освен това ключовите думи могат да съдържат знака *, съответстващ на поредица от всякакви знаци. Търсенето се извършва както в имена, така и в описания на файлове. Можете да посочите по-нисък праг на време за търсене, за да извлечете връзки към файлове, създадени на или след дадена дата, и да изберете дали резултатите да се сортират по дата или по азбучен ред по имена на файлове. Като щракнете върху името на файла в списъка с резултати, получаваме поредица от връзки към интернет сайтове, които съхраняват копия на този файл, указващи надеждността на тези сървъри и времето, необходимо за изтегляне на файла, в зависимост от честотната лента на нашия канал .

    За разлика от директорията shareware.com, търсачката на Archie е автоматичен индекс, подобен на Alta Vista. Списъкът с анонимни възли за Archie трябва да се поддържа от хора (може да се намери на http://hoohoo.ncsa.uiuc.edu/ftp/). Сървърната база данни на Archie се търси с помощта на ключови думи, които в този случай са просто имена на файлове или фрагменти от имена.

    Популярните FTP сайтове (като богатата колекция от програми за Windows (ftp://ftp.winsite.com)) могат да имат много голяма латентност, поради което обикновено има точни копия или „огледални изображения“ от тях в Интернет ." (огледала), а търсачките дават адресите на всички тези огледала.

    Директорията, съдържаща публични файлове, почти винаги се нарича pub. Повечето архиви имат специален файл във всяка директория с кратко - обикновено не по-дълго от един ред - описание на всеки файл в тази директория. Такъв файл може да се нарече 0index, 00index и т.н. (нули се добавят към името на файла, така че винаги да е на първо място в списъка с файлове, сортирани по азбучен ред).

    8. Източници на специализирана информация

    Има информационни компании, които предоставят информационни електронни услуги. Например Knight-Ridder (KR) е най-голямата в света онлайн информационна компания. Тук се обединиха световноизвестни услуги като DialogInformationService от САЩ и DataStar от Европа. Използвайки Интернет като среда за разпространение на своите услуги, KR успя да автоматизира ключови аспекти на своята дейност, да подобри обслужването на клиентите и най-важното да разшири пазара за своите услуги. Всичко това в крайна сметка доведе до това KR да се превърне в световен лидер в електронната доставка на документи и информационните услуги.

    IBM има собствена система за търсене на информация в Интернет - InfoMarket. Той съчетава средствата за получаване на информация и управление на плащания с права за достъп.

    Въпреки това, в началния етап на овладяване на интернет пространството не може да се направи без независимо търсене на информация. Адресите на уеб сайтове, които са добре установени източници на бизнес информация, могат да бъдат много полезни тук:

    www.kentis.com е сървърът на компанията KentInformationSystem, чиито служители помагат на професионалисти в областта на счетоводството и финансите да използват компютърни технологии, особено Интернет;

    http://www.promotion.aha.ru - списание за онлайн маркетинг в Интернет;

    http://www.inter.net.ru - Интернет списание, което редовно публикува материали за маркетинг и реклама в Интернет;

    http://clickz.com е списание, изцяло посветено на интернет маркетинга.

    9. Търсене на лица в Интернет

    Най-лесният начин да намерите информация за дадено лице е, ако той има своя лична начална страница в Интернет, която обикновено съдържа неговата снимка, имейл и пощенски адрес, телефонен номер и т.н. Често такава страница съдържа кратка биография на автор , неговите хобита и др. Една от най-големите системи за намиране на лични страници се нарича Who'sWho и се намира на адрес http://web.city.ac.uk/citylive/pages.html.

    Има и обширни директории с електронни адреси на различни хора, които използват електронна поща (e-mail). Водещият тук изглежда е директорията Four11 на http://www.four11.com.

    Отбелязваме и директорията WhoWhere (http://www.whowhere.com), която дори търси по сходството на звука или изписването на фамилните имена (например „Кирсанов“, „Кирсанов“ и др.).

    Вътрешният каталог с електронни адреси се намира на адрес http://www.botik.ru/~intermap/form.html.

    Абсолютно уникална е изцяло американската адресна директория на http://www.databaseamerica.com, която дава координатите на всеки от 90 милиона жители на САЩ и всяка от 10 милиона американски компании.

    10. Метатърсене

    Базите данни на различните търсачки не се припокриват в голяма степен. Ето защо, за да търсите доста рядка информация, е препоръчително да се позовавате не на един, а на няколко PS. Въпреки това, правилата за обработка на заявки за различни PS, най-общо казано, се различават едно от друго. За да не се обръщаме на свой ред към различни търсачки и да не мислим за конкретните правила за отправяне на заявка за всяка една от тях, бяха създадени така наречените метатърсачки.

    След като приеме поръчката на клиента, посочена с помощта на ключови думи в съответствие със собствените си правила за нейното изпълнение, самата метатърсачка ще я регистрира във формите на различни търсачки, ще изпрати тези формуляри и ще изчака отговор. Когато всички търсачки изпратят резултати от търсенето, метатърсачката ще ги комбинира в един документ и ще ги изпрати на потребителя. Такива метатърсачки включват MetaCrawler, намиращ се на адрес (http://metacrawler.cs.washington.edu:8080), който изпраща заявка до 9 различни търсачки (те включват: Yahoo, Alta Vista, Lycos, Excite и др.). В случай на различни интерпретации на едни и същи опции в различни търсачки, MetaCrawler дори предоставя възможност за проверка на резултатите от търсенето: преди да даде връзка на потребителя, той самостоятелно ще разгледа документа и ще провери дали отговаря на условията на заявката - т.к. MetaCrawler ги разбира. Разбира се, този режим на проверка значително забавя получаването на резултатите, но ви позволява да се предпазите както от неработещи връзки, така и от безсмислени резултати. Имайте предвид, че можете да зададете време за изчакване във формуляра за заявка на MetaCrawler: само онези резултати, които имат време да дойдат от различни търсачки към този момент, ще бъдат включени в списъка.

    11. Ефективно търсене на информация

    След подробно проучване на основните характеристики на инструментите се обръщаме към проблема с ефективността на търсенето. Основните параметри на ефективността на търсенето са:

    Пълнота на търсенето като отношение на броя на намерените документи към общия брой на съответните документи;

    Точността на търсене е съотношението на броя на съответните документи към общия брой на получените документи;

    Уместността на връзките към документи - наличието на намерени документи в мрежата в момента;

    Скорост на търсене.

    В Интернет има различни инструменти за търсене с различна функционалност. Следователно качеството на търсенето зависи преди всичко от параметрите на конкретна търсачка, например от размера на индекса, от метода на търсене (прецизиране на теми или търсене по заявка) и т.н. Освен това, когато работите с конкретна търсачка, трябва да имате представа за методите за компилиране на заявки, да знаете необходимите оператори.

    По този начин можем да различим следните фактори, които влияят на ефективността на търсенето:

    Свойства и възможности на търсачката;

    Качеството на формулировката на заявката от потребителя.

    Сега нека разгледаме как най-добре да подготвим потребителя за отправяне на заявка. На първо място е необходимо да се извърши цялостен лексикален анализ на информацията, която трябва да бъде намерена. След това е желателно да съставите набор от ключови думи (ако е необходимо, на няколко езика) под формата на отделни термини и фрази, специфични за вашата предметна област.

    Действия:

    Избор на инструменти за търсене;

    Прецизно формулиране на заявки с помощта на оператори, поддържани от този инструмент за търсене;

    Изпращане на тестови заявки;

    Анализ на резултатите от търсенето (по брой и уместност на връзките);

    Ако е необходимо, коригирайте заявката;

    Многократно търсене;

    Въз основа на гореизложеното могат да се разграничат следните методи за ефективно търсене:

    Търсете обща информация в търсачки-каталози. - Търсене на високоспециализирана информация в търсачките. За да се проведе по-обширно търсене, очевидно не е достатъчно да се използват само каталожни системи с ограничен брой описани ресурси. Освен това може просто да липсва високоспециализирана информация в каталозите. Следователно е необходимо да се търси такава информация в търсачките с големи индекси.

    Използване на оператори или разширен формуляр за заявка, за да стесните търсенето си. За да извършите качествено търсене, трябва да се запознаете с езика на заявките на определена търсачка. Ефективен и прост начин за решаване на проблема с съставянето на качествена заявка е използването на режима за разширено търсене.

    Използване на функцията за търсене сред намерените ресурси. Повечето търсачки поддържат възможността за търсене в резултатите.

    Използване на метатърсачки. Тези инструменти за търсене изпращат вашата заявка до няколко търсачки наведнъж и получават няколко от най-подходящите връзки от всяка машина.

    Търсете отговори на въпроси в дискусионните групи. Ако желаете, можете да се свържете със специализирана дискусионна група с конкретен въпрос за помощ.

    Абонирайте се за специализирани пощенски списъци и др.

    Заключение

    В заключение можем да кажем, че няма единна оптимална технология за търсене в Интернет. В зависимост от спецификата на изискваната информация, за нейното търсене трябва да се използват подходящи услуги за търсене. Трябва да се помни, че колкото по-компетентно са избрани услугите за търсене и се направи заявката за търсене на информация, толкова по-добри ще бъдат резултатите от търсенето.

    литература

    1. Информатика и информационни технологии / Изд. Романова Ю.Д. Москва: Ексмо, 2008

    2. Степанов A.N. информатика. Санкт Петербург: Петър, 2002

    3. Mayechak B. Търсене на информация в мрежата // Интернет за деца от 8 до 88. M .: Interexpert, 2002

    4. Чечин Г. М., Положенцев Е. В., Нижникова С. В. Търсене на информация в Интернет. Ростов на Дон: Руски държавен университет, 2001

    5. Дикански Е.Ю. Овладяване на Интернет: Практически курс по информационни и комуникационни технологии за начинаещи. Москва: Илекса, 2001

    6. http://www.dist-cons.ru/modules/searchinf/index.html

    7. http://www.seonews.ru/masterclasses/detail/29812.php

    8. http://www.gdenet.ru/bibl/technology/transmission/5.1.html

    ПРОФЕСИОНАЛНО ТЪРСЕНЕ НА ИНФОРМАЦИЯ В ИНТЕРНЕТ

    Търсенето в Интернет е важен елемент от работата в мрежата. Точният брой уеб ресурси на съвременния интернет едва ли е известен със сигурност на някого. Във всеки случай сметката отива в милиарди. За да можете да използвате информацията, която е необходима в този конкретен момент, независимо дали за бизнес или за развлекателни цели, първо трябва да я намерите в този непрекъснато попълващ се океан от ресурси.

    За да бъде успешно търсенето в Интернет, трябва да са изпълнени две условия: запитванията трябва да са добре формулирани и да се задават на подходящи места. С други думи, потребителят трябва, от една страна, да може да преведе своите интереси за търсене на езика на заявката за търсене, а от друга страна, добро познаване на търсачките, наличните инструменти за търсене, техните предимства и недостатъци, които ще позволят да се изберат най-подходящите инструменти за търсене във всеки конкретен случай. .

    В момента няма единен ресурс, който да отговаря на всички изисквания за търсене в Интернет. Следователно, при сериозен подход към търсенето, неизбежно трябва да използвате различни инструменти, като използвате всеки в най-подходящия случай.

    Основен инструменти за търсене в интернетмогат да бъдат разделени на следните основни групи:

    търсачки;

    Уеб директории;

    Референтни ресурси;

    Локални програми за търсене в интернет.

    Най-популярната търсачка етърсачки- така наречените интернет търсачки (Search Engines). Трите лидери в световен мащаб са доста стабилни – това са Google, Yahoo! и Bing. Много държави добавят свои собствени локални търсачки, оптимизирани за местно съдържание към този списък. С тяхна помощ, теоретично, можете да намерите всяка конкретна дума на страниците на много милиони сайтове. От гледна точка на потребителя, основният недостатък на търсачките е неизбежното присъствиеинформационен шумв резултатите. Ето как е обичайно да се наричат ​​резултати, които по една или друга причина са включени в списъка с резултати, които не отговарят на заявката.

    Въпреки многото различия, всички интернет търсачки работят на сходни принципи и от техническа гледна точка се състоят от подобни подсистеми. Първата структурна част на търсачката са специални програми, използвани за автоматично търсене и последващо индексиране на уеб страници. Такива програми обикновено се наричат ​​паяци или ботове. Те разглеждат кода на уеб страниците, намират връзки, разположени на тях, и по този начин откриват нови уеб страници. Има алтернативен начин за включване на сайт в индекса. Много търсачки предлагат на собствениците на ресурси възможността сами да добавят сайт към своята база данни. Както и да е, тогава уеб страниците се изтеглят, анализират и индексират. В тях се подчертават структурни елементи, намират се ключови думи, определят се връзките им с други сайтове и уеб страници. Извършват се и други операции, резултатът от които е формиране на индексната база на търсачката. Тази база е вторият основен елемент на всяка търсачка. В момента няма една абсолютно пълна индексна база данни, която да съдържа информация за цялото съдържание в Интернет. Тъй като различните търсачки използват различни програми за търсене в уеб страници и изграждат своя индекс с помощта на различни алгоритми, базите на индексите на търсачките могат да варират значително. Някои сайтове се индексират от няколко търсачки, но винаги има определен процент ресурси, включени в базата данни само на една търсачка. Фактът, че всяка търсачка има толкова оригинална и неприпокриваща се част от индекса, ви позволява да направите важен практически извод: ако използвате само една търсачка, дори и най-голямата, определено ще загубите определен процент полезни връзки .

    Следващата част от интернет търсачката е самата програма за търсене и сортиране. Тези програми решават две основни задачи: първо намират страници и файлове в базата данни, които отговарят на входящата заявка, и след това сортират получения масив от данни според различни критерии. Успехът в постигането на целите на търсенето до голяма степен зависи от ефективността на тяхната работа.

    Последният елемент на интернет търсачката е потребителският интерфейс. В допълнение към изискванията за естетика и удобство, които са обичайни за всеки сайт, има още едно важно изискване за интерфейсите на търсачките: те трябва да предлагат различни инструменти за компилиране и прецизиране на заявки, както и сортиране и филтриране на резултатите. Предимствата на търсачките са отличното покритие на източниците, сравнително бързото актуализиране на съдържанието на базата данни и добър избор от допълнителни функции.

    Основният инструмент за работа с търсачките е заявка.

    За търсене в Интернет се използват и специални приложения, инсталирани на локалния компютър. Това могат да бъдат както прости програми, така и доста сложни комплекси за търсене и анализ на данни. Най-често срещаните добавки за браузър са приставки за браузъри, панели за браузъри, предназначени да работят с конкретна услуга за търсене, и пакети за метатърсене с възможности за анализ на резултатите.

    Уеб директории - това са ресурси, в които сайтовете са разпределени по тематични категории. Ако потребителят работи с търсачките само чрез заявки, тогава каталогът има възможност да разглежда цели тематични раздели. Втората фундаментална разлика между каталозите и автоматичните търсачки е, че по правило хората директно участват в тяхното съдържание, които разглеждат ресурси и приписват сайта към една или друга категория. Уеб директориите обикновено се делят на универсални и тематични. Universal се опитайте да обхванете възможно най-много теми. В тях можете да намерите всичко: от сайтове за поезия до компютърни ресурси. С други думи, те имат максимална широчина на търсене. Тематични указатели, от друга страна, се специализират в определена тема, осигурявайки максимална дълбочина на търсене чрез намаляване на широчината на покритие на ресурсите.

    Предимството на директориите е относително високото качество на ресурсите, тъй като всеки сайт в тях се разглежда и избира от човек. Тематичното групиране на сайтове ви позволява удобно да намирате сайтове с подобна тематика. Този режим на работа е добър за откриване на нови сайтове за вас по интересна тема – по-точен е от използването на търсачка. Препоръчително е да използвате уеб директории за първо запознаване с която и да е предметна област, както и търсене на размити заявки - ще имате възможност да „бродите“ из секциите на директорията и по-точно да определите от какво се нуждаете.

    Недостатъците на уеб директориите са известни. На първо място, това е бавно попълване на базата данни, тъй като включването на сайт в каталога изисква участието на човек. По отношение на ефективността уеб директорията не е съперник на търсачките. Освен това уеб директориите са значително по-ниски от търсачките по отношение на размера на базата данни.

    Когато говорим за търсене в Интернет, не може да се игнорират редица термини, които са тясно свързани с тази област и често се използват за описание и оценка на търсачките. Например:широчина и дълбочина търсене в интернет. Широкото търсене е търсене, което улавя възможно най-много източници на информация. В същото време най-малкото споменаване на конкретен сайт, който отговаря на заявката, се счита за достатъчно. Дълбочината на търсене се отнася до детайлите на индексирането и последващото търсене на всеки конкретен ресурс. Например, много търсачки имат различни подходи за индексиране на различни сайтове. Големите и популярни сайтове се индексират в максимална степен, роботите се опитват да не пропуснат нито една страница от такъв ресурс. В същото време на други сайтове могат да бъдат индексирани само главната страница и няколко страници със съдържание. Тези обстоятелства, разбира се, влияят на последващото търсене. Дълбокото търсене работи на принципа „по-добре е да включите излишна информация в резултатите, отколкото да пропуснете каквито и да било данни, свързани с темата за търсене“.

    Доста често се срещат понятия катоглобални и локални търсене в интернет. Локалното търсене в Интернет взема предвид географското местоположение на потребителя и предпочитание се дава на резултати, които по някакъв начин са свързани с определена държава или населено място. Глобалното търсене игнорира тази информация и търси всички налични ресурси.

    При съставяне на заявка в интернет търсачките работят различни режими на търсене. Типичните режими на търсене, намиращи се на повечето интернет машини, включватпрост и усъвършенстван Търсене. Обикновеното търсене ви позволява да посочите само една функция за търсене в една заявка. Разширеното търсене прави възможно създаването на заявка от няколко условия, като ги свързва с логически оператори.

    Използват се различни методи за прецизиране на заявките за търсене.филтри . Филтрите са тези или други спомагателни средства за компилиране на заявка, които не са свързани със съдържанието на условията на заявката, но ограничават резултатите от търсенето до някакъв формален знак. Така например, когато прилага филтър за тип файл при търсене, потребителят не предоставя на системата информация, свързана с предмета на неговата заявка, а просто ограничава получените резултати до конкретен тип файл, посочен в условието на неговата заявка.

    За повечето потребители универсалните търсачки са основното, а често и единственото средство за търсене в Интернет. Те предлагат добро покритие на източниците, както и набор от инструменти, достатъчен за основни задачи за търсене.

    Пазарът на универсалните търсачки е доста голям. Опитахме се да анализираме най-известните търсачки и резултатите са представени под формата на таблица 1.

    При избора на универсална търсачка качеството на ресурсите, открити с нейна помощ, играе важна роля. Можете да определите предпочитаната търсачка за конкретни задачи, като използвате „метода на маркера“. Същността му се крие във факта, че първо се съставя определена тематична заявка за търсене, след което се анкетира група хора - експерти в тази област, за да се идентифицират най-добрите според тях интернет ресурси по избраната тема. Въз основа на данните от проучването се формира списък с маркерни сайтове, които гарантирано отговарят на заявката и съдържат висококачествена информация. След това заявката се изпраща до тестваните търсачки. Логиката на оценката е проста: колкото по-високо са маркерните сайтове в резултатите от търсенето, толкова по-добре даден ресурс е подходящ за намиране на информация по тестова тема.


    Казват, че всичко е в интернет. Всъщност не е така. Материалите за публикуване в мрежата са подготвени от реални хора и затова можете да намерите само това, което смятат за необходимо да публикувате там. Реката обаче се захранва от потоци и благодарение на тяхната креативност днес в Интернет вече са формирани около два милиарда уеб страници. В резултат на това каталогизирането на наличните ресурси в мрежата се превърна в основен проблем. Въпреки факта, че хиляди организации се занимават с проблема, той не само не се доближава до разрешаване, но и става все по-остър. Процентът на каталогизираните ресурси непрекъснато спада. През последните години този спад стана катастрофален. Така че, ако през 1999 г. процентът на каталогизираните ресурси се доближи до 40%, то само за една следващата година той спадна до 25%.

    Изводът е прост: уеб пространството се запълва по-бързо, отколкото е систематизирано.

    За съжаление, нямаме причина да предполагаме, че нещо може да се промени към по-добро в близко бъдеще. В резултат на това търсенето на информация в Интернет може да се счита за една от най-трудните задачи.

    За да търсите информацията, която ви интересува, трябва да кажете на браузъра адреса на уеб страницата, на която се намира. Това е най-бързият и надежден вид търсене. За бърз достъп до ресурса, просто стартирайте браузъра и въведете адреса на страницата в адресната лента.

    Адресите на уеб страници са дадени в специални директории, печатни издания, те звучат в ефира на популярни радиостанции и от телевизионни екрани.

    Ако не знаете адреса, тогава за търсене на информация в Интернет има търсачки, съдържаща информация за интернет ресурси.

    Всяка търсачка е голяма база данни с ключови думи, свързани с уеб страниците, на които се намират. За да търсите адреса на сървъра с информацията, която ви интересува, трябва да въведете ключова дума, няколко думи или фраза в полето на търсачката. По този начин изпращате заявка до търсачката. Резултатите от търсенето се дават като списък с адреси на уеб страници, където се срещат тези думи.

    По правило търсачките се състоят от три части: робот, програма за обработка на индекси и заявки.

    Робот (паяк, робот или бот) е програма, която посещава уеб страници и чете (изцяло или частично) тяхното съдържание.

    Роботите на търсачките се различават по индивидуалната си схема за анализиране на съдържанието на уеб страница.

    Индексът е хранилище за данни, което съдържа копия на всички страници, посетени от роботи.

    Индексите във всяка търсачка се различават по количеството и начина, по който се съхранява информацията. Базите данни на водещите търсачки съхраняват информация за десетки милиони документи, а техният индексен обем е стотици гигабайта. Индексите се актуализират и допълват периодично, така че резултатите от работата на една търсачка с една и съща заявка може да се различават, ако търсенето е извършено по различно време.

    Процесорът на заявки е програма, която в съответствие със заявката на потребителя "сканира" индекса за необходимата информация и връща връзки към намерените документи.

    Наборът от връзки на изхода на системата се разпределя от програмата в низходящ ред от най-високата степен на съвпадение на връзката към заявката до най-ниската.

    В Русия най-разпространените търсачки са:

    • Rambler (www.rambler.ru);
    • Yandex (www.yandex.ru);
    • Поща (www.mail.ru).

    В чужбина има много повече търсачки. Най-популярни са:

    • Alta Vista (www.altavista.com);
    • Бързо търсене (www.alltheweb.com);
    • Северно сияние (www.northernlight.com).

    Yandex е може би най-добрата търсачка в руския интернет. Тази база данни съдържа около 200 000 сървъра и до 30 милиона документи, които системата сканира за секунди. На примера на тази система ще покажем как се търси информация.

    Търсенето на информация се задава чрез въвеждане на ключова дума в специална рамка и натискане на бутона "Намери" вдясно от рамката.

    Резултатите от търсенето се появяват в рамките на няколко секунди и се подреждат по важност - най-важните документи се поставят в горната част на списъка. В този случай рангът на намерения документ се определя от мястото в документа, където се намира ключовата дума (тя е по-важна в заглавието на документа, отколкото на всяко друго място) и броя на споменаванията на ключовата дума ( повече споменавания, толкова по-висок е рангът).

    Така сайтовете, разположени на първите места в списъка, са водещи не от гледна точка на съдържанието, а на практика, по отношение на честотата на споменаване на ключовата дума. В тази връзка не бива да се ограничавате до разглеждането на първите десет сайта, предложени от търсачката.

    Съдържанието на сайта може да бъде косвено оценено от неговото кратко описание, поставено от търсачката под адреса на сайта. Някои безскрупулни автори на сайтове, за да увеличат вероятността тяхната уеб страница да се появи на първите места в търсачката, умишлено включват безсмислени повторения на ключовата дума в документа. Но веднага щом търсачката открие такъв "замърсен" документ, тя автоматично го изключва от своята база данни.

    Дори класираният списък с документи, предлагани от търсачката в отговор на ключова фраза или дума, може да бъде почти поразителен. В тази връзка Yandex (както и други мощни търсачки) предоставя възможност в рамките на първия списък да изберете документи, които по-точно отразяват целта на търсенето, тоест да прецизират или подобрят резултатите от търсенето. Например списък от 34 899 уеб страници за ключова дума. Въвеждането на отговаряща на изискванията ключова дума в командата „Търсене в намерено“ намалява списъка до 750 страници, а въвеждането на друга отговаряща на изискванията дума в тази команда намалява списъка до 130 уеб страници.

    Директориите за търсене са систематично събиране (селекция) от връзки към други интернет ресурси. Връзките са организирани като тематичен рубрикатор, n представляваща йерархична структура, придвижвайки се през която можете да намерите необходимата информация.

    Да вземем за пример структурата на интернет каталога за търсене на Yandex.

    Това е директория с общо предназначение, тъй като съдържа връзки към интернет ресурси в почти всички възможни посоки. Тази директория съдържа следното теми:

    • Бизнес и икономика;
    • Общество и политика;
    • Наука и образование;
    • Компютри и комуникации;
    • Наръчници и връзки;
    • Дом и семейство;
    • Развлечения и отдих;
    • Култура и изкуство.

    Всеки темавключва много подраздели , а те от своя страна съдържат заглавияи т.н.

    Да предположим, че подготвяте събитие за Деня на победата и искате да потърсите в интернет думите на известната военна песен на Булат Окуджава „Чуваш ботушите гърми“. Търсенето може да бъде организирано по следния начин:

    Яндекс > Каталог > Култура и изкуство > Музика > Авторска песен

    Този метод за търсене е доста бърз и ефективен. Накрая ви се предлагат само няколко връзки, сред които има връзки към сайтове с песни на известни бардове. Остава само да намерите на сайта архив с текстове на Б. Окуджава и да изберете желания текст в него.

    Друг пример. Да предположим, че ще си купите мобилен телефон и искате да сравните характеристиките на устройства от различни компании. Търсенето може да се извърши под следните каталожни заглавия:.

    Yandex > Каталог > Компютри и комуникации > Мобилни комуникации > Мобилни телефони

    След като сте получили ограничен брой референции, можете бързо да ги прегледате и да изберете телефон, като разгледате характеристиките на фирмите и модификациите на устройствата.

    Повечето търсачки имат възможност да търсят по ключови думи. Това е един от най-често срещаните видове търсене.

    За да търсите по ключови думи, трябва да въведете дума или няколко думи, които да търсите, в специален прозорец и да кликнете върху бутона Намери.

    Търсачката ще намери в своята база данни и ще покаже документи, съдържащи тези думи. Може да има много такива документи, но много в този случай не означава непременно добро.

    Нека проведем някои експерименти с някоя от търсачките. Да предположим, че решаваме да започнем аквариум и се интересуваме от всякаква информация по тази тема. На пръв поглед най-простото нещо е да търсите думата "аквариум". Нека проверим това, например, в търсачката Yandex. Резултатът от търсенето ще бъде огромен брой страници - огромен брой връзки. Освен това, ако се вгледате по-внимателно, сред тях ще има сайтове, които споменават групата Аквариум на Б. Гребенщиков, търговски центрове и неформални сдружения със същото име и много други, които нямат нищо общо с аквариумните рибки.

    Лесно е да се досетите, че подобно търсене не може да задоволи дори непретенциозния потребител. Ще трябва да отделим твърде много време, за да изберем измежду всички предложени документи тези, които се отнасят до темата, от която се нуждаем, и още повече за запознаване със съдържанието им.

    Веднага можете да заключите, че обикновено не е препоръчително да търсите по една дума, защото е много трудно да се определи темата на документ, уеб страница или сайт с една дума. Изключение правят редките думи и термини, които почти никога не се използват извън предметната им област.

    Имайки определен набор от най-често срещаните термини в желаната област, можете да използвате разширено търсене. На фиг. се показва прозорецът за разширено търсене в търсачката Yandex. В този режим възможностите на езика на заявките се реализират като форма. Подобна услуга, включително филтри за речници, се предлага от почти всички търсачки.

    Нека се опитаме да изясним условията за търсене и да въведете фразата "аквариумни риби". Броят на връзките ще намалее с повече от 20 пъти. Този резултат ни подхожда повече, но все пак сред предложените връзки можете да срещнете, например, руски сувенирни комплекти етикети за мачове с изображения на риби, и колекции от скрийнсейвъри на компютъра, и каталози на аквариумни риби със снимки и аквариум магазини за аксесоари. Очевидно е, че трябва да продължим да се движим в посока на прецизиране на условията за търсене.

    За да направи търсенето по-продуктивно, всички търсачки имат специална език на заявката със собствен синтаксис. Тези езици са сходни в много отношения. Изучаването на всички тях е доста трудно, но всяка търсачка има помощна система, която ще ви позволи да овладеете желания език.

    Ето няколко прости правила за генериране на заявка в търсачката на Yandex.

    Ключовите думи в заявката трябва да бъдат написани с малки (малки) букви.

    Това ще гарантира, че се търсят всички ключови думи, а не само тези, които започват с главна буква.

    Търсенето взема предвид всички форми на думата според правилата на руския език, независимо от формата на думата в заявката.

    Например, ако думата „знам” е посочена в заявката, тогава думите „знам”, „знам” и т.н. също ще удовлетворят условието за търсене.

    За да търсите стабилна фраза, оградете думите в кавички.

    Например "порцеланови съдове".

    За да търсите по точната словоформа, трябва да поставите удивителен знак преди думата.

    Например, за да търсите думата "септември" в родителен падеж, трябва да напишете "!септември".

    За търсене в рамките на едно изречение, думите в заявката са разделени с интервал или знак и

    Например „приключенски роман“ или „приключенски и роман“. Няколко думи, въведени в заявката, разделени с интервали, означават, че всички те трябва да бъдат включени в едно изречение на документа, който се търси.

    Ако искате да изберете само онези документи, в които се среща всяка дума, посочена в заявката, поставете знак плюс "+" пред всеки от тях. Ако, напротив, искате да изключите думи от резултата от търсенето, поставете минус "-" пред тази дума. Знаците "+" и "-" трябва да се изпишат с интервал от предишната и заедно със следващата дума.

    Например, заявката "Волга-автомобил" ще намери документи, които съдържат думата "Волга", а не думата "автомобил".

    Когато търсите синоними или думи, които са близки по значение, можете да поставите вертикална лента "|" между думите.

    Например за заявката „дете | дете | бебе" ще намери документи с някоя от тези думи.

    Вместо една дума в заявка, можете да замените цял израз. За да направите това, трябва да го вземете в скоби

    Например „(дете | бебе | деца | бебе) + (грижи | образование)“.

    Знакът "~" (тилда) ви позволява да намерите документи с изречение, съдържащо първата дума, но не съдържащо втората.

    Например, търсенето "книги ~ магазин" ще намери всички документи, съдържащи думата "книги", до която няма думата "магазин" (в изречението).

    Ако операторът се повтори веднъж (например & или ~), търсенето се извършва в рамките на изречението. Двойният оператор (&&,~~) търси в документа.

    Например, търсенето на "рак ~~ астрология" ще намерите документи с думата "рак", които не са свързани с астрологията.

    Нека се върнем към примера с аквариумни риби. След като прочетете няколко документа, предлагани от търсачката, става ясно, че търсенето на информация в интернет не трябва да започва с избора на аквариумни риби. Аквариумът е сложна биологична система, чието създаване и поддържане изисква специални знания, време и сериозни инвестиции.

    Въз основа на получената информация човек, извършващ търсене в Интернет, може радикално да промени стратегията за по-нататъшно търсене, като реши да проучи специалната литература, свързана с изследваната тема.

    За търсене на литература или документи в пълен текст е възможна следната заявка:

    „+ (аквариум | акварист | акварист) + за начинаещи + (съвети | литература) + (статия | теза | пълен текст) – (цена | магазин | доставка | каталог)“.

    След обработка на заявката от търсачката резултатът беше много успешен. Вече първите връзки водят до необходимите документи.

    Сега можете да обобщите резултатите от търсенето, да направите определени заключения и да вземете решение за възможни действия:

    • Спрете по-нататъшното търсене, тъй като поради различни причини поддръжката на аквариума е извън вашите възможности.
    • Прочетете предложените статии и продължете с подреждането на аквариума.
    • Потърсете материали за хамстери или вълнисти папагали.
    1. Какъв тип търсене е най-бързото и надеждно?
    2. Къде потребителят може да намери адреси на уеб страници?
    3. Каква е основната цел на търсачката?
    4. Кои са частите на търсачката?
    5. Какви търсачки познавате?
    6. Каква е технологията на търсене по рубрикатор на търсачката?
    7. Какво представлява технологията за търсене по ключови думи?
    8. Кога трябва да използвате + или - във вашите критерии за търсене?
    9. Какви критерии за търсене в Yandex се задават от следната фраза:

      (бавачка|възпитател|гувернантка)++(грижи|образование|надзор) ?

    10. Какво означава удвояване на знака (~~ или ++) при формиране на сложна заявка?

    Задачата.

    Задача 1. Търсене в директории.

    Използвайки директорията на търсачката, намерете следната информация (както е указано от учителя):

    1. Текст на песен от популярна музикална група
    2. Репертоар на Мариинския театър за текущата седмица
    3. Характеристики на най-новата марка мобилен телефон (по ваш избор)
    4. Рецепта за украински борш с кнедли
    5. Дългосрочна прогноза за времето във вашия район (поне 10 дни)
    6. Снимка на любимия ви изпълнител на съвременна песен
    7. Приблизителна цена на мултимедиен компютър (цена)
    8. Информация за свободни позиции за длъжността секретар във вашия регион или град
    9. Хороскоп на вашата зодия за текущия ден

    Въз основа на резултатите от търсенето направете писмен отчет в Word: представете намерения, копиран и форматиран материал в документа. Представете доклада на учителя.

    Задача 2. Оформяне на заявка за точното заглавие или цитат.

    Знаете точното заглавие на документа, например „Хигиенни изисквания към персонални електронни компютри и организация на работа“. Формулирайте заявка за търсене в Интернет за пълния текст на документа.

    Запазете резултата от търсенето във вашата папка. Подарете на учителя.

    Задача 3. Формиране на сложни заявки.

    • Във всяка търсачка направете заявка за търсене на информация за руската баня. Премахване на оферти за услуги, реклами за аксесоари за баня и други реклами. Съсредоточете търсенето си върху ефекта на руската баня върху тялото.
    • Съставете сложна заявка за търсене на информация относно грижите за домашни котки. Изключете големите котки (като лъвове) от вашето търсене, както и оферти за покупка, продажба, снимки за тапети и т.н.
    • Попълнете текста на заявката и резултата от търсенето в Word и го представете на учителя.
    Задача 4. Тематично търсене.

    По всякакъв начин, който знаете, потърсете в Интернет информация за историята на компютърните технологии. Търсене в различни посоки: историческа обстановка, технология, личности. Представете резултатите от търсенето под формата на презентация. Използвайте многоетапно съдържание под формата на хипервръзки във вашата презентация.