Волович Михаил. Как е написано в интернет. Главни букви и точки в заглавия

Как се изписва в интернет

Михаил Волович... Как се изписва в интернет


Посветен на Rambler

Много издания имат "вътрешни стандарти" - писмени или неписани допълнения към обичайните правила за правопис и пунктуация. Те регулират изписването на нови думи, поставянето на главни букви и кавички, други трудни случаи и предупреждават за чести грешки.

През 2001 г. аз самият трябваше да определя и прилагам такива вътрешни стандарти в интернет холдинга Rambler. Но тогава, уви, правилата останаха неписани. Тази кратка статия е опит да се обобщят научените уроци (по -добре късно, отколкото никога). Надявам се, че ще бъде полезно за някого - включително, може би, в Rambler.

И лично посвещение, също свързано с Rambler, в памет на Сергей Бровцин, един от най -благодарните слушатели на моите препоръки.

Все едно ли е как

Популярността и търговският успех на интернет ресурс зависят от „редакционните“ качества - както и от качеството като цяло - не на първо място. Малко хора, като са дошли на сайта, обръщат внимание на такива дреболии като правописни грешки (особено ако не са твърде груби), несъответствия и лош дизайн.

И все пак сайтът на реномирана компания, на който в средата на думите Срещаненужни тирета (следи от ръчно поставени тирета), вече не изглежда толкова солидно. Няма да се ангажирам да го доказвам, но лично съм сигурен, че редакционната работа и просто добрият вкус се отплащат навсякъде, включително и в интернет.

Интернет, интернет, интернет

Нека започнем с най -горещото: все пак интернетили Интернетът?

В Руския правописен речник 1999 е записано интернет; езиковата практика също е по -вероятно на негова страна, но тенденцията очевидно е в посока „понижаване“ на буквата. Например вестник "Ведомости" (за сега?) Последователно пише интернет- но издателство "Комерсант" публично обяви прехода към Интернетът; някои интернет ресурси са направили това още по -рано.

Основните аргументи в полза на малка ("малка") буква:

обичайно е руският език да превръща собствените имена в общи имена и с Интернетъттова вече се е случило (както се случи с копирна машинаи пелена); Интернетът- нищо повече от комуникационна среда (опции: "метод на излъчване", "информационна култура"), същото като телефон, Телевизорили Натиснете.

Основните аргументи в полза на главна ("главна") буква:

интернетвсе още остава името на уникален обект, собствено име - същото, например като Марс, Интерполили Талибани... Интернет не е просто „носител“ и още по -малко „начин на излъчване“ (ухото ми отказва да възприема изрази като * доклад в интернет). Това е специфична компютърна мрежа; през последните 10 години тя е нараснала много, но е запазила своята индивидуалност, има свой законодателен орган, инфраструктура и др .; не е трудно да си представим друга глобална компютърна мрежа, паралелна или алтернативна на Интернет.

(Между другото, на английски интернет- почти винаги Интернетът, с определената статия и изглежда няма спор за главната буква.)

Ако аргументите на поддръжниците интернетизглеждат ви убедителни или просто се страхувате да изостанете от времето - пишете Интернетът... Но все още вярвам в това интернет- подходящо име. Така че, бих препоръчал:

  • интернет, нежелателно * Интернетът;
  • Мрежа(когато става въпрос за интернет), Световната мрежа; но световна мрежа;
  • Рунет, не правилно * рунет(със сигурност не може да се счита за „метод на излъчване“).

Въпреки това, в сложни думи като доставчик на интернет услуги, интернет библиотекадума Интернетътдейства като определение. Да се ​​напише в такива случаи с главна буква е доста груба грешка. Друга много често срещана грешка е писането на такива образувания с две думи, без тире.

  • Интернет кафе, Интернет ресурс, интернет обществени др .; не правилно * Интернет ресурс, *Интернет ресурс.

Word интернет- като Интерполс Талибаните- трябва да се наклони, ако стои в изолация. Изписано с латински букви, интернет, Интерпол, Талибаниразбира се, не се огъвайте; но всички тези думи отдавна са усвоени от руския език и няма причина да ги пишете на латинска азбука.

  • в интернета, Потребители на интернет, Потребители на интернет; не правилно * в Интернет, *Потребители на интернет; нежелателно * в интернет.

Браузър, маркер, офлайн

Има много думи, които срещате в Интернет на всяка крачка в голямо разнообразие от правописи, но които доскоро не бяха в речниците.

Много от тях - като мен интернет- влезе в Руския правописен речник през 1999 г., редактиран от В. В. Лопатин. Много други са включени в над 1500 думи, които са добавени към електронната версия на този речник от 1999 г. насам.

  • браузър, уеб браузър(не правилно * браузър, *мрежа);
  • етикет, HTML маркер(не правилно * етикет), марката, br "ендови(не правилно * марка); пари в брой, кеш(не правилно * кеш); хеш таблица;
  • на линия, на линияи в онлайн режим,на линия; извън линия, извън линия; офшорен, офшорен(нежелателно * на линия, *извън линия, *извън линия, *офшорен);
  • трафик(не правилно * трафик);
  • играч, интернет плейър(нежелателно * играч, въпреки че тази опция е записана в някои речници);
  • PR(не правилно * PR), PR агенция(или PR агенция), PR, PR човек;
  • брокера(не правилно * брокера, *брокера; преди десет години се опитах да го управлявам специалист по недвижими имоти, но той спечели); дистрибутор(тогава се борих за дистрибутор, но и неуспешно);
  • роуминг; Хелоуин; уикенд; саундтрак;
  • ценова листа(въпреки че е по -добре да се използва и заимствана, но по -рано вкоренена в руската дума ценова листа; не правилно * ценова листа); най-гледаното време.

Речникът по някакъв начин "изпреварва" съществуващата литературна норма, като се фокусира предварително върху промените, които Правописната комисия, ръководена от В. В. Лопатин, възнамерява да въведе в руския правопис. Освен това може да се промени нещо от текущата електронна версия към новото издание на речника. Строго погледнато, не е необходимо да се подчиняваме на препоръките му; например в "Комерсант" последователно пишат дистрибутори брокера, но играчсе среща не по -рядко от играч.

Независимо от това, при наличието на "несъответствия", ми се струва, че е разумно да се вслушам в препоръките на най -авторитетния справочник за правопис днес.

CD-ROM, електронна поща, Java

  • електронна поща, имейл "в, имейл „ом; Руски еквивалент, по -добре от електронна пощаили имейл адрес, още не (но ако наистина искате нещо разговорно, тогава е по -добре чрез "сапун"или по поща, как * чрез имейлили * чрез имейл);
  • CD ROM, CD-ROM "а; CD, и ако "на руски", тогава CD;
  • Word, в Word "e(правопис * в Wordразговорно и следователно неприемливо в прилични текстове); Excel, за Excel "e, ...;
  • Java аплет(име на език Javaна руски не е уреден, затова е по -добре да го напишете на латиница).

Основното е да бъдете последователни

В крайна сметка е важно не какпишем и колко последователно... Word интернетможете да пишете с главна буква, но можете да пишете с малка буква (вижте по -горе). Но това не означава, че е възможно и така и така. Трябва да вземете решение и да го следвате.

Когато на една страница на екрана (на отпечатана страница, слава Богу, не се наложи) виждам две новини - една за бин Ладени Ал Кайдаи друг за Бин Ладени Ал Кайда(като един споменава палестински град Рамалаа в другия Рамала), - катеря се по стената.

Лошо е, когато в края на заглавията има периоди (виж по -долу) - но още по -лошо, когато има периоди, които са, тогава не.

Можете да включите следните препинателни знаци във връзките, можете да го пропуснете - но е по -добре да не правите това или онова.

Форматиране на текст

  • Не! - големи неструктурирани обеми текст.

Максималната дължина на параграф, който аз (потребителят) е готов да прочете от екрана, е 6-8, добре, 10 реда. Тогава все пак ще скоча: в най -добрия случай към следващия параграф, в най -лошия - към следващия сайт.

Също така е силно желателно текстът да бъде разделен на малки фрагменти (глави) с отделни заглавия.

  • Не! - прекъсвания на редове (
    ). Да! - пълни абзаци (

    Или

    ).

Стандартният HTML оставя на създателя на сайта много малък избор: или абзаците следват един след друг и се слепват, или пропускат цял ​​ред и текстът се надува. От двете злини първото е много по -лошо. Границите на следващите параграфи без пропуски са много слабо видими, текстът изглежда сякаш не е разделен. И ако последният ред на параграф е достатъчно дълъг, границата може да се загуби напълно.

  • Да! - маркирани списъци

Просто трябва да се уверите, че можете ясно да видите къде започва и завършва всеки елемент. В този случай списъкът е лесен за прелистване през очите, което е много важно при четене от екрана.

  • Да! - подчертаване на важни места с „удебелен“ или курсив (но не в прекомерни количества). Не! - подчертава извън връзките.

Удобно, когато окото има с какво да се хване; това помага за бързо сканиране на текста и разбиране какво трябва да се прочете в него и кое не - качеството за Интернет е много ценно. Погрешно е обаче да се подчертае подчертаването: той е запазен за връзки и другото му използване ще дезориентира посетителите на сайта.

Главни букви и точки в заглавия.

Тази заглавие е умишлено направена грешка, която е много често срещана в интернет и е много обидна в страна с толкова богати културни традиции. В него (вероятно сте забелязали) всички думи започват с главни букви.

Затова е обичайно да се проектират заглавия не на руски, а на английски език. (А на английски е обичайно да се изписват с главни букви дните от седмицата и месеците, имената на народите и прилагателните от тях. И запетаите на английски са поставени по съвсем различен начин от руския. И думите са различни . И дори буквите ... На немски всички съществителни са с главни букви.)

Руската традиция за форматиране на печатни текстове изисква поставянето само на една главна буква в заглавията - в началото (плюс собствени имена и т.н.). Заглавията се различават от обикновените изречения само в едно: не е обичайно да се поставя точка в края на заглавията (както и надписите под снимки).

Йо

Интернет е наследник на отпечатания текст, а не на писмения. За добро или лошо, в печатния текст поставете точка дне се приема (с изключение на речници, образователна литература и др.). Книга по химия, която съдържа дще изглежда недостойно - и сайтове, на които на място дне си заслужава д... (Следователно, преди да публикувате документ в книга или в интернет, често се налага да свършите на пръв поглед излишна и абсурдна работа: намерете прикрепената ди ги заменете с д.)

Разбира се, книги и сайтове, където дтой е поставен, тогава не, те изглеждат още по -недостойни.

Ако обаче точките по -горе дпомогнете да изясните значението, да разрешите омонимията ( направи всичко - направи всичко), те все още се препоръчват да бъдат инсталирани. Обикновено си тръгвам дс една дума всичкодори когато се бърка с всичкодостатъчно трудно.

Кавички и тирета

Когато работя в Word, винаги поставям ем тире и почти винаги - кавички от рибена кост, а в английски текст - кавички -лапи. (Функцията за автоматично коригиране е деактивирана за мен, така че целенасочено го правя на ръка). Компютърът ме научи да съставям документите, които създавам в съответствие със стандартите за „книга“, а правилните тирета и кавички са неразделна част от тях.

Въпреки това трябва да се уверя, че в моите и чужди документи, преди да бъдат публикувани в мрежата, кавичките са заменени с прости (","), а тире - с обикновена тире ( -). Това е така когато сигурността (съвместимост с други кодировки и операционни системи) е по -важна от красотата.

Въпросът е, че тирето - , цитати от рибена кост « » и краката (двойни “ ” и неженен ‘ ’ ) и някои други знаци (например номер NS, параграф § , елипсис , ppm , средна точка, плюс или минус ± ), които са в кодирането „Windows“ (Windows-1251), в koi8-r и други руски кодировки, в които потребителят може лесно да ги получи, отсъстват или са на грешните места. При показване на текст в кодиране, различно от Windows-1251, тези знаци могат да бъдат изкривени (чебурашките започват да се изпълняват в текста). Възможно е да видите в този параграф не знаците, които посочих по -горе, а някои неразбираеми икони; ако не, несъмнено сте виждали такива икони на други сайтове.

Специални знаци като - (тире) и ‰ (ppm) не спасяват ситуацията, тъй като просто няма съответстващи символи в koi8. Най -красивият изход от тази ситуация е да публикувате текстове в Windows -1251 и да конфигурирате програмите по такъв начин, че при преминаване към koi тирето автоматично да се замени с тире, знакът с цифра - с буквата N и скоро. Това обаче изисква специално програмиране и не винаги е възможно. Следователно е необходимо с неохота да се направи следната препоръка.

  • Преди да публикувате текст в Интернет, освен ако вашият сървър не предоставя специални мерки за правилното показване на „специални знаци“, трябва да замените всички видове кавички с прости кавички, тирета - с тире, цифров знак - с буква нили думата „номер“ и т.н.

И още веднъж за "Rambler"

  • Рамблер, на Rambler; нежелателно * Рамблер.

Rambler избра руско име за себе си в началото на 2000 г., то е записано в официалното му име (Rambler Internet Holding OJSC). Рамблер Rambler продължават да се наричат ​​от онези, които го помнят дори от много древни времена Стека.

  • с интернет холдинг Rambler, силно нежелателно * с Рамблер Интернет Холдинг!

Случи се така, че не съвсем грамотно име е законово закрепено (с кого не се случва - аут Ашманов и партньорисъщо написани на английски с две главни букви). Това официално име на Rambler може и трябва да се използва като цитат, например: в OJSC (в компанията) Rambler Internet Holding... Но * в Рамблер Интернет Холдингзвучи чудовищно!

  • Top100 на Ramblerтрябва да се пише по този начин. Не правилно * Rambler Top100, *Rambler Top100, *Топ 100, *Топ100и т.н.

Бележки (редактиране)

Цитирам Артемий Лебедев от сайта redactor.ru: „Прави впечатление, че мнозинството от хората, които пишат Интернетътс главна буква те често не променят тази дума и добавят към нея изграждането на „международна глобална компютърна мрежа“, която е пример за крещяща старомодност. " (

На пръв поглед те са напълно без значение за търговски запитвания. Има корелации с позицията в Yandex само за малка част от текстовите параметри и дори тогава те са слаби. В първите три и в третата десетка от резултатите от търсенето броят на появата на заявката в текста на страницата е приблизително еднакъв - и същото може да се каже за заглавието, за заглавията h1 -h4 и т.н.

Но всъщност, въпреки всичко това, текстовите фактори са критично важни. Ако сравним Yandex TOP 30 за търговски заявки и еднакво подходящи страници, които не са влезли в него (от Google TOP 30 и Mail.ru), се оказва, че стойностите на почти всички текстови параметри в TOP Yandex са статистически надеждни - и много забележимо - по -високи.

Това най -вероятно означава, че текстовите фактори работят в предварителните етапи на класиране - когато са избрани около хиляда резултати, които са допълнително подробно класиране.

Тоест, ако нямате достатъчно срещания на заявката на страницата (или отделни думи от заявката), тогава шансовете ви да влезете в ТОП Yandex рязко падат.

И така, за заявката "полилеи" в ТОП 30 на Yandex има само два резултата, при които думата "полилей" се среща по -малко от 40 пъти, - lustron.ruс 23 събития и полилей.rfс четири (плюс още един в името на домейна). Докато в ТОП 30 на Google има 5 страници, където "полилей" се среща по -малко от 10 пъти. Средният брой появявания на "полилей" в текста на страница за Yandex TOP 30 е 64, срещу 48 за Google и 30 за страници от върховете на Google и Mail.ru, които не са влезли в TOP Yandex .

Колко различна е ситуацията с текстовите фактори в Google от Yandex?

Напротив, в Google има забележими корелации между текстовите фактори и позицията - колкото по -близо до TOP 1, толкова по -високи са стойностите. Но от друга страна, не можете да видите „входния филтър“, както в Yandex, а средните стойности на текстовите параметри обикновено са малко по -ниски.

Но има и много общо. Така че и в двете търсачки факторите за класиране са толкова по -силни, колкото по -далеч отиваме от "буквата" на заявката. Изглежда, че точната форма на искането вече не се откроява сред останалите търсачки. Броят на отделните думи за заявка, разпръснати в текста, е по -важен от това колко пъти се появяват заедно. Важни са и синонимите на думите на заявката и в още по -голяма степен „допълнения“ - тези думи, които самите търсачки подчертават в откъси.

Прочетете повече за това в нашия голям аналитичен доклад относно факторите за класиране за Оптимизация 2017.

Нека се върнем директно към Yandex. Блогът на търсачката казва, че "Баден-Баден" е фокусиран върху прекалено оптимизирани текстове. Анализирате сайтове под „Баден“. Въз основа на резултатите от вашите наблюдения, върху какви специфични функции се фокусира алгоритъмът на Yandex? Защо сайтовете попадат под „Баден-Баден“?

По принцип всичко е формулирано в блога на Yandex съвсем ясно: „Те имат много повтарящи се ключови думи и неестествени фрази, но малко полезна информация. Ние наричаме такива текстове свръх оптимизирани ... ”.

Лесно е да се види, че Yandex разбира повторната оптимизация в по -широк смисъл - тя включва не само „пренасищане на ключови думи“ в нея, но и ниска естественост и безполезност за потребителя.

С други думи, Yandex не харесва SEO текстове. Нещо повече, той отдавна не ги харесва (вижте мантрите за сайтове, „създадени за хора“), но сега се научи да ги разпознава и реши да ги накаже заради тях.

Как точно ги разпознава е отделен и много по -малко важен въпрос. Факторите могат да бъдат много и те са свързани с трите компонента на SEO текста - изобилие от ключови думи, неестественост и ниска полезност. Различни честотни параметри (както свързани със заявки, така и не свързани); типичен за SEO текстове речник; дължината и позицията на текстовия блок; наличието на скрит текст; структурираност на текста. И това не е пълен списък.

Най -вероятно проблемът е решен по чисто практичен начин. Използвахме максимално факторите, които вече се използват от Yandex за други задачи (например при класиране); към тях бяха добавени редица нови фактори, разработени специално за тази задача. Машинното обучение се изпълнява толкова пъти, колкото е необходимо, за да се постигне необходимата пълнота и точност. След това проведохме A / B тестване - и в битка.

Не се опитахме да разберем какво точно взема предвид Yandex - очевидно няма достатъчно данни за това и това в крайна сметка не е толкова важно. Опитахме се да научим как да идентифицираме и оценяваме SEO текстовете. И мисля, че се справихме добре. Освен това е важно да не просто даваме цялостна оценка, а да сложим всичко на рафтовете и по този начин да покажем какво би било полезно да поправим.

Какъв процент нискокачествено съдържание е приемливо на страницата? Колко трябва да бъдете предпазливи към филтъра на страница? И колко - така че целият сайт да попадне под филтъра?

Процентите не играят особена роля. За да започне борбата с SEO текстовете, Yandex първо трябваше да се научи да разбира добре структурата на уеб страница - да подчертава областите за навигация, „витрина“, рецензии, реклами, различни други блокове - и SEO текст върху нея. Размерът на "бъчвата с мед" (съдържанието на страницата) няма значение. Размерът на "мухата в мехлема" е важен. Колкото по -голямо е, толкова по -лошо. Но може да бъде и сравнително малък. Да речем, че две хиляди знака определено са достатъчни. Може би очевидно няколко средни параграфа ще бъдат достатъчни - по -малко от хиляда знака, сто или повече думи. Трудно е да се каже по -точно. Въпросът е, че има три типа страници, които са важни за B.-B .:

1) уловено под филтъра на страницата;

2) уловени под филтъра на сайта;

3) тези, посочени от техническата поддръжка на Yandex.

И никой от тях не осигурява пълна яснота.

За съжаление знаем доста за филтъра на страницата: нямаше такива клиенти сред клиентите на Ashmanov & Partners; потребителите на "Тургенев" по -често докладват за филтъра на сайта, публикациите "в отворени източници" и т.н. са малко. Известните за нас случаи попадат в две категории - груби (големи „двойни“ SEO текстове, има много „катран“) и съмнителни (трафикът спадна малко преди обявяването на новия алгоритъм, така че собственикът на сайта смята, че това е "Баден-Баден", но ние сме много се съмняваме в това).

Много повече се знае за филтъра на сайта. Но е почти невъзможно да се определи точно кои страници са взети предвид при налагане на санкции, така че те също не са подходящи за определяне на прагове. Засегнатите сайтове имат страници с големи SEO текстове, които очевидно заслужават „Baden -Baden“ - и те често включват главната страница на сайта и страниците на основните раздели. И има страници с много кратки текстови блокове и изобщо без тях. За това, което сайтът е наказан, според тези данни е лесно да се разбере, но къде Yandex чертае границата е трудно.

И накрая, третият тип страници са тези, на които самият Yandex сочи, когато отговаря на заявки от уеб администратори. Тези страници изглеждат специфични и някои от тях са известни, но проблемът е, че често не са много разкриващи. Грубо казано, ако всички подобни (и най -лоши) страници бяха под санкции, Yandex просто нямаше да намери нищо. Можете да си представите, че такива страници предизвикват роботи някоипретенции, но във всички известни за нас случаи на същите сайтове бяха много по-злестраници (включително често главата на сайта). Тези сайтове наистина заслужават „B.-B.“ - но страниците, които Yandex счита за необходимо да покаже, не изиграха първата роля в това.

Ако говорим за пазара, според вашите наблюдения, колко уебмастъри са „променили решението си“ след стартирането на „Баден-Баден“?

Изненадващо много, въпреки много целенасоченото използване на санкциите досега.

Сега ясно се виждат две основни конкурентни стратегии - да играете на сигурно или да изчакате да ухапе печен петел. Вторият от тях е силно обезсърчен.

За да не попаднете под санкции, достатъчно е да премахнете или редактирате откровено неестествени текстове. Те обикновено са видими с невъоръжено око - но можете да се консултирате с Тургенев. За да се отървете от вече написаните ви санкции, трябва да преминете през търсенето - да познаете защо Платон не харесва изпратената от него страница и колко още. Превенцията е по -евтина от лечението.

През декември обявихте текстовия анализатор на Тургенев. Разкажете ни как и върху какви данни обучихте анализатора? Каква беше пробата?

Всъщност няма машинно обучение. Има алгоритми и речници. Те бяха разработени и отстранени с отстраняване на грешки върху материала на няколкостотин страници, попаднали в „Баден -Баден“, от около пет дузини различни сайтове - както и много хиляди други текстове, чието качество оценихме сами.

Строго погледнато, ние видяхме задачата си да се научим как ефективно автоматично да идентифицираме оптимизираните текстове - и, не по -малко важно, да обясним какво точно не е наред с тях. Машинното обучение не би позволило това.

Между другото, дори в случаите, когато директната заплаха от "B.-B." не, Тургенев е полезен за уебмастъри и копирайтъри, тъй като помага да се забележат и коригират неестествени повторения, стилистични грешки и други подобни проблеми.

Как Тургенев определя, че това или онова съдържание трябва да бъде добавено / премахнато? С какви материали услугата сравнява текста при анализ? Например с подобни, които вече са в базата данни; взети от издаването в реално време; въз основа на средни стойности на цялото съдържание и т.н.?

Първо разработихме параметрите, отговорни за риска от „Баден-Баден“ в рамките на лабораторията за Анализ на търсенето, и едва след това се появи идеята да направим обществено достъпна услуга. Следователно имаме две различни версии на Тургенев: тази, публикувана на turgenev.ashmanov.com, за всички, и „вътрешният Тургенев“, за нашите клиенти. Вътрешната версия на алгоритъма работи с уеб страници и взема предвид контекста на заявките, по които те трябва да бъдат намерени. Например, той изчислява размера на текстов блок и "водно съдържание" въз основа на показателите на страници в Yandex TOP за конкретни заявки.

Публичната версия работи само с текстове (това ограничение направи услугата безплатна) и следователно няма с какво да се сравнява материалът, който се проверява. Той просто се оценява по няколко параметъра, печели наказателни точки, ако има нещо, и в резултат на това рискът се оценява чрез сумата от точки за различни параметри. Не препоръчваме добавяне или премахване на съдържание - ние просто идентифицираме проблеми и какво да правим с него, авторът на текста или собственикът на сайта трябва да решат.

В раздела „Повторения“ се преброяват честотите на думите и фразите, изгражда се прост модел, чрез който се оценява наличието на „свръхчести“ думи. Обикновено в SEO копие, това са думите, за които е (ре) оптимизиран. Общият брой повторения в текста също се изчислява - за това използваме параметър, който SEO оптимистите обичат със странното име „академично гадене“, което трябваше да преоткрием, тъй като рецептата му, както се оказа, се пази в тайна. Праговете за него са поставени доста високо - наказателните точки започват с академично гадене от 10,5, тоест само „текстовете с наистина голям брой повторения се„ наказват “. А текстът може да получи и точка за много висока честота на съюза „и“ - тук става дума по -скоро за стилистиката, за да се уловят текстове, в които „опитни и знаещи лекари гарантират кодирането и избавянето от зависимостта“.

В раздела „Стилистика“ просто се отчитат появата на думи и фрази от няколко типа. На първо място, това са обратите на речта, характерни за лошите SEO текстове. Например фрагменти за да се уверите в този избор, ви предлагаме да разгледате основните характеристики на продуктаили всеки знае, че пералнята е важен атрибут на банятабяха подредени от нас за кавички почти без остатък и сега всеки текст, в който се срещне „уверете се в този избор“, ще получи за това определено количество „стилистични кванти“, които след определен праг се превръщат в наказание точки. Освен това се отбелязват различни стилистични грешки, бюрокрация, прекалено разговорни фрази и много други. Те са взети и от SEO текстове и въпреки че много от тях сами по себе си не правят текста неестествен, ако има много от тях, това се превръща в проблем, чиято тежест се изразява в наказателни точки.

В раздела „Искания“ са маркирани заявките, срещани в текста от средния „търговски“ списък (около два милиона и половина). Ако обхватът на заявката е голям, това може да показва свръх оптимизация.

Останалите два раздела дават точки по -рядко и много малко. "Водно съдържание" - за нисък дял от смислен текст. "Четене" - за текст, в който има много дълги изречения и дълги думи.

Колко данни за един и същ текст могат да варират от ден на ден?

Обикновено не много. Продължаваме да подобряваме алгоритмите и да попълваме речници, но вероятността нещо забележимо да се промени за вашия текст е много малка. Рядко изключение - ако това е вашият текст, който използвахме днес за попълване на речници.

Колко точно Тургенев определя риска от попадане на сайт под Баден-Баден?

Всеки път, когато научаваме за нов пример за сайт или страници, които попадат под филтъра, проверяваме работата на „Тургенев“ върху тях. В 95% от случаите той се справя - показва критичен или висок риск. В този смисъл всичко е наред - само ние ви препоръчваме да проверите няколко текста от сайта (и е задължително SEO текстовете, а не цялата страница).

Но това, разбира се, не означава, че всеки текст, за който Тургенев е показал висок риск, ще попадне под филтъра утре. Високите резултати показват само, че текстът е неестествен, прекалено оптимизиран и се нуждае от редакция. Все още има много такива в ТОП -а на Yandex - включително на първите позиции, особено за заявки за информация. Защо не е въпрос за нас.

Представителите на Yandex, когато са заобиколени от SEO и се борят помежду си, питат защо сайтът ми е под филтъра и такъв и такъв, още по -лош, е на свобода, обикновено отговарят: „Все още не е вечер, всичко си има своето време . "

Ние можем само да се присъединим към този отговор.

Вярно, фалшиви положителни са възможни, ако те проверяват текстове, за които Тургенев не е предназначен. Например, много закони и други правни документи получават много точки за повторение и някои повече за стил и четливост. Да, законите също не са най-естествените текстове, написани далеч от най-добрия стил, макар и не прекалено оптимизирани.

Тургенев предназначен ли е само за търговски сайтове? Или е подходящ и за информационни портали? В края на краищата, изглежда, SEO-текст-той е там, и има SEO-текст.

SEO-текстовете са различни и естеството на проблемите, предимно стилистични, в свръхоптимизирания информационен текст е малко по-различно, отколкото в комерсиалния. От текстове като преди да отговорите на въпроса: "Доксициклин - от какво са тези хапчета?", трябва да кажете какъв състав има това лекарствотрябва да съберете маркери, характерни за тях.

Правим това малко по малко и такива текстове също се улавят, макар и малко по -лоши от комерсиалните. Например страницата, от която е взет цитатът в предишния параграф, получи само 5 точки, въпреки че със сигурност заслужава повече. Но от друга страна, този текст перчи в ТОП -а на Яндекс на първата позиция (за заявката „таблетки доксициклин“ по време на писането). Когато Yandex започне да прилага Baden-Baden към текстови отпечатъци, ние ще им обърнем нужното внимание и те ще бъдат добре уловени.

Все още не знаем нито един потвърден пример за използването на „B.-B.“ към информационни сайтове. Ще бъдем много благодарни, ако някой от нашите читатели ще изпратя- както и всички примери за "Баден-Баден". Интересът тук е взаимен - ще се радваме да обсъдим вашия случай с вас и това ще ни помогне да подобрим услугата за всички.

Как планирате да развивате Тургенев, в каква посока?

Все още не сме мислили сериозно за глобалните планове, но на местно ниво работим върху няколко раздела едновременно. Например, ние ще подобрим драстично раздела „Искания“ - и в същото време ще ускорим издаването на отговори (факторите, свързани с исканията, сега се считат за по -дълги от всички останали).

Управляващ партньор на компанията

Един от най -известните мениджъри в Рунет, специалист в областта на изкуствения интелект, разработка на софтуер, управление на проекти. Управляващ партньор на Ashmanov & Partners. Завършил Механико -математическия факултет на Московския държавен университет, кандидат на техническите науки.

Игор Ашманов работи в информационните технологии от 1983 г. Той ръководеше разработването на програмата за проверка на правописа Orfo в Информатика, беше съсобственик и главен изпълнителен директор на MediaLingua, която произвеждаше речници на MultiLex, и изпълнителен директор на холдинга Rambler Internet. През това време той пусна няколко десетки проекти, включително:

  • Езиковият модул ORFO (проверка на правописа и стила, тезаурус, модул за преноса) в руската версия на Microsoft Office, който се използва от милиони хора в цяла Русия;
  • Електронни речници „MultiLex“, които все още са най -добрият инструмент за професионален преводач в Русия;
  • Версията на търсачката на Rambler, пусната през 2001 г., и повечето сайтове и услуги на портала Rambler, преди да бъдат актуализирани през 2012 г.
  • Спам филтър "Spamtest", който защитава десетки милиони потребители (сега се продава под марката "Kaspersky Anti-Spam").
  • Търсачка за новини "Novoteka", обобщаваща и групираща новини от стотици източници.
  • Търсене на хора "Flexum" е услуга за създаване на тематични търсачки.

Игор Ашманов е член на Международния съюз на интернет фигури „EZHE“, два пъти спечелен в номинацията „Личност на годината“ в конкурса на мрежата ROTOR (в ROTOR 2004 и в ROTOR-2006), в рамките на движението EZHE има Галерия от видни дейци на мрежата, в която е FRI на Игор Ашманов.

Партньор на компанията

Известен специалист в областта на управлението на производството на софтуер. Сега той се занимава с разработването и развитието на технологията "Семантично огледало" и редица други. Завършва физическия факултет на Московския държавен университет. Преподава програмиране в катедра „Физика“.

През 1999-2001 г. Алексей работи като ръководител на проекта за търсене в Rambler, където под негово ръководство е разработена и пусната в експлоатация нова версия на търсачката.

През 1995-1999 г. Алексей Иванов е технически директор на компанията MediaLingua, където ръководи разработването на семейството компютърни речници MultiLex и много други проекти.

През 2001-2005 г. той участва в разработването на спам филтър за спам в Ashmanov & Partners.

През 2004-2007 г. - ръководител на проекта „Семантично огледало“ и проекта за търсачка „Ашманов и партньори“.

2006–2012 г. - ръководител разработка на проекта „Анализатори за търсачки“.

През 2010–2011 г. - ръководител на проекта за социално търсене във Flexum.ru.

2011–2016 г. - ръководител на проекти за Wada.vn, търсачка за виетнамския сегмент на Интернет.

2015–2016 г. - ръководител отдел „Развитие“ на WadaMarket.com, агрегатор на стоки за виетнамски онлайн и офлайн магазини).

Партньор на компанията

Специалист в Русия по интернет технологии, сложна разработка на уебсайтове, големи натоварвания, големи количества данни. В Ashmanov & Partners той разработва търсачка.

Най -известните са собствените им проекти Russian Internet Survey и руският уеб сървър Apache, който управлява повече от половината от всички сайтове на Runet.

Един от най -добрите специалисти в Русия в областта на интернет технологиите, разработването на сложни уебсайтове и интернет услуги, големи натоварвания, големи количества данни. Завършва геоложкия факултет на Московския държавен университет.

Алексей е най -известен със собствените си проекти Russian Internet Survey и руския уеб сървър Apache.

През 1999-2001 г. Алексей беше ръководител на проекта Top100 на Rambler в холдинга Rambler Internet.

От 2001 г. - служител и съсобственик на Ashmanov & Partners.

През 2004-2006 г. е технически директор на компанията Search Technologies, автор на търсачката за новини Novoteka и мрежата за обмен на новини.

От 2008 г. - главен технически директор на LibRaw LLC, която разработва софтуер и инструменти за развитие на цифрова фотография.

В момента той не ръководи никакви проекти в компанията.

Алексей Тутубалин е член на Международния съюз на интернет фигурите „EZHE“, печели три пъти в категорията „Изследовател на годината“: в мрежовото състезание ROTOR 2006, в състезанието ROTOR ++ 2007 и в състезанието ROTOR 2008 , в рамките на движението EZHE има Галерия от видни мрежови фигури, в която има.

Партньор на компанията

Специалист в пускането на ИТ приложения, съчетаващ знанията и уменията на мениджър, програмист и лингвист. В Ashmanov & Partners той отговаря за технологиите за изкуствен интелект.

Завършва Филологическия факултет на Московския държавен университет, катедра „Приложна лингвистика“.

През 1996-1999 г. Кирил Зорки работи като ръководител на лингвистичния отдел в MediaLingve и публикува речници на MultiLex. Контролираше подготовката на данни за електронни речници, разработи компютърна морфология на няколко езика.

През 1999-2001 г. Кирил работи като ръководител на отдела за проекти за съдържание в Rambler, като през това време пусна няколко десетки съдържателни проекта на Rambler.

От 2001 г. Кирил Зоркий е служител и съсобственик на Ashmanov & Partners.

През 2001-2005 г. той е ръководител на проекта Spamtest.

2005–2007: Ръководител на отдел „Анти-спам“ в Лаборатория Касперски, ръководител на проекти за Kaspersky Anti-Spam.

В момента - технически директор на фирма "Наносемантика".

Партньор на компанията

Доктор по физика и математика, един от най -добрите експерти в Русия в разработването на технически сложен софтуер, технически одит, управление на ИТ проекти.

Завършил Физическия факултет на Московския държавен университет, кандидат на физико -математическите науки.

През 1996-1999 г. Дмитрий е служител на компанията MediaLingua, участва в разработването на повечето проекти на MediaLingua: електронни речници, услуги за търсене, сървърни приложения, интернет проекти и др.

През 2000-2001 г. Дмитрий Пашко работи в холдинга Rambler Internet - първо като ръководител на оперативния отдел, а след това като технически директор. През това време под негово ръководство са разработени, тествани и публикувани над 30 проекта. По -специално, през 2000 г. Дмитрий отговаря за уникалния проект на интернет игри „Какво? Където? Кога? ", В кои екипи от експерти се състезаваха с" универсалния ум ".

От 2001 г. служител и съсобственик на Ashmanov & Partners, участва в проектите Spamtest, SeoRate, Semantic Mirror, както и в развитието на уеб услугите на компанията.

От 2013 г. той отговаря за технологичното развитие в Ashmanov & Partners. Участва в спомагателни проекти на компанията, свързани с Интернет анализ и защита на потребителите от нежелана информация.

Партньор на компанията

Лингвист, лексикограф, специалист по интелектуални технологии и използваемост на сайта. Работи за Ashmanov & Partners от създаването му. В момента той ръководи лабораторията за Анализ на търсенето.

Работил е като изпълнителен редактор на „Комерсант“ (тогава все още седмичник). Разработил най -добрия алгоритъм за пренасяне на руски език досега. Написал англо-руския речник „Християнство“. Подготвени данни за речници на MultiLex. Беше главен редактор на портала Rambler. Участва (и продължава да участва) в създаването на отличния научно -популярен сайт Elementy.ru.

От 2007 г. той работи по проекта AnalyzeThis.ru, който представлява повече от 70 автоматични анализатора, които оценяват качеството на търсене на руски, английски, китайски и виетнамски език. Изучава феномена на спама в търсачките и разработва методи за борба с него. Наблюдаваше подготовката на данни и работата на лингвистите за виетнамската търсачка Wada.vn и Wada-пазара.

През 2014-2015 г. тя работи като директор по маркетинг и външни комуникации в Крибрум, където отговаря за развитието на услугите.

От 2015 г. управлява комуникационната агенция Vaa Va Agency.

От 2017 г. е главен изпълнителен директор на Ashmanov & Partners St. Petersburg.