Всички ли знаят какво означава термина стоп думи (stop words)

стоп думи

Здравейте, приятели! В тази статия ще поговорим за така наречените стоп думи (stop words). Милиони умове си бият главите над това как да разберат алгоритмите на търсачките. Настоящите тайни на тези алгоритми са известни само на ограничен кръг хора работещи за тези търсачки и се намират естествено по понятни причини под гриф <<СЪВЪРШЕННО СЕКРЕТНО>>.

Като при това съществуват някой особености на алгоритмите, които са известни на всички и по определен начин опростяват оптимизацията за търсачките.

Най-характерния пример е термина стоп думи (stop words), тема на тази статия.

Всички знаят, че при индексация на страница, търсачките изучават много внимателно именно текста. Фактически всяка дума носи своята си ценност или обратно – безполезност. Имам в предвид не за хората, а за търсачките.

Именно за това в последно време при писане на текстове много seo оптимизатори забравят, че текста, преди всичко е предназначен за хората, а не за търсачките. Ако „нагаждате“ текстовия материал в статиите изключително за търсачките – да се чете без сълзи в очите и гняв на устата ще бъде практически невъзможно.

И така, да се върнем към основната тема за този пост.

Стоп думи (stop words) – това са думи, които не носят никакво смислово значение, съответно, тяхната полза и роля за читателя е несъществена.

Трябва да добавим, че тези думи също така се наричат „шумови“. Необходимостта от отделянето на стоп думите в отделен списък се обяснява просто. Търсачките ежедневно индексират колосално количество страници в Интернет. А отделянето в списък на думи, които не носят никакво смислово значение, е способно съществено да съкрати обема на индекса. Тоест причината е банална – икономия.

Сега да поговорим за списъка от стоп думи (stop words). Веднага ви казвам – пълен и универсален списък не съществува. Освен това, всяка търсачка си има свои особености и различия в този списък. Също така, търсачките постоянно се усъвършенстват, затова списъка със stop words периодично се обновява – тръгват си стари приятели, идват нови събратя и т.н.
Но все пак, има общи моменти, върху които сега ще обърнем подробно внимание.

В списъка от стоп думи (stop words) влизат:

  1. Цифрите:

1, 2, 3, 4, 5, 6, 7, 8, 9, 0

едно, две, три, четири, пет, шест, седем, осем, девет, нула

  1. Отделно стоящи препинателни знаци:

. , – _ = + / ! ” ; : % ? * ()

  1. Отделно стоящи букви от азбуката:

а, б, в, г, д, е, ж, з, и, й, к, л, м, н, о, п, р, с, т, у, ф, х, ц, ч, ш, щ, ь, ю, я

  1. Думи, местоимения, причастия, предлози, междуметия, съюзи, суфикси, частици и съчетания на букви.

Списък със български стоп думи може да видите на тази страница.

  1. Думи, които често се срещат във уеб сайтовете:

Интернет, сайт, въпроси, отговори, компютри, цена, поръчка и т.н.

  1. Нецензурна реч.

Следва да се отбележи още един детайл. Много seo специалисти в мрежата са на мнение, че ако стоп думи (stop words) образуват наложили се фразеологични съчетания, то търсачките все пак ги индексират. Класически пример за това е известната на всички фраза от училище „да бъдеш или да не бъдеш“.

И най важното е за на края. Използване то на стоп думи (stop words) е неизбежно. Просто е нужно да се стараете да ги минимизирате доколкото е възможно това.

Ако ви е харесала статията – споделете я с приятелите в социалните мрежи. Ако имате въпроси – задавайте ги в коментарите. Непременно ще ви отговоря.

С уважение, Николай Томов.

Хареса ли ви статията? Споделете я с приятелите:

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *