Тошнота текста

Тошнота текста

Тошнота текстаВ рамках данного обзора, я расскажу вам о том, что такое тошнота текста и плотность ключевых слов, а так же про некоторые важные аспекты.

Поисковые системы не могут оценивать текст так, как это делал бы человек. Как минимум, у них нету горячей кружки чая с лимоном. Ну, а если серьезно, то поисковикам приходится использовать различные механизмы анализа текста. Это в свою очередь означает, что люди, занимающиеся сео оптимизацией, ни один раз задумывались о том, чтобы создать собственные алгоритмы, которые были бы схожи (так как поисковики не публикуют свои). Иными словами, чтобы не тратить время впустую, а проверять качество текста еще до того, как это сделает поисковик.

Одним из таких экспериментальных подходов является тошнота текста, позволяющая частично оценивать качество и удобность чтения. Но, обо всем по порядку.

Примечание: Читателю стоит понимать, что большая часть сео методов оценки качества сайтов представляют собой результаты многочисленных экспериментов.

 

Тошнота текста и плотность ключевых слов

Тошнота текста

Тошнота

Тошнота - это частота употребления слова в тексте. Основное назначение это не допустить переспама, чаще всего означающего, что обзор написан для поисковиков, а не для человека. Нередко применяется при копирайтинге и рерайтинге. Стоит знать, что при анализе обычно используются корни слов. Так, например, слова "сайты" и "сайтов" будут считаться одним словом "сайт".

Пример для понимания сути. Сравните две фразы: "Компьютеры это шикарно! В компьютерах можно играть в компьютерные игрушки, а еще компьютеры позволяют устанавливать компьютерные программы! " и "Компьютеры это шикарно! В них можно играть и веселиться, а еще существует много полезных программ!". Оба выражения не сильно наполнены смыслом. Однако, любой человек, при прочтении первой фразы, вспомнит такое выражение как "масло масляное".

Иными словами, тошнота позволяет оценить насколько текст перегружен повторениями слов.

 

Плотность ключевых слов

Порой, тошноту текста приравнивают к плотности вхождения ключевого слова, но это не совсем корректно. Дело в том, что плотность вхождения это суммарная частота употребления слов из ключевого словосочетания в тексте. Тошнота же подразумевает анализ каждого отдельного слова документа (более подробно чуть дальше).

По аналогии с тошнотой, при анализе плотности используются корни слов, но без учета шумовых слов, таких как часто встречающиеся части речи, цифры, причастия, предлоги, частицы и прочее.

В чем особенность учета плотности ключевых слов? Дело в том, что если частотность отдельных слов из ключа будет меньше иных, то снижается вероятность, что поисковик посчитает текст релевантным запросу. Например, если вы оптимизировали страницу сайта под ключ "почистить реестр", но почему-то слово "мышь" встречается чаще, чем отдельные слова из ключа, то для поисковика текст страницы может быть больше связан с запросами вида "почистить мышь", чем с исходным.

Считается, что плотность должна быть в районе 3-5%.

 

Пример расчета плотности вхождения ключа

Рассмотрим, как считается плотность вхождения ключа. Например, вы написали обзор под запрос "компьютерный стол" размером в 200 слов. Употребили ключ 7 раз - из них 3 чистые вхождения (без изменения слов и падежей), 2 разбавленные (с дополнительными словами) и 2 морфологические (разные падежи). Кроме того, еще 2 раза употребили слово "компьютер".

Считаем частотность и плотность вхождения. Частота слова "компьютер" составляет 4,5% (9 * 100 / 200), слова "стол" 3,5% (7 * 100 / 200). Плотность вхождения 8%. Достаточно большое значение, учитывая, что при средней длине 8-10 символов, 200 слов это всего 1600-2000 знаков.

Примечание: Одинаковая частота слов из ключа это крайне редкое событие. Вполне нормально, если часть из них употребляться чуть больше, а часть чуть меньше.

 

Виды тошноты текста

В нынешнее время существует два вида расчета тошноты текста. Рассмотрим их подробнее.

Но, прежде, хотел бы заметить, что в разных сервисах по разному уделяют внимание словам. Например, в одних междометия и тому подобные шумовые слова могут считаться, в иных наоборот исключаться из анализа. Что из этого корректно? Тот еще вопрос. Помните, что во многом сео оптимизация это эксперименты.

 

Классическая тошнота

Классическая тошнота - это квадратный корень от количества повторений самого часто употребляемого слова в тексте. Основная суть данного подхода в оценке разнообразия слов в тексте. Ведь, если слово слишком часто повторяется, то оно начинает приедаться и текст становится неудобным для восприятия.

Пример расчета. Допустим, в обзоре 16 раз использовали слово "компьютер" (остальные меньше). В таком случае классическая тошнота будет равна 4 (4 * 4 = 16).

Нормальным считается значение до 5. Но, так как параметр рассчитывается без учета длины текста, то необходимо адекватно подходить к оценке. Допустим, если у вас обзор в 40 000 символов без учета пробелов, то 25 повторений может быть даже слишком мало. А вот те же 25, но для текста в 2000-3000 символов это уже многовато.

Примечание: Существует мнение, что значение классической тошноты не должно превышать 7.

 

Академическая тошнота

Академическая частота - это процентное соотношение количества повторений самых частых слов к общему количеству слов. Основная суть данного подхода в том, чтобы оценить насколько текст наполнен повторяющимися словами (акцентирование внимания). Если процент слишком мал, то вряд ли поисковые системы сочтут, что страничка сайта соответствует поисковым запросам (нет акцентирования). Если же слишком большой, то поисковик может посчитать, что текст переоптимизирован или не предназначен для людей.

Как происходит вычисление? Обычно рассчитывают частотность для всех слов, затем формируют таблицу в порядке от большего к меньшему, берут несколько самых частых слов и складывают их частотность.

Пример расчета. Допустим, в обзоре вы написали 1000 слов из них слово "компьютер" встречается 16 раз, "пыль" 15 раз, "чистить" 12 раз. В таком случае, их частотности 1,6%, 1,5% и 1,2% соответственно. Академическая тошнота будет 4,3% (1,6% + 1,5% + 1,2%).

Чаще всего, в интернете можно встретить диапазоны 5-7% и 7-9%. Какой из низ корректный сложно сказать, так как в ТОПе могут быть как тексты с большой тошнотой (например, 11-13%), так и с малой (3-5%).

 

Роль в SEO

Вообще, само понятие тошноты текста появилось из-за того, что многие авторы стали буквально "нашпиговывать" тексты ключевыми словами, чтобы их сайты ранжировались выше остальных. Как не сложно догадаться, поисковыми системам это не очень понравилось и они стали всячески бороться с подобным переспамом.

Если же говорить о насущном. Раньше тошнота текста была более важна. В нынешнее же время, больший приоритет придается иным метрикам, таким как поведенческие факторыссылочная масса (как бы там не говорили), перелинковка и прочее. Основная причина - это переизбыток однотипного текста в интернете. Тем не менее, это не означает, что можно "набивать" заметки ключами по самое "не хочу" или же наоборот слишком редко употреблять слова.

Примечание: Советую ознакомиться с обзорами парадокс дублированного контента и вода в сео.

 

Суть взаимосвязи плотности вхождения ключей и тошноты

Суть взаимосвязи плотности вхождения ключей и тошноты в следующем. Тошнота позволяет определить насколько органично ключи распределены в тексте. Например, если плотность 4%, а тошнота 15%, то немал шанс того, что ключи "как бы" размазаны среди остальных часто употребляемых слов. И поэтому вряд ли поисковая система посчитает такие страницы релевантными (разве что текст большой). Еще пример. Если плотность и тошнота 5% (одинаковы), то ключи слишком выделяются. И поэтому вряд ли такой текст органичен, разве что запрос из 5-10 слов, как при продвижении по низкочастотникам.

Примечание: Напоминаю читателям, что в разных сервисах могут применяться разные подходы. Поэтому старайтесь уточнять детали расчета, анализа и приемлемые диапазоны.

Теперь, вы знаете что такое тошнота текста, а так же ряд особенностей.

Социальные сети

☕ Понравился обзор? Поделитесь с друзьями!

Добавить комментарий / отзыв
Комментарий - это вежливое и наполненное смыслом сообщение (правила).



* Нажимая на кнопку "Отправить", Вы соглашаетесь с политикой конфиденциальности.
Социальные сети
Программы (Freeware, OpenSource...)