Формула ранжирования и SEO

Конспект: Функция ранжирования и SEO

  1. Определения:

  • Формула ранжирования: Математическое выражение, определяющее порядок выдачи результатов поиска в поисковых системах.

  • Факторы ранжирования ПС: Различные параметры и характеристики документов, используемые для оценки их релевантности к запросу пользователя.

  • Способы влияния на факторы ранжирования: Методы оптимизации контента и технические приёмы, направленные на улучшение позиций в поисковой выдаче.

  • Понятие "SEO" (Search Engine Optimization): Процесс оптимизации веб-ресурсов с целью улучшения их видимости и ранжирования в результатах поиска.

В 1970 и 1980 годах Стивен Робертсон, Карен Спарк Джоунс и другие ученые представили вероятностную модель, используемую ведущими поисковыми системами для ранжирования результатов поиска. Эта модель, развитая в функцию ранжирования в информационном поиске, получила название Okapi BM25 в честь английской поисковой системы Okapi.

TF-IDF (Term Frequency-Inverse Document Frequency): TF-IDF - статистическая мера, используемая для оценки важности слова в документе по отношению к коллекции документов или корпусу. Она вычисляется на основе частоты встречаемости слова в документе (TF) и обратной частоты встречаемости в других документах коллекции (IDF).

TF - частота слова в документе. IDF - обратная частота слова в коллекции документов. TF-IDF - произведение TF и IDF, оценка важности слова в документе.

TF измеряет, насколько часто слово встречается в документе, а IDF оценивает, насколько важно слово в контексте всей коллекции документов.

Пример вычисления TF-IDF: если на странице из 1000 слов слово "хомяк" встречается 30 раз, то TF для него будет равен 0,03. IDF вычисляется как отношение количества документов, в которых встречается слово "хомяк", к общему количеству документов в коллекции. Например, если таких страниц 2 миллиона из общего числа в 5 миллиардов, то IDF будет равен 0,0004. Итоговый вес слова "хомяк" TF-IDF составит 75 (0,03/0,0004).

Функция Okapi BM25 - алгоритм ранжирования документов.

Доменная зона - Часть интернет-адреса после точки.

Домен - уникальное имя для идентификации ресурса в интернете.

Факторы, влияющие на ранжирование документов, включают в себя:

  1. Релевантность содержания документа к запросу пользователя.

  2. Частота встречаемости ключевых слов в документе.

  3. Важность ключевых слов в контексте всей коллекции документов.

  4. Длина документа.

  5. Структура документа (например, заголовки, подзаголовки).

  6. Качество и количество ссылок на документ (в случае веб-поиска).

  1. Функция Okapi BM25: Релевантность документа к запросу пользователя вычисляется с использованием формулы BM25:

Score(D,Q)=i=1nIDF(qi)f(qi,D)(k1+1)f(qi,D)+k1(1b+bDavgdl)\text{Score}(D,Q) = \sum_{i=1}^{n} \text{IDF}(q_i) \cdot \frac{f(q_i,D) \cdot (k_1 + 1)}{f(q_i,D) + k_1 \cdot (1 - b + b \cdot \frac{|D|}{\text{avgdl}})}

Где:

  • f(qi,D) f(q_i,D) - частота слова qi q_i в документе D D TFTF.

  • D |D| - длина документа (количество слов в нем).

  • avgdl \text{avgdl} - средняя длина документа в коллекции.

  • k1 k_1 и b b - свободные коэффициенты (обычно k1=2.0 k_1 = 2.0 и b=0.75 b = 0.75 ).

  • IDF(qi) \text{IDF}(q_i) - обратная документная частота слова qi q_i .

Функция BM25 основана на принципах TF-IDF и используется для оценки релевантности документов поисковому запросу. BM25F - модификация BM25, учитывающая различные параметры, такие как заголовки, околоссылочный текст и количество ссылок, каждому из которых присваивается своя степень значимости.

Ранжирование в поисковых системах зависит от множества факторов, которые работают в комплексе. Для достижения результатов важно понимать базовые принципы ранжирования и усиливать их применение на сайте.

Доменные факторы ранжирования включают возраст домена, срок продления, историю, название, скрытие данных WHOIS, доменную зону и санкции. Контентные факторы включают доступность и полезность контента для пользователей, а также легкость его восприятия и достижение целей.

Заголовки играют важную роль на странице, включая заголовок страницы, главный заголовок контента и подзаголовки. Мета-описание страницы используется для краткого описания содержания в результатах поиска. Частота цитирования ключевых слов, количество контента на странице, расположение ключевых слов, использование синонимов и различных ключевых слов также влияют на релевантность страницы.

Списки и таблицы:

  1. Маркированные и нумерованные списки: Помогают облегчить восприятие контента как для людей, так и для поисковых систем.

  2. Удобство страницы: Использование удобной структуры разметки данных на странице, таких как теги, метаданные и микроразметка, улучшает опыт пользователя и ранжирование страницы.

  3. Уникальность контента: Уникальный контент повышает качество сайта. Заголовки, тексты статей и изображения должны быть уникальными.

  4. Уникальные изображения: Использование уникальных изображений также способствует качеству контента на сайте.

  5. Канонические ссылки (rel=canonical): Помогают избежать дублирования контента и управлять индексацией страниц.

  6. Частое обновление сайта: Подсказывает поисковым системам, что сайт можно индексировать чаще.

  7. Обновление старых страниц: Повышает их актуальность и цитируемость.

  8. Частота обновления старых страниц: Улучшает свежесть контента на сайте.

  9. Возраст страницы: Старые страницы могут ранжироваться лучше новых.

  10. Формулировка ключевого запроса: Различные формулировки помогают поисковым системам понять тематику страницы.

  11. Исходящие ссылки на авторитетные сайты: Делают контент более достоверным и полезным.

  12. Количество исходящих ссылок: Избыточное количество может негативно повлиять на вес страницы.

  13. Количество входящих внутренних ссылок: Повышает цитируемость страницы и ее релевантность.

  14. Качество входящих внутренних ссылок: Определяет их вес.

  15. Битые ссылки: Могут негативно отразиться на рейтинге сайта.

  16. Мультимедиа данные: Делают контент более привлекательным и разнообразным.

  17. Сложность текста: Должен быть понятным и структурированным.

  18. Ошибки в тексте: Могут негативно сказаться на рейтинге страницы, если не объяснены поисковым системам.

  19. Категория страницы: Расположенные в связанных категориях более релевантны для ключевых запросов.

  20. Удаленность URL страницы от главной страницы: Может влиять на ее авторитет.

  21. Длина URL страницы: Слишком длинные URL могут негативно сказаться на ее восприятии.

  22. Ключевые слова в URL страницы: Повышают ее релевантность.

  23. PageRank и другие индексы цитирования: Могут оказывать влияние на ранжирование страниц.

  24. Валидность HTML сайта: Может служить сигналом качества сайта.

  25. Скорость загрузки страницы сайта: Быстрая загрузка может положительно сказаться на ранжировании.

Выбор обусловлен несколькими факторами:

  1. Скорость загрузки страницы: Быстрая загрузка страницы является одним из ключевых факторов как для пользователей, так и для поисковых систем. Медленные сайты могут отталкивать посетителей и ухудшать их пользовательский опыт, а также отрицательно влиять на ранжирование в поисковых системах.

  2. Понятность и доступность информации: Текстовый список обычно легче воспринимается и доступен для всех пользователей, в том числе для тех, у кого медленное интернет-соединение или ограниченная пропускная способность.

  3. Оптимизация для поисковых систем: Текстовый контент лучше подходит для оптимизации под ключевые слова и фразы, что может способствовать улучшению позиций сайта в поисковой выдаче.

  4. Соответствие целям сайта: Если целью сайта является предоставление информации, то текстовый контент будет наиболее эффективным способом ее достижения.

Таким образом, текстовый список является более полезным и эффективным вариантом для сайта по ряду критериев, включая скорость загрузки, доступность, оптимизацию и соответствие целям сайта.

Выбор факторов для улучшения ранжирования сайта может быть сложным, но учитывая их важность, эти пункты представляют собой значимый аспект:

Ссылочные факторы ранжирования:

  1. Favicon: Иконка сайта может быть важным элементом для привлечения внимания в результатах поиска, что в свою очередь может повысить CTR (кликабельность) вашего сайта. Это особенно важно для формирования поведенческих факторов, так как большее количество кликов может сигнализировать о более высокой релевантности сайта для пользователей.

Ссылочные факторы ранжирования:

  1. Возраст доменов входящих ссылок: Старые домены могут иметь большую авторитетность, что может повысить ценность ссылки с них.

  2. Количество ссылок с доменов верхнего уровня: Ссылки с доменов верхнего уровня, таких как .com или .org, могут быть более ценными для ранжирования.

  3. Количество ссылок с различных IP адресов: Разнообразие источников ссылок может указывать на широкий охват сайта в интернете.

  4. Количество ссылающихся страниц каждого сайта: Этот показатель может указывать на обширность и релевантность сайта в определенной области.

  5. Особые доменные зоны: Хотя это может быть спорным, но некоторые поисковые системы могут учитывать доменные зоны, такие как .gov или .edu, как фактор релевантности и авторитетности.

  6. тИЦ и PageRank ссылающихся страниц: Эти показатели могут быть использованы поисковыми системами для оценки значимости ссылок.

  7. Ссылки от конкурентов по ключевым запросам: Ссылки от конкурентов могут сигнализировать о релевантности и авторитетности вашего сайта в отношении определенных ключевых запросов.

  8. Ссылки с "плохих" сайтов: Ссылки с "плохих" сайтов могут не только не приносить пользы, но и негативно влиять на ранжирование вашего сайта, поэтому важно следить за качеством входящих ссылок.

  9. Социальная оценка ссылающихся страниц: Лайки, репосты и твиты могут увеличить ценность ссылок в глазах поисковых систем.

  10. Внутренний вес страниц сайтов-доноров: Это может влиять на значимость ссылок, получаемых от этих сайтов.

  11. Ссылочное разнообразие: Разнообразие источников и типов ссылок может указывать на естественность и органичность ссылочного профиля сайта.

  12. NOFOLLOW ссылки: Хотя они не передают вес в поисковых системах, они могут использоваться для оценки честности ссылочного профиля.

  13. Контекстные ссылки: Они обычно считаются более ценными, так как встраиваются в контент страницы.

  14. Позиция ссылки в контенте: Ссылки, размещенные ближе к началу контента, могут считаться более значимыми.

  15. Текст вокруг ссылки: Он также может влиять на восприятие ссылки поисковыми системами.

  16. Частота цитирования сайта "позитивными" ссылками: Это может повысить релевантность и авторитетность вашего сайта.

  17. Платные ссылки: Они могут иметь меньшую ценность, особенно если помечены как рекламные.

  18. Анкор входящей ссылки: Он играет ключевую роль в передаче контекста ссылки.

  19. Ссылки с доменов региональных сайтов: Они могут считаться более релевантными для локальных запросов.

  20. Атрибут title ссылки: Он также может влиять на релевантность ссылки для поисковых систем.

Ссылочные факторы ранжирования:

  1. 301 редирект: Согласно Google, 301 редирект не влияет на ценность ссылки, что делает его полезным инструментом для перенаправления пользователей и сохранения авторитета страницы.

  2. Ссылки с домена верхнего уровня: Ссылки с домена верхнего уровня могут иметь большую ценность, особенно по сравнению с поддоменами или пользовательскими ссылками, что делает важным учитывать их при формировании ссылочного профиля.

  3. Каталоги сайтов: Сайты, перечисленные в каталогах, могут иметь большую доверенность поисковых систем, что делает их ценными источниками ссылок.

  4. Микроразметка Schema.org: Эта разметка может помочь поисковым системам лучше понимать содержание страницы и учитывать ее в результатах поиска.

  5. Сквозные ссылки: Google рассматривает сквозные ссылки как одну, что учитывает их как единый сигнал.

Поведенческие факторы ранжирования:

  1. CTR страницы в поиске: Кликабельность страницы в результатах поиска может сигнализировать о ее соответствии запросу, что может повлиять на ее ранжирование.

  2. CTR быстрых ссылок: Также, CTR быстрых ссылок в сниппете поиска может быть важным поведенческим фактором.

  3. Общая кликабельность страниц сайта: Высокая кликабельность по всем ключевым запросам может положительно сказаться на ранжировании.

  4. Показатель отказов: Высокий процент отказов может указывать на низкое качество или несоответствие содержания ожиданиям пользователей.

Показатель отказа - метрика эффективности системы, измеряющая частоту отказов или неудачных событий.

  1. Возврат к поиску: Если пользователи возвращаются к поиску после посещения сайта, это может сигнализировать о недостаточной релевантности или качестве контента.

  2. Прямые заходы: Прямые заходы могут свидетельствовать о хорошем восприятии сайта пользователем.

  3. Повторные заходы: Повторные посещения могут указывать на удовлетворенность пользователей контентом сайта.

  4. Закладки браузера: Это также может быть сигналом положительного отношения пользователей к сайту.

  5. Данные Toolbar: Использование данных Toolbar может влиять на ранжирование сайта в поисковой выдаче.

Социальные факторы ранжирования:

  1. Количество твитов: Популярность страницы в социальных сетях может быть сигналом для поисковых систем.

  2. Авторитет авторов твитов: Авторитетные авторы могут повысить ценность твитов.

  3. Количество Like страницы: Это также может быть показателем популярности и релевантности контента.

  4. Репосты страницы: Репосты могут быть сильным сигналом положительного отношения пользователей к контенту.

  5. Авторитет ссылающихся аккаунтов: Аккаунты с большим авторитетом могут усиливать сигнал.

  6. Проверенные профили авторов: Это также может добавлять доверия к социальным сигналам.

  7. Релевантность ссылающегося профиля: Релевантные профили могут повысить качество социального сигнала.

  8. Профили сайта в социальных сетях: Наличие профилей в социальных сетях может быть положительным сигналом, особенно при их популярности.

  9. Подозрительные профили сайта: Это может негативно влиять на рейтинг сайта. 107. RSS подписчики: Количество подписчиков на RSS-канал также может быть учтено в ранжировании.

Брендовые факторы ранжирования:

  1. Брендовые ссылки: Ссылки с названием домена вашего сайта могут повысить доверие к бренду и увеличить его авторитет.

  2. Упоминание бренда без ссылки: Упоминание бренда без ссылки также может укрепить доверие к нему.

  3. Адрес офиса на картах: Фактический адрес офиса организации на картах Google или Яндекса может положительно сказаться на доверии к сайту бренда.

  4. Географическая близость: Близость офиса или интернет-магазина к пользователю поисковой системы может учитываться при ранжировании.

  5. Несколько результатов поиска: На прямой запрос бренда иногда можно увидеть несколько результатов с одного сайта.

  6. Профили в Linkedin: Официальные страницы компании и профили сотрудников в Linkedin могут быть рассмотрены поисковиками как показатель доверия к бренду.

Факторы контентного спама:

Контентный спам - Наполнение контента нежелательным, нерелевантным или повторяющимся материалом для манипуляции рейтингом поисковых систем.

  1. Ссылки на низкорепутационные сайты: Ссылки на "плохие" сайты могут повредить репутации вашего сайта.

  2. Подмена контента: Подмена контента на сайте для поисковых роботов может привести к негативным последствиям.

  3. Скрытые редиректы: Использование скрытых редиректов может привести к штрафам или даже исключению из индекса.

  4. Текст цвета фона: Попытка скрыть текст цветом фона может быть расценена как обман поисковых систем.

  5. Скрытый контент: Поисковые системы не ценят скрытый контент, который не доступен пользователям.

  6. Навязчивая реклама: Использование многочисленной или раздражающей рекламы может негативно повлиять на качество сайта.

  7. Чрезмерная оптимизация: Переусердствовать с оптимизацией сайта также может привести к негативным последствиям.

  8. Чрезмерная оптимизация страниц: Оптимизация каждой страницы сайта до крайности также может привести к негативным последствиям.

  9. Размещение рекламы: Размещение рекламы выше контента на странице может быть наказано алгоритмами поисковых систем.

  10. Однообразные сайты: Однообразные сайты или партнерские сети могут быть недооценены поисковыми системами.

  11. Несколько сайтов одного владельца: Несколько сайтов одного владельца могут быть расценены как аффилированные и потерять в рейтинге.

  12. Генерация контента: Использование автоматической генерации контента может привести к негативным последствиям.

Факторы ссылочного спама:

Ссылочный спам - Недобросовестное размещение ссылок для манипуляции рейтингом сайта.

  1. Резкий приток ссылок: Внезапный рост количества внешних ссылок может быть признаком манипуляции.

  2. Ссылки с одного IP: Множество ссылок с одного IP может быть расценено как искусственное увеличение ссылочного профиля.

  3. Низкокачественные ссылки: Большое количество низкокачественных ссылок может вызвать подозрения у поисковых систем.

  4. Несоответствие тематики ссылок: Несоответствие тематики входящих ссылок может уменьшить их ценность.

  5. Продажа ссылок: Продажа ссылок с сайта может негативно сказаться на его видимости в поиске.

CSS дисплей: свойства:

  1. Block: Элементы выстраиваются вертикально, каждый элемент занимает всю доступную ширину.

  2. Inline: Элементы выстраиваются горизонтально, так, чтобы они влезали в одну строку.

  3. Inline-block: Как inline, но можно задавать ширину и высоту элементов.

  4. Flex: Гибкая система расположения, позволяющая управлять порядком, выравниванием и размерами элементов в строке или колонке.

  5. Grid: Двумерная система расположения, позволяющая задавать распределение элементов как по горизонтали, так и по вертикали, создавая сложные макеты.

  6. Table: Элементы располагаются как в таблице, с возможностью использования свойств таблиц (например, ячейки, строки).

  7. None: Элемент скрыт, не отображается на странице.

Justify-content свойства:

  1. flex-start: Выравнивание контента в начале контейнера.

  2. flex-end: Выравнивание контента в конце контейнера.

  3. center: Выравнивание контента по центру контейнера.

  4. space-between: Равномерное распределение контента по ширине контейнера, с отсутствием промежутков на краях.

  5. space-around: Равномерное распределение контента по ширине контейнера с одинаковыми промежутками между элементами.

  6. space-evenly: Равномерное распределение контента по ширине контейнера с одинаковыми промежутками между элементами и по краям.

Position свойства:

  1. static: Элемент позиционируется стандартным способом в потоке документа.

  2. relative: Элемент позиционируется относительно своего исходного местоположения.

  3. absolute: Элемент позиционируется относительно ближайшего позиционированного (не static) родителя или относительно контейнера, если такого родителя нет.

  4. fixed: Элемент позиционируется относительно окна браузера и не перемещается при прокрутке страницы.

  5. sticky: Элемент позиционируется относительно контейнера, пока он видим в окне просмотра, а затем при прокрутке страницы становится фиксированным.

Border свойства:

  1. border-width: Толщина границы.

  2. border-style: Стиль границы (например, solid, dashed, dotted).

  3. border-color: Цвет границы.

  4. border-radius: Радиус скругления углов границы.

  5. border: Сокращенное свойство, объединяющее все вышеперечисленные значения границы в одно.

Last updated

Was this helpful?