Что такое ранжирование сайта
Ранжирование в деталях
Самым важным процессом поисковых систем для продвижения сайта является ранжирование — процесс выстраивания элементов множества web-страниц в последовательность, определяемую убыванием рангов релевантности этих ресурсов. Для определения ранга релевантности разрабатываются алгоритмы, которые определяют, что должно влиять на позицию, при каких запросах и условиях.
С каждым годом алгоритмы ранжирования совершенствуются: добавляются новые факторы, усложняются механизмы обработки информации – и все для того, чтобы идти в ногу со временем и отвечать на запрос пользователя всегда актуальной и действительно релевантной выдачей. Как спрос определяет предложение, так и алгоритмы ранжирования стимулируют развитие сайта в направлении, востребованном посетителем.
Отсутствие механизма ранжирования привело бы к хаосу в выдаче, когда нужная информация находилась бы далеко за первой десяткой, а наличие собственного сайта не имело бы смысла, кроме как лишний штрих в визитке. Тоже касается и усложнения алгоритмов определения ранга релевантности: если бы определение происходило по индексу цитируемости и ключевым вхождениям, то мы до сих пор бы смотрели на одностраничные сайты без дизайна, не задумываясь о юзабилити.
На определение ранга релевантности влияют различные факторы ранжирования, которых очень много на сегодняшний день и которые можно объединить между собой в группы. Поисковые системы оперируют одними понятиями группировки, оптимизаторы другими. При этом влияние фактора остается неизменным в алгоритме ранжирования. Некоторые факторы могут быть равноценными, что не позволяет линейно сравнивать между собой конкурентов. Однако основные направления задать и определить можно.
В данной статье речь пойдет преимущественно о текстовой и ссылочной составляющей.
Поисковая система Яндекс является наиболее интересным исследуемым объектом в данном плане не только потому, что в ней чаще, чем в других происходят сильные изменения в алгоритме, но и потому, что данная система является первой в Рунете по работе с коммерческими или продающими запросами.
Факторы ранжирования – это те или иные признаки запроса и страницы сайта, которые важны для ранжирования и которые дают оценку странице по заданному запросу.
Можно выделить несколько групп. Первая – статические факторы, которые связаны с самой страницей, например, количество ссылок на эту страницу в интернете. Вторая группа – динамические факторы, связанные одновременно с запросом и страницей – например, присутствие на странице слов запроса, их количество и расположение. Третья группа — запросные факторы – признаки поискового запроса, например, геозависимость.
Если поисковые системы классификацию основывают на принадлежности их к запросу или странице, то seo-специалисты в основу деления ставят направления влияния факторов. Таким образом, специалист по продвижению разделяют все факторы на следующие группы:
— Факторы, оценивающие техническую составляющую сайта, которая в первую очередь влияет на возможность и качество индексации сайта;
— Факторы, оценивающие текстовую составляющую страницы и сайта, которая показывает релевантность содержимого запросу;
— Факторы, оценивающие ссылочную составляющую, как внешнюю, так и внутреннюю, как анкорную, так и трастовую, как страницы, так и всего сайта;
— Факторы, оценивающие поведенческую составляющую, нравится ли сайт посетителям, удобен ли он, отвечает требованиям пользователей;
— Факторы дополнительного назначения, такие как определение соответствия региону пользователя, задающего запрос, и сайта, определение наличия аффилиатов и другие.
Каждое направление работы с сайтом важно и нужно подходить комплексно к работе с сайтом во всех направлениях, чтобы охватить все факторы влияния на ранжирование.
В механизме ранжирования самой важной является оценка документа по релевантности содержания запросу, введенного пользователем. Для ранжирования используется текст запроса, текст документа и некоторые элементы html-разметки документа. Это основные элементы, которые использует поисковая система для составления индексных баз и для определения релевантности документа. Поэтому первое, с чем необходимо работать – это текстовая составляющая web-страницы.
Для понимания механизма оценки релевантности, важности текста и указанных ограничений требуется знать примерные модели поиска, которые представляют собой формулы и подходы, позволяющие программе поисковых систем принимать решение: какой документ считать надежным и как его ранжировать. После принятия модели коэффициенты в формулах часто приобретают физический смысл, позволяя находить свое оптимальное значение для повышения качества поиска.
Представление всего содержимого документа может быть различным – теоретико-множественные модели (булевская, нечетких множеств, расширенная булевская), алгебраические (векторная, обобщенная векторная, латентно-семантическая, нейросетевая) и вероятностные.
Примером первой модели является полнотекстовый поиск, когда документ считается найденным, если найдены все слова запроса. Однако булевское семейство моделей крайне жестко и непригодно для ранжирования. Поэтому в свое время Джойсом и Нидхэмом было предложено учитывать частотные характеристики слов, что повлекло за собой использование векторной модели.
Ранжирование в алгебраической модели основано на естественном статистическом наблюдении, что чем больше локальная частота термина в документе (TF) и больше «редкость» (т.е. обратная встречаемость в документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину. Обозначение TF*IDF широко используется как синоним векторной модели.
Сущность метрики TF*IDF — отфильтровать значимые слова от менее значимых (предлогов, союзов и т.д.). TF (term frequency — частота слова) — отношение числа вхождения некоторого слова к общему количеству слов документа. Таким образом, оценивается важность слова в пределах отдельного документа:
где ni – количество вхождений слова из запроса в документ,
nk – количество всех слов в документе.
IDF (inverse document frequency — обратная частота документа) — инверсия частоты, с которой некоторое слово встречается в документах коллекции, рассчитывается по-разному:
где D – число документов в коллекции,
DF – количество документов, в которых встречается лемма,
CF – число вхождений леммы в коллекцию,
TotalLemms – общее число вхождений всех лемм в коллекции.
Согласно открытым экспериментам Яндекса из всех приведенных вариантов лучший результат показал ICF.
Также существует большое множество функций нормирования и сглаживания внутри-документной частоты при вычислении контрастности TF*IDF.
Со временем приведенные формулы совершенствуются и претерпевают изменения.
В 2006-2007 годах использовалась формула подобная (2), когда были попытки добиться высокой релевантности за счет «тошноты» — переспамливания текста ключевыми словами, и это следовало наказывать.
Когда пришла необходимость бороться с «портянками» — большие тексты с ключевыми словами, стала использоваться формула (3). Затем формула еще больше усложнилась, в новом алгоритме поисковые системы используют различные тезаурусы, расширяющие запрос, определяют переспамленность текста не только большим количеством ключей, но и его шлейфом и неудобством оформления текста тегами, неграмотное написание или сочетание слов.
Релевантность в вероятностных моделях основана на оценке вероятности, окажется ли рассматриваемый документ интересным пользователю. При этом подразумевается наличие уже существующего первоначального набора релевантных документов, выбранных пользователем или полученных автоматически при каком-либо упрощенном предположении. Вероятность оказаться релевантным для каждого следующего документа рассчитывается на основании соотношения встречаемости терминов в релевантном наборе и в остальной, «нерелевантной» части коллекции.
В каждой из простейших моделей присутствует предположение о взаимонезависимости слов и условие фильтрации: документы, не содержащие слова запроса, никогда не бывают найденными. На сегодняшний день модели, используемые в ранжировании и определении релевантности, не считают слова запроса взаимонезависимыми, а, кроме того, позволяют находить документы, не содержащие ни одного слова из запроса.
Частично данную задачу решает механизм предпроцессинга запроса, который позволяет устанавливать эмпирически подобранные контекстные ограничения: на каком расстоянии искать слова из запроса, все ли слова должны присутствовать в документе, какими словами можно расширить поиск. Также происходит фактическое объединение по умолчанию контента документа и его анкор-файла в одну поисковую зону.
Механизм фильтрации по кворуму позволяет определять релевантные пассажи в документе. Релевантными считаются все полные пассажи и те неполные, сумма весов слов, которых превосходит необходимый кворум.
В 2004 году использовалась следующая формула кворума:
где QuorumWeight – значение кворума;
Softness – мягкость, соответствует величина от 0 до 1, в документированных записях Яндекса указывается коэффициент 0,06;
QL — длина запроса в словах.
Таким образом, основываясь на известных фактах, кворум для фразы будет иметь следующий вид, с помощью данной формулы определяются какое сочетание слов обязательно, а каким словом можно пренебречь:
где QL* — количество слов из запроса в неполном пассаже;
deg – значение степени 0.38, выведенное экспериментально
Ранжирование документа происходит на основе рассчитанного коэффициента контекстуальной схожести запросу. По факту объединяются все сведения о весе различных пассажей документа, и делается вывод о показателе релевантности документа. В одной из статей Яндекса приводится пример аддитивной модели, которая представляет собой сумму весов каждого слова, пар слов, всех слов, запроса целиком, многих слов в одном предложении и бонуса документам, похожим на помеченные экспертом, т.е. хорошие. Это показывает, что все на странице будет оценено, и доказывает, что к написанию текста нужно подходить очень ответственно.
Далее рассмотрим ссылочную составляющую.
Согласно теории поиска пользователи информационно-поисковых систем определяют ценность документа путем информационных ключей – анкора ссылки. А наличие самих ссылок увеличивает попадание посетителя на страницу. Поэтому поисковые системы используют для выделения одного документа среди кластера также принцип цитируемости.
Индекс цитирования — показатель, указывающий на значимость данной страницы и вычисляющийся на основе ссылающихся страниц на данную. Этот принцип заимствован из научных сообществ, который использовался для оценки ученых и научных организаций.
В простейшей разновидности индекса цитирования учитывается только количество ссылок на ресурс. Но он имеет ряд ограничений. Этот фактор не отражает структуру ссылок в каждой тематике, а также слабозначимые ссылки и ссылки с большой значимостью могут иметь одинаковый индекс цитируемости. Поэтому был введен термин фактор популярности (англ. Popularity Factor) или взвешенный индекс цитирования или вес ссылки, в разных поисковиках этот фактор называется по разному: PageRank в Google, вИЦ в Яндексе. Сами ссылки участвуют в статическом передачи веса, показывая популярность ресурса, и анкорном – по заданным ключам. Также существует тематический индекс цитирования (тИЦ), учитывающий также тематику ссылающихся на ресурс сайтов.
Первоначально, до того как для продвижения сайта стали работать с ссылочной составляющей, индекс цитирования реально отражал популярность соответствующего ресурса в интернете. Как-то в одной из статей технический директор Яндекса Илья Сегалович упомянул, что введение ссылочного поиска и статической ссылочной популярности помогло поисковым системам справиться с примитивным текстовым спамом, который полностью разрушал традиционные статистические алгоритмы информационного поиска, полученные в свое время для контролируемых коллекций.
В 1998 году появилась статья с описанием принципов алгоритма PageRank, используемого в Google. Взвешенный индекс цитирования, как и другие ссылочные факторы ранжирования, рассчитывается из ссылочного графа.
PR — PageRank рассматриваемой страницы,
d — коэффициент затухания (означает вероятность того, что пользователь, зашедший на страницу, перейдет по одной из ссылок, содержащейся на этой странице, а не прекратит путешествие по сети),
PRi — PageRank i-й страницы, ссылающейся на страницу,
Ci — общее число ссылок на i-й странице.
Основная идея заключается в том, что страница передает свой вес распределяя его на все исходящие ссылки, поэтому чем больше ссылок на странице доноре, тем меньший вес каждой достанется. Другая не менее важная идея заключается в понимании принципа цитируемости – это оценка вероятности перехода посетителя по одной из ссылки, а следовательно, вероятность популярности самой страницы сайта, на который ставятся ссылки. Соответственно, чем больше качественных ссылок, тем вероятность популярности ресурса выше.
На сегодняшний день ссылки часто наносят вред качеству поиска, поэтому поисковые системы стали вести борьбу с ссылочной накруткой – размещение Seo-ссылок на сторонних сайтах на коммерческой основе и предназначенные для манипуляции алгоритмами ранжирования. Они принимают все меры, чтобы сайты, продающие ссылки, потеряли способность влиять таким способом на ранжирование, а покупка ссылок с сайтов не могла бы привести к повышению ранга сайта-покупателя.
Алгоритмы, применяемые в современных поисковых системах для оценки ссылочной составляющей, претерпели большие изменения, но качество и количество ссылок сохранили свое прямое влияние при выделении страницы среди кластера копий. Чем авторитетней и тематически схожа с вашим ресурсом страница-донор, тем больший вес будет передан сайту, тем выше будет его позиция в поиске.
Автор статьи: Неелова Н.В. (к.т.н., руководитель отдела ПП Ingate).
130 факторов ранжирования: «ПОЛНЫЙ СПИСОК!»
Полный Список факторов ранжирования
Факторы поискового ранжирования меняются и пересматриваются, у каждой поисковой системы они свои и свое к ним отношение на текущий момент. Все факторы работают в комплексе, и рассматривать каждый фактор по отдельности — бред.
Мы можем только тестировать, проверять на своей шкуре или гадать. Не ведитесь на различные «Топ 200 факторов ранжирования Google», «Все факторы ранжирования Яндекс», и т.д. Я понимаю, что очень хочется получить готовое решение, но за этим к продавцам «волшебных пилюль». Здесь этого не будет.
Принципы поискового ранжирования
Каждый последующий заголовок носит название одного из принципов, по которым может определяться качество сайта, но я буду писать слово «факторы». И вам привычнее, и так страница будет более релевантной вашим запросам про «факторы ранжирования» ^^. Принципы же никто не ищет, всем плевать на то, как все устроено, несмотря даже на то, что Яндекс говорит не о факторах, а принципах — http://company.yandex.ru/rules/ranking/
Доменные факторы ранжирования
Домен — это имя сайта и, как имя человека, домен может многое рассказать о сайте. Совокупность доменных факторов может как улучшить отношение целевой аудитории к сайту, так и ухудшить его. Поэтому, прежде чем купить домен, стоит разобраться в том как домен виляет на SEO и из чего может формироваться отношение к домену:
1. Возраст домена. Чем старше домен, тем лучше.
3. История домена. Если у сайта часто меняются владельцы или вовсе сайт надолго освобождается, то это может быть поводом для сброса истории сайта.
6. Доменная зона. Каждая доменная зона позиционирует сайт в своем регионе и позитивно влияет на рейтинг внутри страны, но негативно влияет на глобальный рейтинг сайта.
7. Доменные санкции. Вы купили 10 доменов и парочка из них попала под ручные санкции. Не удивляйтесь, когда остальные сайты «вылетят» из поиска.
Доменные принципы стоят на формировании доверия к домену, к старым сайтам с открытой информацией больше доверия, чем к молодым и закрытым, а если название домена еще и совпадает с ключевым запросом, характеризующим тематику сайта, то это подчеркивает характерную принадлежность сайта его основной тематике.
Контентные факторы ранжирования
8. Заголовки — важнейшая часть страницы после самого контента. Заголовки бывают нескольких видов:
9. Описание страницы meta description. Переходите по ссылке и читайте подробную статью про тег мета дескрипшн.
10. Частота цитирования ключевого слова. Если вы все правильно сделали, то необходимое ключевое слово будет цитироваться на странице чаще других и это будет хорошо.
11. Много контента на странице — хорошо, а мало — плохо. Старайтесь писать больше 2000 слов.
13. Синонимы ключевых слов в тексте и заголовках — признак мастерства. Все поисковики оценят, так как синонимы ключевых слов помогают поисковым системам лучше понять, о чем идет речь на странице, а также дают вхождения по большему числу ключевых слов.
14. Разные ключевые слова на одной странице могут как затруднить определение смысла страницы, так и упростить. То есть ключевые слова могут вступить в конкуренцию, а могут начать дополнять друг друга. Осторожнее используйте различные ключевые слова на одной странице. Желательно, чтобы ключи были максимально близки по смыслу.
15. Списки и таблицы. Маркированные, нумерованные списки, таблицы и другие формы выделения контента упрощают восприятие контента как для человека, так и для поисковых систем.
16. Удобство страницы используется поисковыми системами как фактор качества страницы и строится на основании структуры разметки данных на странице. Делайте информацию на странице более удобной, используйте теги, мета-данные, микроразметку.
17. Уникальность контента отличает хороший сайт от плохого. Пишите разные заголовки title, h1, уникальные атрибуты ссылок title и alt картинок, тексты статей, используйте уникальные изображения. Узнай больше про неуникальный контент.
18. Уникальные изображения. Читай, как оптимизировать картинки на сайте.
19. Канонические ссылки rel=canonical. Узнай все про канонические ссылки.
20. Частое обновление сайта тонко намекает поисковым роботам на то, что ваш сайт можно было бы индексировать почаще. А еще Google подсвечивает свежатинку в результатах поиска, показывая последние обновления для некоторых страниц.
21. Обновление старых страниц повышает актуальность контента на сайте. И чем более серьезные изменения происходят на старых страницах, тем лучше.
22. Частота обновления старых страниц тоже повышает свежесть информации на сайте. Поисковые системы вообще помешаны на свежести…
23. Возраст страницы. Несмотря на то, что поисковые системы очень любят свежий контент, старые страницы могут ранжироваться лучше новых.
24. Формулировка ключевого запроса. Различные формулировки помогают поисковым системам понять, о чем страница, и выделить ключевые запросы, однако, если цитировать на странице одну ключевую фразу «купить автомобиль недорого», то в поиске по этому запросу сайт будет значительно выше, чем по запросу «недорогой автомобиль купить».
25. Исходящие ссылки на авторитетные сайты могут повысить релевантность страницы за счет того, что вы ссылаетесь на проверенные данные с высокой степенью релевантности, тем самым, делая ваш контент более достоверным и полезным в глазах поисковой системы.
27. Количество входящих внутренних ссылок повышает цитируемость страницы, что может повлиять на релевантность страницы по ключевым запросам.
28. Качество входящих внутренних ссылок зависит от важности страниц-доноров. Так например, ссылка с главной страницы сайта передаст больше веса, чем ссылка со страницы того же уровня.
29. «Битые» ссылки говорят о том, что над сайтом плохо работают. Большое количество битых ссылок на сайте может стать сигналом для снижения рейтинга сайта.
30. Мультимедиа данные делают контент более разнообразным и привлекательным, что дает множество положительных факторов, например: разнообразие представления может повысить релевантность контента, сделать контент полезнее для более широкой аудитории и улучшить поведенческие факторы. Больше картинок, фоточек и видео!
32. Ошибки в тексте могут снизить рейтинг страницы, за исключением случаев, когда ошибки подразумеваются логикой текста, но это нужно еще объяснить поисковым системам.
33. Категория страницы. Страницы, которые размещаются в связанных по смыслу категориях, более релевантны ключевым запросам своей категории, чем страницы без категории или страницы, не связанные с категорией. То есть, категория, в которой находится страница, уточняет содержимое страницы.
34. Удаленность URL страницы от главной страницы снижает авторитет страницы, а близость URL к главной странице — повышает.
35. Длина URL страницы. Слишком длинные URL негативно оцениваются поисковыми системами.
36. Ключевые слова в URL страницы повышают релевантность аналогично принципам, которые работают с заголовками.
37. Высокий PageRank и другие индексы цитирования страниц могут оказать влияние на ранжирование сайта в поисковых системах.
38. Валидность HTML сайта по оценке W3C http://validator.w3.org, может служить сигналом качества сайта, однако имеет ли этот сигнал какое-либо значение — неизвестно.
39. Скорость загрузки страницы сайта на основании кода и размера файлов. Старайтесь сокращать размер кода и сжимать изображения, чтобы каждая страница сайта загружалась быстрее. Если я добавлю на эту страницу инфографику, длиной 30.000 пикселей, вам это понравится и вы подарите мне хорошие поведенческие факторы, но понравится ли это поисковым системам?
Мастерство поисковой оптимизации заключается в умелом сочетании комплекса всех факторов таким образом, чтобы получить максимальный результат.
Подумайте, что будет полезнее для сайта?
Пишите в комментариях номер ответа и почему вы выбрали именно этот ответ.
Факторы ранжирования всего сайта
40. Новая, ценная, уникальная информация. Поисковые системы все время ищут что-то новое и уникальное для того, чтобы поисковая выдача была более сбалансированной, а не состояла из сайтов-клонов или бесконечных репостов. Сайт должен быть ИСТОЧНИКОМ полезной информации.
41. Структура сайта позволяет организовать контент, упростить индексацию сайта и сделать содержимое сайта более понятным для посетителей.
42. Количество страниц в поиске — один из показателей качества сайтов. Больше ЦЕЛЕВЫХ страниц — лучше.
43. Карта сайта позволяет поисковым системам быстрее находить страницы сайта. Карта сайта — один из самых важных инструментов вебмастера.
44. Аптайм сайта говорит о том, как часто в работе сайта случаются сбои и сайт бывает недоступен. Если сайт часто «падает» на протяжении длительного периода времени, это говорит о том, что сайтом плохо занимаются. В конце концов, кому нужны в поиске недоступные сайты?
45. Местонахождение сервера, на котором расположен сайт, может повлиять на скорость загрузки сайта и на общее доверие к сайту, особенно это важно при ранжировании с географической привязкой.
46. Сертификат SSL на сайтах Ecommerce. Поисковые системы индексируют сертификаты и могут воспринимать HTTPS как фактор доверия.
47. Условия и политика конфиденциальности на сайте вызывают больше доверия у поисковых систем, чем их отсутствие.
48. «Хлебные крошки» упрощают навигацию посетителей по сайту и делают структуру сайта более прозрачной. Поисковики ставят за это Like.
49. Видео с YouTube имеет высокую степень доверия у поисковых систем и наличие встроенного видео может быть позитивно воспринято поисковиками и особенно Google, так как YouTube — это и есть Google.
50. Юзабилити сайта включает в себя множество факторов, которые описывают удобство пользования сайтом для посетителей. Неудобные сайты имеют больше отказов, что в комплексе факторов негативно влияет на ранжирование.
51. Отзывы о сайте в различных системах и специализированных сайтах могут повлиять на видимость сайта в поиске. Есть прецеденты, когда отзывы посетителей привлекали внимание поисковых систем, в результате чего сайты получали ручные санкции.
52. Использование систем сбора статистики Яндекс.Метрика, Google Analytics, а также инструментов вроде Яндекс.Вебмасер или Инструменты для веб-мастеров Google, может оказать влияние на ранжирование сайтов за счет получения поисковыми системами большей информации о сайте.
53. Favicon — иконка сайта. Фавикон может отображаться в результатах поиска некоторых поисковых систем, например в Яндексе, и тем самым выделять сайт среди прочих. Выразительная иконка сайта может повысить CTR вашего сайта при переходе из поиска, что является одним из показателей поведенческих факторов.
Ссылочные факторы ранжирования
54. Возраст доменов входящих ссылок, аналогично доменному фактору, играет роль в определении ценности ссылки.
55. Количество ссылок с доменов верхнего уровня — один из важнейших факторов, который учитывается при расчете релевантности сайта.
56. Количество ссылок с различных IP адресов показывает количество и охват ссылающихся сайтов.
57. Количество ссылающихся страниц каждого сайта — плюс один фактор формирования ценности входящих ссылок.
58. «Особые доменные зоны имеют больше доверия и это может быть одним из факторов ранжирования». Многие поисковые системы это отрицают, но некоторые в это верят… Как было написано в начале статьи, факторы меняются и данный фактор имеет место быть, но, возможно, не сегодня.
59. тИЦ и PageRank ссылающихся страниц — очень важный фактор ранжирования.
60. Ссылки от конкурентов по ключевым запросам могут быть важным сигналом для поисковых систем.
61. Ссылки с «плохих» сайтов вряд ли принесут что-то хорошее, цитируя ваш сайт. И что же тогда делать, если «кто-то» поставит на ваш сайт пару сотен ссылок с «плохих» сайтов? Яндекс и Google говорят, что не умеют вычислять подобные «медвежьи услуги» и на ваш сайт это никак не повлияет. Выдыхаем.
62. Социальная оценка ссылающихся страниц, выражающаяся в лайках, репостах, твитах, повышает ценность ссылки.
63. Внутренний вес страниц сайтов доноров влияет на ценность ссылки.
64. Ссылочное разнообразие подчеркивает естественность ссылочного профиля. Это ссылки из максимально разных источников, а также разнообразные виды ссылок: текстовые, безанкорные, короткие, ссылки через изображения и т.д.
65. NOFOLLOW ссылки могут не учитываться поисковыми системами в привычном понимании, но могут учитываться, например, для определения честности ссылочного профиля.
66. Контекстные ссылки — одни из самых «вкусных» ссылок. Ссылки, размещенные внутри контента, например, в тексте страницы, значительно полезнее, чем одинокая ссылка в сайдбаре или футере. Контекстные ссылки позволяют создать гибкую внутреннюю перелиноквку страниц сайта.
68. Текст вокруг ссылки. Поисковые системы способны определять контекст, в котором дается ссылка, и использовать его как для увеличения, так и для снижения ценности. По этому принципу, Google способен определять «позитивные» и «негативные» ссылки.
69. Частота цитирования сайта «позитивными» ссылками может увеличить ценность страниц сайта в выдаче, а «негативными» — понизить.
70. Платные ссылки, помеченные как partners или sponsors, могут иметь меньшую ценность, чем другие ссылки.
71. Анкор входящей ссылки формирует значительную часть ценности ссылки.
72. Ссылки с доменов региональных сайтов могут учитываться как более полезные, если домены находятся в одной зоне.
73. Атрибут title ссылки является сигналом релевантности ссылки и, как заголовки, title должен удовлетворять тем же правилам: укладываемся в 55 знаков, первое слово в title — ключевое. И самое главное — уникальность тайтла. Не повторяйте раз за разом один и тот же title.
74. Тематическая близость ссылающегося сайта более ценна, нежели ссылка с сайта, никоим образом не связанного с тематикой вашего сайта.
75. Ссылки с больших и авторитетных сайтов имеют больше ценности, чем с мелких и непопулярных сайтов. Спасибо, КЭП!
76. Ссылки со страниц-хабов несут больше тематической ценности, чем другие страницы.
77. Ссылки с Википедии, как на источник, добавляют доверия за счет авторитетности Wikipedia, несмотря на то, что ссылки имеют атрибут nofollow.
78. Возраст обратных ссылок делает более старые ссылки ценнее новых.
79. Чрезмерный обмен ссылками может быть воспринят как недоброкачественная схема. Оправдываться потом вам.
80. Честность ссылочного профиля может снизить «шторм» позиций сайта при обновлениях.
81. 301 редирект не влияет на ценность ссылки… по версии Google.
82. Ссылки с домена верхнего уровня ценятся выше, чем ссылки с поддомена, а в случае с пользовательскими ссылками, их ценность может быть еще ниже, чем с родительского сайта, например, ссылка с livejournal.com может быть полезнее ссылки с tema.livejournal.com.
83. Каталоги наподобие DMOZ, справочник Yahoo! или Яндекс.Каталог ведут списки сайтов. Поисковые системы склонны доверять сайтам из подобных каталогов больше, чем все остальным.
84. Микроразметка Schema.org указывает поисковым системам на ключевые моменты страницы. Страницы, поддерживающие микроформаты, могут оказаться выше других страниц в результатах поиска.
85. Сквозные ссылки. Google считает, что сквозные ссылки на каждой странице сайта считаются как одна ссылка.
Подведем итог: чем выше качество контента на странице, тем больший вес она имеет и может передавать его другим сайтам через ссылки. Чем выше авторитетность сайта, тем более ценными с него будут ссылки. Ссылки, размещенные в тексте лучше, чем ссылки без контекста, а тематическая близость сайта донора и акцептора — вообще счастье.
Поведенческие факторы ранжирования
Принцип оценки поведения посетителей на сайте позволяет протестировать ваш сайт на живых людях ^^ и если им что-то не нравится, поисковые системы ткнут вас этим, и ваш сайт опуститься ниже в поиске. Ваши посетители должны быть без ума от вашего сайта от сниппета в поиске до наклейки на коробке с товаром из вашего интернет-магазина.
86. CTR страницы в поиске по ключевому слову сигнализирует о соответствии содержимого страницы запросу. Чем выше кликабельность страницы, тем выше может быть ее позиция при ранжирования.
87. CTR быстрых ссылок в снипете также может восприниматься как поведенческий фактор.
88. Общая кликабельность страниц сайта живыми посетителями по всем ключевым запросам также может повлиять на рейтинг отдельных страниц при ранжирования.
89. Показатель отказов (Bounce Rate) служит сигналом того, что сайт не соответствует ожиданиям посетителей, в результате чего они уходят с сайта. Высокий процент отказов может быть по разным причинам, например плохая работа сайта, агрессивная реклама или несоответствие содержания страницы цели посещения.
90. Возврат посетителя к поиску говорит о том, что посетитель ушел с сайта потому, что не нашел на нем нужную информацию. Высокий процент отказов с возвратом к поиску может служить поводом к снижению рейтинга страниц сайта.
91. Прямые заходы посетителей на сайт высоко оцениваются поисковыми системами и говорят о качестве содержимого сайта, со всеми вытекающими последствиями.
92. Повторные заходы. Поисковые системы отслеживают, возвращается ли посетитель на сайт после первого посещения. Данный показатель также может играть роль при ранжирования страниц сайта по поисковым запросам.
93. Закладки браузеров поисковых систем. Google Chrome собирает данные пользователей браузера о посещаемых ими страницах. Эти данные могут учитываться при ранжировании.
94. Данные Toolbar используются аналогично данным браузеров и учитываются при ранжировании.
«Google использует данные Google tooldar как сигналы ранжирования»
Денни Гудвин,
Search Engine Watch
95. Время, проведенное на сайте — один из самых известных факторов, который отображает заинтересованность посетителей контентом сайта.
96. Глубина просмотра сайта показывает, как много страниц просмотрел пользователь за одно посещение, и дает сигнал о заинтересованности посетителя содержимым сайта.
97. Комментарии могут восприниматься как сигналы качества от посетителей сайта.
Заинтересованность посетителей вашим сайтом может учитываться при ранжировании сайта. Для того, чтобы поведенческие факторы были хорошими, сайт должен быть интересным. Думайте о посетителях, делайте хорошие сайты.
Социальные факторы ранжирования
Социальный принцип работает при помощи реакции посетителей на ваш сайт. Если сайт чем-то интересен вашим посетителям, то они сами дадут позитивные сигналы, которые подхватят поисковые системы и учтут при ранжировании. Вот, какими бывают социальные сигналы:
98. Количество твитов может служить сигналом популярности страниц сайта.
99. Авторитет авторов твитов может учитываться при оценке твита.
100. Количество Like страницы в социальных сетях также может служить показателем положительного отношения посетителей к странице.
101. Репосты страницы в социальных сетях могут служить более весомым фактором хорошего отношения посетителей за счет схожести с цитируемостью обратных ссылок.
102. Авторитет ссылающихся аккаунтов в социальных сетях, авторы которых реагируют на сайт, может влиять на ценность сигнала, аналогично обратным ссылкам с авторитетных сайтов.
103. Проверенные профили авторов социальных сигналов могут добавлять авторитетности при учете ценности сигнала.
104. Релевантность ссылающегося профиля может учитываться при оценке качества социального сигнала.
105. Профили сайта в социальных сетях могут повлиять на рейтинг сайта, но в зависимости от популярности этих страничек.
106. Подозрительные профили сайта в социальных сетях могут повлиять на рейтинг сайта не самым лучшим образом.
107. RSS подписчики могут быть учтены как позитивный сигнал.
Брендовые факторы ранжирования
Брендовый принцип сводится к тому, чтобы получить большее доверие к бренду. Для этого существует набор брендовых факторов:
108. Брендовые ссылки, или ссылки с названием домена вашего сайта, повышают доверие к бренду.
109. Упоминание бренда без ссылки может быть одним из сигналов, повышающих доверие. А кто говорил, что цитирование может быть только ссылочное?
110. Фактический адрес офиса организации в сервисе карт Яндекс или Google может позитивно повлиять на доверие поисковых систем к сайту бренда.
111. Географическая близость офиса или интернет-магазина к пользователю поисковой системы может быть учтена при ранжировании.
112. Несколько результатов поисковой выдачи. По прямому запросу бренда иногда можно увидеть один и тот же сайт на нескольких позициях результатов поиска.
113. Официальная страница компании в Linkedin, а также страницы сотрудников, могут восприниматься некоторыми поисковиками как показатель доверия.
Степень доверия деятельности сайта может стать сильным основанием для получения высоких позиций в поиске.
Факторы контентного спама
Попытки обмануть посетителей или поисковые системы рано или поздно негативно скажутся на рейтинге сайта. Если вы сомневаетесь в том, что вы умнее всех сотрудников Google или Яндекс — делайте все честно и не пытайтесь «накрутить» своему сайту что-либо. А чтобы случайно не попасть под санкции, вот вам список факторов контентного СПАМа которые могут сильно испортить жизнь:
114. Ссылки на «нехорошие» сайты показывают, кто ваши друзья. Аналогично ссылкам на авторитетные сайты, ссылаясь на «плохие» сайты, вы получаете часть их репутации себе.
115. Подмена содержимого страниц на сайте, например для людей и для роботов, карается в соответствии с тяжестью нарушения. Нельзя подменять контент на сайте.
116. Скрытые редиректы. Переадресация посетителей на другие сайты карается штрафами и даже исключение из индекса. Не балуйтесь!
117. Текст цвета фона незаметен для посетителей, но прекрасно виден поисковикам. Попытка обмануть посетителей может дорого обойтись вашему сайту.
118. Скрытый контент индексируется поисковыми системами, но, как правило, поисковые системы не совершают действий на странице и считают, что весь контент должен быть виден и доступен посетителю сразу, без необходимости на что-то нажать или навести. Не скрывайте контент от посетителей. В лучшем случае, контент не будет учтен, а в худшем — получите штраф.
119. Навязчивая реклама и всплывающие окна отвлекают посетителя от пользования сайтом, что является показателем низкого качества сайта.
120. Чрезмерная оптимизация сайта показывает попытку «накрутки» контактных факторов. Еще одно подтверждение тому, что в погоне за отдельными факторами, вы упускаете влияние комплекса факторов.
121. Чрезмерная оптимизация отдельных страниц сайта может повлиять на их рейтинг. Подобными вещами занимается «Пингвин» Google.
122. Реклама под контентом выведена в отдельный фактор, так как, например, Google имеет специальный алгоритм сравнения размещения рекламы и контента на странице. Если реклама размещается более выгодно, чем контент, то «Page Layout Algorithm» непременно это заметит и покарает вас.
123. Однообразные сайта или партнерские сети представляют меньше пользы, чем уникальные сайты с оригинальной информацией, а потому могут ранжироваться хуже.
124. Несколько сайтов одного владельца могут быть «слиты» по пересекающимся ключевым запросам, если поисковая система решит, что это аффилированные сайты. «Расклеить» сайты может быть очень сложно.
125. Генерация контента. Любая автоматизация имеет свои слабые стороны, которые мощные алгоритмы поисковых систем распознают на раз. Не пытайтесь обмануть мощнейшие в мире системы анализа контента. За машинную генерацию контента можно вылететь из индекса.
Факторы ссылочного спама
Ссылочный СПАМ — любимая игра «SEO-оптимизаторов», благодаря которой биржи ссылок прокачали через себя астрономические деньги. В итоге феерия абсурда достигла такого масштаба, что ценность ссылочной массы потеряла всякий смысл. Да, это не «убило» внешние ссылки, они будут всегда, так как интернет — это и есть ссылки, и не оценивать их невозможно. Просто приходят новые, более совершенные алгоритмы анализа, новые фильтры ссылочного СПАМа и факторы ранжирования:
126. Резкий приток внешних ссылок. Естественность развития всех аспектов сайта — залог успеха. Внезапные скачки показателей — верный признак «накрутки».
127. Ссылки с одного IP могут указывать на неестественность ссылочной массы.
128. Низкокачественные ссылки в больших количествах могут быть восприняты как попытка накрутки ссылочных факторов.
129. Несоответствие тематики входящих ссылок существенно снижает их ценность и увеличивает шансы прихода «Пингвина».
130. Продажа ссылок с сайта может негативно сказаться на видимости сайта в поиске.
В заключение
Данные факторы описывают основные принципы ранжирования сайта. Принципы же собраны на основе опыта, тестов, статистики, логики, здравого смысла и того, как мне кажется было бы правильно. Список будет обновляться.
Важно понимать, что факторы в отрыве друг от друга не имеют никакого отношения к реальности. Разные факторы могут использоваться на разных этапах индексации, где ранжирование — один из этапов. То есть сама формулировка «факторы ранжирования» не совсем корректна. Каждый отдельный фактор может трактоваться десятками разных способов. Вы не сможете достоверно спрогнозировать результат позиций вашего сайта и даже Google заявляет, что не может.
Не существует прямой зависимости позиций от факторов!
Не занимайтесь ерундой, накручивая факторы. Изучайте своих посетителей и давайте им то, что они хотят.
Делайте хорошие сайты для людей.