WordPress и оригинальные тексты Яндекс

Воровство контента может стать настоящей головной болью для владельцев молодого сайта. Проблема в том, что защитить контент от воровства практически невозможно. Зато мы можем предупредить возможные последствия со стороны поисковой системы с помощью сервиса Оригинальные тексты Яндекс.

Обидно, когда украденный контент отображается в поисковой выдаче перед вашим сайтом. В силу возраста и раскрученности ресурса, страницы быстро индексируются и поисковой система считает сайт, который украл ваш материал в качестве первоисточника. Но это не самая большая проблема, с которой вы можете столкнуться.

Парадокс заключается в том, что бывают случаи, когда другие сайты делают copypast и добросовестно в качестве источника указывают активную ссылку на сайт, который украл ваш материал. В такой ситуации у нас нет ни одного шанса доказать свое авторство поисковой системе.

Чтобы защитить сайт от воровства контента можно попытаться заранее оповестить поисковую систему разместив анонс на материл в социальных сетях. Другим способом, который позволит поисковой системе определить первоисточник материала, является использование сервиса Оригинальные тексты Яндекс. Для этого перед публикацией материала необходимо добавить текст в форму Оригинальные тексты Яндекс.

Чтобы облегчить задачу по добавлению контента в сервис Оригинальные тексты Яндекс, в WordPress можно использовать специальный плагин Webmaster Yandex. Чтобы использовать плагин сайт должен быть добавлен в Яндекс.Вебмастер. После активации плагина в админке WordPresss необходимо настроить доступ к API сервиса.

Добавить NoFollow для ссылок в WordPress

В отличии от тега target=_"blank", который открывает ссылку в новом окне, редактор WordPress не имеет встроенной возможности для вставки тега rel="nofollow". Как вариант можно вручную редактировать HTML-код, но это не удобно при частом добавлении ссылок.

Чтобы добавить тег nofollow автоматически для всех внешних ссылок в WordPress, можно использовать специальную функцию. Для этого скопируйте код ниже в содержимое файла functions.php вашей темы.

function add_nofollow_content($content) {
    $content = preg_replace_callback(
    '/<a[^>]*href=["|\']([^"|\']*)["|\'][^>]*>([^<]*)<\/a>/i',
    function($m) {
        if (strpos($m[1], get_bloginfo('url')) === false)
            return '<a href="'.$m[1].'" rel="nofollow" target="_blank">'.$m[2].'</a>';
        else
            return '<a href="'.$m[1].'" target="_blank">'.$m[2].'</a>';
    },
    $content);
    return $content;
}
add_filter('the_content', 'add_nofollow_content');

Если вы хотите управлять индексированием ваших ссылок самостоятельно, можно добавлять тег nofollow в процессе написания поста. C помощью специально плагина, мы сможем легко добавить тег nofollow для любой ссылки в визуальном редакторе WordPress.

Для этого вам необходимо установить плагин Title and Nofollow For Links. Плагин очень простой и не требует дополнительных настроек. Затем в режиме редактирования записи щелкните на кнопке «Вставитьизменить ссылку», чуть ниже пункта Открыть ссылку в новом окне вы увидите новую опцию Добавить атрибут rel="nofollow".

Список Dofollow сайтов

Предлагаю список Dofollow сайтов социальных закладок с высоким уровнем PR. С помощью сервисов социальных закладок можно без труда набрать большую и одновременно качественную ссылочную массу для вашего сайта.

Качественные Dofollow ссылки способствуют улучшению позиций сайта в глазах поисковых систем. Дополнительно, вы привлекаете естественный трафик из социальных сетей и ускоряете время индексации вашего сайта.

Ниже предлагаю список Dofollow сайтов, который включает в себя большинство англоязычных сервисов социальных закладок.

Сайт PR
1 reddit.com 8
2 tumblr.com 8
3 slashdot.org 8
4 stumbleupon.com 8
5 squidoo.com 7
6 designfloat.com 7
7 diigo.com 7
8 folkd.com 6
9 pearltrees.com 6
10 youmob.com 4
11 qqpipi.com 4
12 a2zbookmarks.com 3
13 bookmark2you.com 3
14 yemle.com 3
15 blokube.com 3
16 newsmeback.com 3
17 openfaves.com 2
18 sociopost.com 2
19 indofeed.com 2
20 arrisweb.com 2
21 postolia.com 2
22 tourdion.com 2
23 akonter.com 2
23 bookmarkbay.com 1
25 freesbmblog.info 1
26 pligg.in 1
27 followmenow.info 1
28 activebookmarks.com 1
29 livewebmarks.com 1
30 bookmarkmaps.com 1
31 bookmarkinghost.info 1
32 socialbookmarknow.info 1
33 onlinewebmarks.com 1
34 greateststory.info 1
35 bookmarks2u.com 1
36 bookmarkwiki.com 1
37 a2zbookmarking.com 1
38 socialbookmarkzone.info 1
39 newsciti.com 1
40 bookmarkgroups.com 1
41 socbookmarking.info 1
42 a1bookmarks.com 1
43 votetags.info 1
44 socialbookmarksite.info 1
45 bookmarkfeeds.com 1
46 seo4bookmarks.com 1
47 ewebmarks.com 1
48 openwebmarks.com 1
49 socialbookmarkden.com 1
50 storymint.com 1
51 1look4.com 1
52 tiltzero.com 1
53 tejero.net 1
54 coolpot.com 1
55 4bukmark.com 1
56 blessingg.com 1
57 goldenmidas.net 1

Убрать дату публикации в WordPress

Достаточно часто мне задают вопрос, как в WordPress убрать дату публикации записи. Данное действие не всегда оправдано и в большинстве случаев вызвано влиянием поведенческих факторов на количество переходов с поисковых систем.

В WordPress убрать дату публикации достаточно просто, для этого нам необходимо внести небольшие изменения в тему оформления WordPress. Но давайте сначала разберемся, для чего все это и какое преимущество мы получим от данной манипуляции.

Зачем убирать дату публикации

В поисковой выдаче, рядом с описанием страницы отображается дата публикации материала. Это дает возможность посетителю оценить актуальность информации и самостоятельно принять решение относительно целесообразности дальнейшего перехода.

Несмотря на то, что Google отдает предпочтение более свежим записям, дата публикации в WordPress не имеет существенного влияния на позиции сайта в поисковой выдаче. Но если учитывать поведенческий фактор, дата публикации имеет существенное влияние на психологию принятие решения пользователем.

В процессе анализа поисковой выдачи, человек на основе даты публикации субъективно оценивает актуальность информации. В случае если с момента публикации прошло достаточно долгое время время, посетитель может отказаться от перехода по ссылке, даже не успев оценить полезность размещенной информации.

Если вы заметили, что старые записи со временем стали получать все меньше и меньше переходов из поисковых систем. Возможной причиной может быть дата публикации материала на странице поисковой выдачи.

Если в WordPress убрать дату публикации, можно попытаться таким способом получить большее количество переходов из поисковых систем. Разумеется, это не выведет страницу в топ, но может дать некоторое визуальное преимущество по сравнению с другими сайтами в выдаче.

Дополнительно, если мы убираем дату из поисковой выдачи, это место займет информация с описанием страницы. Это может помочь сделать страницу более полезной в глазах пользователей.

Есть смысл убрать дату публикации для сайтов, материал которых не имеют строгого строка давности. Естественно это не приведет к большому притоку посетителей, но как минимум это исключит психологический фактор и создаст условия для стабильного уровня переходов из поисковых систем.

Как убрать дату публикации в WordPress

Чтобы в WordPress убрать дату публикации из поисковой выдачи, можно просто удалить код отвечающий за вывод даты в шаблоне WordPress. Как по мне, данный способ чересчур радикальный. Посетитель не сможет оценить дату написания статьи и насколько информация описанная в ней актуальна на сегодняшний день.

Можно периодически вручную либо с помощью скрипта, который периодически будет обновлять  дату в базе WordPress. Но это будет обман посетителей, а также вызовет путаницу.

Я предлагаю скрыть дату публикации записи от поисковых систем используя функции CSS или JavaScript, которые поддерживают все современные браузеры.

Код вывода даты публикации записи отличается в зависимости от используемой темы оформления WordPress. Например, за вывод даты в WordPress Twenty Fifteen отвечает переменная $time_string, которая находится файле template-tags.php

Поэтому, если вы не нашли указанный ниже код в вашем шаблоне WordPress, попытайтесь найти необходимую строку с помощью поиска по названию стилей, которые отвечают за форматирование вывода даты в записях WordPress.

Убрать дату публикации с помощью CSS

Чтобы в WordPress убрать дату публикации, придется внести изменения в шаблон сайта WordPress. Найдите строку, которая отвечает за вывод даты публикации материала. Поместите код отвечающий за вывод даты внутрь тега span:

<span date="<?php //код вывода даты ?>"></span>

При необходимости, нужно повторить указанные действия для всех файлов шаблона WordPress. Чтобы дата публикации записи была видна посетителям, добавьте в файл style.css следующую строку:

[date]:before { content: attr(date); }

Убрать дату публикации с помощью JavaScript

Чтобы в WordPress убрать дату публикации, можно использовать функции JavaScript. По аналогии, необходимо изменить код, как это сделано в примере ниже:

<script language="javascript" type="text/javascript">document.write("<?php //код вывода даты ?>");</script>

К недостаткам данного способа можно отнести то, что если у посетителя в браузере отключен JavaScript, он не сможет увидеть дату публикации записи. Но такие случаи достаточно редкие и не имеют серьезных последствий, чтобы обращать на них внимание.

Проверить результат можно с помощью в панели Search Console. Для этого разделе «Сканирование», необходимо выбрать пункт меню «Просмотреть как Googlebot».

Файл robots.txt для WordPress

Эту статью я решил написать под впечатлением от прочитанного на западных блогах. Достаточно долгое время в сети существовал стереотип о правильной методике настройки файла robots.txt для WordPress. При котором старались максимально закрыть все дубли и другие не имеющие отношения к контенту страницы элементы.

На данный момент, у англоязычных блогеров набирает обороты совершенно противоположный тренд. Известный веб-мастер и SEO-специалист Yoast, автор популярного плагина для WordPress Yoast SEO, советует вовсе отказаться от использования robots.txt для запрета индексации контента.

Примера файл robots.txt, который использует Yoast на своем сайте:

User-Agent: *
Disallow: /out/

Как видите, для индексации закрыт всего лишь один раздел сайта. Со слов Yoast’а, это вынужденная мера, поскольку в разделе /out/ находится каталог партнерских ссылок. При желании вы можете ознакомится с его статьей по этому поводу.

Но не стоит вдаваться в крайности. Зачем беспечно полагаться на эвристические алгоритмы Google, если скрыть дубли в WordPress можно самостоятельно с помощью файла robots.txt. Таким образом, правильный robots.txt, является одним из механизмов для внутренней оптимизации сайта. И как по мне, глупо его не использовать.

Я склоняюсь к тому, что в файле robots.txt необходимо закрывать только те разделы сайта, которые действительно могут навредить правильной индексации сайта.

Директивы robots.txt

Формат файла достаточно прост в освоении. Чтобы указать, на кого будут действовать правила, необходимо в robots.txt добавить директиву User-Agent с названием поискового робота. Мы можем задать различные правила для определенной поисковой системы. Для этого в директиве User-Agent, нужно указать имя робота. Но в большинстве случаев, будет достаточно использовать звездочку *, чтобы использовать общие правила для всех поисковых систем.

Далее идут директивы Allow или Disallow, которые указывают поисковой системе что можно индексировать, а к каким разделам доступ закрыт. Можно использовать регулярные выражения в названиях и именах файлов. Пример файла robots.txt:

User-Agent: *
Disallow: /*?
Disallow: /wp-admin/
Allow: /wp-content/uploads/

В примере выше, для всех роботов мы запрещаем индексацию результатов поиска и страницу авторизации панели управления WordPress. И разрешаем доступ поисковых систем к каталогу для загрузки изображений.

Для того чтобы указать ссылку на адрес файла XML-карты сайта, необходимо использовать директиву Sitemap как в примере ниже:

Sitemap: http://www.example.com/post-sitemap.xml

Исчерпывающую информацию по различным параметрам настройки robots.txt можно прочитать в руководстве от Google и Яндекс.

Файл robots.txt для WordPress

В рекомендациях специалисты Google советует как можно меньше ограничивать доступ поисковых роботов к содержимому сайта. В примере ниже файл robots.txt, который я использую на своем блоге:

User-agent: *
Disallow: /*?
Disallow: /20*
Disallow: /author/
Disallow: /wp-admin/
Sitemap: https://codebeer.ru/sitemap.xml

Чтобы убрать дубли, я запретил индексацию страниц поиска и архива. Дополнительно указал адрес к XML-карты сайта.

Можно добавить данные правила в robots.txt в корне сайта, либо использовать специальную функцию для WordPress. Для этого необходимо добавить в файл functions.php код из примера ниже:

add_filter('robots_txt', 'add_robotstxt');
function add_robotstxt($output){
    $output .= "Disallow: /*?n";
    $output .= "Disallow: /20*n";
    $output .= "Disallow: /author/n";
    $output .= "Disallow: /wp-admin/n";
    $output .= "Sitemap: https://codebeer.ru/sitemap.xmln";

return $output;
}

 

Закрыть ссылку от индексации

Для того чтобы закрыть ссылку от индексации, поисковые системы официально рекомендуют использовать атрибут nofollow, но в последнее время все чаще можно услышать мнение о неэффективности данного метода.

Бытует мнение, что если закрыть ссылку от индексации, то это никак не повлияет на вашу страницу, которая как и прежде будет терять свой вес в глазах поисковой системы. При этом, вес по nofollow ссылке не передается другому сайту, а просто бесполезно пропадает. На основе данного предположения, многие рекомендуют вообще не использовать атрибут nofollow для закрытия ссылок от индексации.

В данной статье я хочу рассказать вам о альтернативном методе, как закрыть внешние ссылки от индексации на WordPress сайте без использования дополнительный плагинов. Ссылка, которую мы хотим закрыть, будет выглядеть в глазах поисковых систем как обычный фрагмент текста, но при этом как и при использовании тэга <a> перенаправлять посетителей на другие сайты.

Для того чтобы закрыть ссылку от индексирования, мы будем записывать ее в виде текста размещенного внутри HTML-тега <span>. Самостоятельно <span> не имеет логического значения и выполняет функцию тэга-контейнера, который используют для форматирования или назначения уникального идентификатора выделенному фрагменту текста.

Чтобы сделать закрытую ссылку в браузере посетителя активной и ничем не отличающейся от других ссылок, мы будем использовать внутри HTML-документа специальный JavaScript код. Дополнительно назначим для тэга <span> стили оформления, которые уже используют ссылки на нашем сайте.

Закрыть ссылку от индексации в WordPress

Переходим от теории к практике. Для того что бы закрыть ссылки от индексирования скриптом, нам предварительно необходимо внести соответствующие изменения в шаблон WordPress сайта.

Открываем панель управления WordPress и переходим в меню «Внешний вид» — «Редактор». Необходимо добавить в файл footer.php перед закрытием тега </body> следующий скрипт:

<script type= "text/javascript">function GoTo(link){window.open(link.replace("url:","http://"));}</script>

Для тега <span> необходимо указать стили таким образом, чтобы формат текста своим внешним видом ничем не отличался от обычной ссылки на нашем сайте. Открываем файл style.css, копируем код из примера ниже и устанавливаем значение селекторов CSS под внешний стиль ссылок.

.spanurl {
  color: #333;
  border-bottom: 1px solid #333;
  cursor:pointer;
}
.spanurl:hover {
  color: #707070;
  border-bottom: none;
}

Теперь, чтобы закрыть ссылку от индексации, вместо обычной ссылки <a href="url"></a> необходимо использовать следующий код:

<span class="spanurl" onclick="GoTo('url:example.com/')">Example Domain</span>

Каждый раз копировать данный код не очень удобно, чтобы легко закрыть ссылку от индексации я предлагаю использовать специально предназначенный для этого шорткод. Для этого необходимо добавить в файл functions.php код из примера ниже:

function shortcode_spanurl($content) {
 
    $pattern = '/[spanurl](.*?)<a (.*?)href=["']([a-zA-Z]+://)?(.*?)["'](.*?)>(.*?)</a>(.*?)[/spanurl]/i';
    $spanurl = preg_replace($pattern, "$1<span class='spanurl' onclick="GoTo('url:$4')">$6</span>$7", $content);
 
return $spanurl;
}
add_filter('the_content', 'shortcode_spanurl');