Последнее время сильно возросла проблема с парсингом контента. Генерируемые ГС, которые просто тащут контент с существующих сайтов, при этом удаляя все внешние ссылки, скачивая картинки себе на хостинг. Самое обидное — это когда вор в выдаче находится вообще выше, а ваши страницы сначала попадают под фильтры, а потом и вообще выпадают из индекса. Что же делать?
Ну самое первое, что обычно рекомендуют теоретики — стучать хозяину, грозить пальчиком, пояснить, что это нехорошо.
Те, кто пытался подобное делать сами знают, насколько это неэффективно.
Следующий совет — это обычно писать хостингу и жаловаться на клиента. Написал я один раз. Ответ был очень правильный, расписанный на 2-3К символов. То есть они вроде бы как журятся, что у меня тащат статьи, но в то же время, если я хочу каких либо действий с их стороны — требуют официальных документов, подтверждающих авторское право на тексты. Так, как защищать их банально не выгодно(долго и дорого) — получается меня вежливо, официально послали.
Кстати, была у меня еще ситуация с Юкозом. Какой то школьник скопировал мой сайт, причем скопировал не только статьи, но и шаблон, картинки и так далее. Даже копирайты оставил. Написал абузу им, с источниками, откуда скопировано. Сайт заблокировали. Какое же мое было удивление, когда через 2 дня он заработал. Посмотрел — на сайте мои же статьи, но на каждую страничку добавлено по 1 строке — комментарию от школьника. Дальнейшая абуза — поддержка Ucoz ответила, что информация «уникальна» , так как содержит размышления автора. Дальнейшая переписка не к чему не привела.
Зачем все это написано? Для того, чтобы вы поняли — бороться с копипалстерами довольно проблематично. Абузы, кляузы и так далее не дадут того результата, который вы хотели. Поэтому защищаться нужно с помощью механизмов поисковых систем. Наверное вы уже в курсе, что Яндекс и Гугл анонсировали возможности по «»защите контента«.
То есть можно загрузить через специальную форму текст и таким образом он будем «защищен». Хотя сейчас уже понятно, что это Бета-тестирование, на реальную защиту надеяться не стоит.
Как же можно защититься?
Ну самое первый метод — это ускорение индексации вашего контента. Для этой цели в ПС существует «быстроробот«, то есть специальный бот, индексирующий контент.
Каким образом можно ускорить индексацию сайта в яндексе и привлечь бота на сайт?
Ну во первых, получить ссылки с сайтов, где быстроробот сидит очень часто и практически не вылазит с них.
Есть много порталов, сайтов с хорошей индексацией. Например даже банальный Серч(http://forum.searchengines.ru),который индексируется Гуглом каждые 15 минут в среднем(посты уже в выдаче).
Есть еще какие методы? Конечно — это всеми любимые социальные сети, блогоплатформы.
Вот вам список тех социальных сетей, которые использую я:
http://www.facebook.com
http://vkontakte.ru
http://www.odnoklassniki.ru
Также Блогоплатформы
http://www.blogger.com/
http://www.liveinternet.ru/
http://ya.ru/
http://twitter.com/
и социальные закладки:
http://bobrdobr.ru/
http://www.google.com/bookmarks/
http://zakladki.yandex.ru/
В каждой соц сети у меня есть аккаунты, с помощью которых анонсируется пост. Как правило после этого происходит индексация Яндексом в течении 30 минут(повторяю, быстроробот) и гуглом в течении суток.
Примеры — индексация прошлого поста в течении 30 минут(пост опубликован порядка 5 часов назад):
Чтобы было понятно, статистика собиралась давно и у меня море скриншотов по индексации:
Обратите внимание — проиндексированный таким образом контент ищется по поисковым словам. После быстрой индексации у ПС уже не возникает мыслей, кто является первоисточником контента. Кроме этого, таким образом вы получаете ссылки с социальных сетей, которые в данный момент начинают все больше учитываться поисковыми системами в ранжировании.
23 комментария
А можно линк на гугл для отправки статей по защите контента?
Метод еще на тесте. Сейчас уже доступен механизм указания авторства статей.
Поищите инфу по сервису Гугла Rich Snippets Testing Tool
авторская разметка никоим образом не влияет на определение первоисточника в гугле и уж тем более на ранжирование документов.
У меня как раз сложилось свое мнение по этому поводу, бэки тут вовсе не при чем
Ну так твой пост только подтверждает мою теорию. Контент+ ссылки+ ссылки с соц сетей — и ты становишься автором, а другие копипалстерами. :(
У меня RSS идет через FeedBurner, через него автоматически в твиттер — google стабильно индексирует через 2 минуты. А вот с Яндексом постоянно все сложнее.
Да но бывает просто случае из ряда вон … и фиг вот мне сейчас что то доказать яндексу что у меня контент растащили после его дебильного поведения.
Вы указали только три сервиса закладок. Это просто для примера? Или остальные в данный момент уже не слишком эффективны?
Devvver, а вы используете по одному аккаунту в каждом из перечисленных сайтов? Не страшно ли «Палево» всех ваших сайтов сразу, в таком случае конкурентами или ПС?
Леха, можете проверить ваши мысли) создайте пост(страничку), не давайте на не ссылок и проспамте в этих соц закладках) Больше так писать не будете)
Кстати в Яндекс закладках есть хорошая опция — называется «Поделиться на я.ру» , которую советую юзать)
Все банально — как правило авторизованные пользователи имею бар (гугл и Яндекс бар). Эти приблуды отлично палят ссылки, по которым переходят пользователи. Как следствие — они попадают в индекс.
Проверено это уже много раз: сами ссылки в закладках не учитываются, но отправляют поисковик по указанным адресам и эти страницы индексируются. Удобно для быстрой индексации новых материалов. Я на «Я» специально делал пометки и уже через несколько минут все это появлялось в поиске Яндекса.
Есть у меня сайт в украинской доменной зоне. Один нехороший человек скопировал целый раздел с него примерно через год после размещения на моем сайте. Сайт у него намного моложе, нулевой по пузомеркам. Домен у него .ru В выдаче по России статьи этого сайта выше ,чем мои. Причем он разместил только тексты, картинок на страницах нет.
Написал яндексу, они поблагодарили, сказали, что постараются учесть это в алгоритмах:) Меня теперь распирает от чувства собственной важности. А статьи на том сайте до сих пор выше в поиске.
Раньше доказать авторство было сложно. Но сейчас найден метод борьбы с плагиаторами. Вызывается нотариус, который фиксирует нахождение материалов на сайте. После этого материалы можно удалять, можно не удалять, это уже все равно. Ну а потом в суд.
Так и есть, однако у меня наоборот гугл индексит новую статью за 10-30 минут, а вот яндекс может и через 2-3 дня внести в индекс.
п.с. у вас в 4 абзаце с «кавычками» казус :)
Не сочтите за рекламу — есть специальный плагин для wordpress ContentLockPRO
Очень полезная штука.
я.вебмастере есть «оригинальные тексты». добавляю туда текст сразу после того как опубликовал на сайтах статью.
Я так делаю также. Но эта функция только для сайтов с тиц 10 и к тому же она бета, мне кажется, что она пока не работает. Просто нужна для тестинга сервиса.
Гм. А я слышал что абузы на хостинг и домен достаточно эффективны, в некоторых случаях.
А я скажу только, что абузы срабатывают в 50% из ста. Зачастую даже ховнохостеры посылают в ..опу. Поди надоели уже им обворованные.
Хорошо, а как быть в таком случае: есть сайт, ТИц-20, изначально был задуман как ГС, но поперло. Посещалка была до 4к. Где-то недели три назад просто рухнул до 200 юзеров в сутки. Был весь в индексе, но потом оказалось, что весь контент был просто растащен по таким площадкам как Сатом.ру и прочие издевательства, и ВК тоже. Удивительно, как под АГС не попал. Пришлось полностью рерайтить и менять шаблон. Как защитить в таком случае, если зарятся уже на индексируемый материал, который находится в топе?
Наталья, к сожалению методов влияния, кроме юридических, не существует. Если воруют большие порталы — можно вручную написать им претензию, часто могут удалить вашу статью или поставить ссылку. А если воруют мелкие сайты — как правило вам никто не ответит.
Кстати, везде, или почти везде (на том, что сперли) стоят ссылки из крупных площадок ЯН.
Возможно, я задам глупый вопрос, но мне реально интересно. Вот текст со страницы стырили, она упала или даже выпала, ну, в общем, не важно… Если залить туда еще текста, не удаляя старый, то теоретически уникальность страницы в целом станет выше. Можно ли оставить старый контент без изменений, а то как-то надоело после апа каждый раз сидеть по три дня рерайтить? Я уже апов боюсь!