Как защититься от воровства контента из блога
Проблема очень актуальная, сейчас с развитием блогоферм и ростом популярности сплогов контент тянут огромными количествами. Причем даже с непопулярных блогов и с тех же сплогов =))) И вопрос защиты от этого волнует большинство блоггеров.
Но прежде хочется сказать о юридическом аспекте этого вопроса. На подавляющем большинстве блогов, в том числе и на этом), в подвале сайта нет ключевых слов - Все права на материалы сайта принадлежат автору. Перепечатка и использование возможны только с письменного разрешения автора или при наличии активной ссылки на этот сайт. А значит, формально, мы разрешаем ну или не возражаем против воровства контента. Это весьма важный аспект рассматриваемого вопроса.
Начнем с того, как и откуда тянут контент? С развитием технологии RSS этот процесс облегчился. И воруют именно через RSS. Защититься от ручного воровства нереально, а вот кое-что сделать с RSS можно. Рассмотрим несколько возможных способов защиты и теоретические способы (пока нигде не реализованные) от воровства контента.
1. Добавьте авторские ссылки под каждую запись в RSS.
Сделать это можно посредством плагина
2. Сделайте вывод анонсов в RSS.
Возможно, это и не совсем удобно для подписчиков блога, но как вариант защиты подойдет. Также это, возможно, увеличит посещаемость блога - читатели будут переходить из RSS, чтобы дочитать очередную запись. Знаю, что большинство блоггеров - сторонники полных постов в RSS, это дело каждого. Стоит заметить, что некоторые “умные” сплоги умеют вытягивать полный текст непосредственно со страниц блога, в обход RSS. Тут, опять же, сложно что-то сделать. Достоинтсва - простота, недостатки - можем потерять часть подписчиков.
3. Вывод секретного кода в каждой записи.
Сделать это очень просто - воспользоваться функцией PHP md5(). Эта функция 32-значное шестнадцатеричное число (что-то вроде 1f3870be274f6c49b3e31a0c6728957f). Обратного дешифрования нет. Т.е. можно для каждой записи генерировать такое число и выводить его в качестве комментария под записью. Аргументом для функции может быть все что угодно - например, заголовок блога или поста с вашим именем (например, Как защититься от воровства контента из блога - Иванов Иван). Для каждой записи число будет уникальным. Если утянут контент вместе с тегами, то этот комментарий появится и в сплоге. Зачем это надо? При решении вопроса - где первоисточник, вы легко сможете доказать, что автор вы. Достаточно будет объяснить значение этого комментария. В компетентных органах это поможет. Достоинтсва - простота и веский аргумент в судах, недостаток - может не сработать.
4. Вывод скрытого текста.
Где-то в каждой записи блога выводить невидимый текст (например, Этот текст принадлежит автору Ивану Иванову и любое его размещение, кроме ресурса www.blog.ru, запрещено!). Как это сделать? Выводить текст цветом фона, скрывать текст с помощью JavaScript (код должен обязательно идти вне <body></body>, чтобы не скопировали), посредствами CSS (например, сделать абсолютное позиционирование и сместить блок текста на 10000px в сторону), стиль описываем в общем CSS файле. Можно придумать что-то еще, но идея понятна. Из достоинств - простота, недостатки - рискуем попасть под санкции поисковиков.
5. Использование элементов графики.
Это самый передовой и сложный способ. Идея в том, чтобы часть текста заменить изображением. А изображение будет содержать текущий текст. Сделать это можно посредством скрипта на PHP+библиотека GD. К каждому изображению нужно добавить копирайты, водяной знак, в угол добавить адрес вашего блога. Причем выводить эти изображения на сайт надо не через задание абсолютного адреса (http://www.blog.ru/images/image.gif), а через относительное (/images/image.gif). Таким образом, даже если утянут контент вместе с изображениями, на сплоге изображения отображаться не будут. Достоинства - высокая защита, в том числе и от ручного копирования, недостатки - сложность реализации, теряется часть контента, который будет индексироваться поисковиками.
6. Радикальный способ - пожаловаться.
В крайних случаях можно пожаловаться хостеру сплога (врятли поможет, ибо часть “сидит” на заграничных хостингах, а там проблемы русских мало кого волнуют). Куда лучше “настучать” сразу в поисковики - вот ссылки для
Проблема воровства контента в Интернете будет всегда, победить ее нельзя - можно лишь бороться.
Комментарии (46) на пост "Как защититься от воровства контента из блога"
Спасибо за систематизацию информации. RSS футер мне, например, очень помогает.
Хорошие советы! Особенно про картинку в тексте. А вот со скрытым текстом я бы не стал эксперементировать. Если один два раза, то может и прокатить, а если постоянно…
Пожаловаться, ну не знаю, поможет ли?
болтовня… Любая мало - мальская грабилка всё это снесёт. Сегодня был на семинаре яндекса (http://seo-service.org/2008/02/23/yandex-prcticular-internet-adversting-seminar/), там предложили печатать статью, отправлять её себе заказным письмом и класть его в сейф.
Обнаружил свою статью где - то - пиши в органы, в суды ихние подавай на хостеров. Аргумент - конверт заветный.
Не делать ничего - тоже не выход. А чтобы идти в суд, нужны доказательства - или тебе на слово поверят =))
А что, реально кто-то хочет судиться? Я не думаю что может дойти до такого. Вы знаете сколько стоят суды? Узнайте, а потом думайте стоит ли игра свеч…
Конечно, многие думают что затраты оплачивает проигравшая сторона. Но это немного не так. Да, суд вынесет такое решение, но оплатят вам не все, не сразу и еще не факт что вы выиграете дело.
Судиться это не совсем удачная идея. В наших страна судебная процедура не так развилась как у буржуев. Так что больше потратишься, чем получишь свою моральную компенсацию
Это верно, из-за одной статьи врятли станут судиться, хотя если контент с какого-нибудь глянца - кто знает…
[…] нашелся человек, который собрал свои мысли и написал статью. Статья хороша и вроде бы писать уже не о чем, и так все […]
[…] взял здесь http://www.metrod.ru/20_02_2008/kak-zashhititsya-ot-vorovstva-kontenta-iz-bloga/ […]
Да ладно Вам огороды городить… защищаться конечно надо.. но как мне кажеться оно не стоит огромных усилий.. Никто судиться не будет даже если статья с глянца…
если контент супер уникальный то тут и защищаться то сильно и не надо.. доказать что твой спокойно можно, а при перепечатке требовать обязательно активную ссылку.. (перепечатают с ссылкой Вам же лучше) нашли свой контент где нет ссылки предупреждаем автора, а потом в абуз хостера , в абуз гугли и яндекса… все… сайт или закроеться или вылетит в бан у поисковиков.. а на таком сайте пусть себе спокойно лежит контент.. кому он нужен если его там через поисковики не найти…
если средненький.. то и доказывать ничо не придеться.. ибо сейчас за небольшие деньги можно сделать нормальный рерайт.. и все.. ни к чему не привязаться и даже собсно не найти через поисковики у кого твой контент…
ибо все эти коды скрипты картинки и прочая штука при рерайте вырежиться, отфильтруеться и т.д.
а грабилки рсс сейчас не только умеют грабиь сами ленты они еще умею ходить по ссылки из рсс грабить новость вырезать из нее все картинки вырезать весь код по шаблону… оставляю только текст потом в автомате заменять слова синонимами и т.д. текст конечно получаеться не сильно читабельный но этого то и не надо …
[…] статья на блоге Метросексуала которая показывает как защититься от воровства […]
Честное слово, ожидаемая статья
Ну как говорится: Бог в помощь ;) Я тоже вернусь заполночь, буду ковырять.
Надо почаще бывать на вашем блоге)) интересно
Да милости просим =)))
Интересно какой коментарий вы ожидаете в данном посте - во избежание ненужных комментов прикрывайте их возможность в темах как эта
я блог открыл через две недели с которого уже стали воровать контент работают очень оперативно сволочи:(
Очень интересно! Добавил ваш ресурс к себе в закладки. Автор пиши еще.
Позновательно, но вроде уже находил подобное в нете. Как подписаться на Вашу rss ленту?
Хм, довольно интересно. Еще зайду на ресурс когда новая инфа появится.
Я хотел бы отметить что в посте или статье можно указывать ссылку на саму статью - т.е. на саму себя, таким образом это позволит защититься от автоматического копипаста путём парсинга выдачи пс разнообразным софтом.
Даже если таким образом сперли контент, то обратная ссылка останется. Ну конечно это не защищает от ручного копипаста. Тут никакой софт не поможет… разве что как описал выше автор статьи…
Хорошо когда воруют с уже проиндексированных сайтов, а то вчера читал здесь seoeasy.ru/?p=28 Просто в шоке до чего блин люди ушлые есть. Реально, пора сажать за такие дела, тогда может быть, что-то к лучшему изменится. Хотя думаю не чем мы вообще не защищены, и придется только терпеть.
Автор, почему так хило обновляете сайт?
lertoton, во времени многие ограничены
Ничего не сможет защитить ресурс от воровства, все можно переписать, благо исполнителей щас полно!
Ну вот Вы пишете о честности в вебе :)) По сути проблема честности… Я вам немножко расскажу о блог статьях и поисковых системах… Контент с ваших блогов если он вами написан при обнаружении поисковой машиной закрепляется за Вашим сайтом и именно этот сайт и является в глазах поисковика первоисточником! Ну допустим сплоггер у Вас статью стырил и потом еще 5 сплоггеров за ним а затем у того сплоггера еще парочка таких же сплоггеров стырит и того получается в индексе поисковой машины 8 одинаковых статей! Т.к. Вы являетесь первоисточником Вас поисковик будет ранжировать выше остальных во вторых тех сплоггеров скорее всего забанит поисковик в третьих Вам ничего не гразит ! Ну и в четвертых ничего не теряете… От сюда вопрос, зачем защищаться от копипаста и сплогов? :)))) ну а в суд подавать дак уж тем более смешно )))) Не окупится ! Я пробовал судиться правда не по этой теме… только нервы убил и бабло конское потратил ! А вот если у Вас авторитетный ресурс стырил статейку и ссылку на Вас не поставил то конечно же есть смысл написать администрации этого ресурса чтобы они ссылку то поставили и пригразить последствиями в случае отказа ! Я думаю что скорее всего ссылку на Вас в ближайшее время поставят ну или в крайнем случае удалят статью совсем !
Вернусь к первой строчке ))) Это там я про честность писал… Обращаюсь к автору, Вы считаете себя честным блоггером судя по содержанию данной статьи… Говорите настучать поисковикам если что :))) И сами при этом нарушаете правила поисковиков продажей ссылок даже с этой самой страницы…. Не хорошо… Не боитесь что на Вас тоже стукнуть могут ??? Ну Вы зарабатываете дайте и другим заработать :) Не всем же дано статьи писать… ;)
Вы в корне не правы. Если бы так легко определялся первоисточник, то никто бы и не переживал на этот счет. Однако постоянные выпадения сайтов из индекса по причине украденного контента - отнюдь не редкость. Просто вы не в теме так сказать =))
И верно написали “не всем дано статьи писать” - другим дано их пи*дить =))))
А с чего Вы взяли что по причине украденного контента это происходит ? Это Вам Платон сказал ??? :)))) Ну а про не в теме промолчу…
Рискну предположить что выпадение фактически происходит из-за “сап” “ксап” их аналогов и других способов монетизации… Просто складывается впечатление что Yaндекс вообще против чтобы кто либо кроме самого яши что либо и как либо зарабатывал… Вот такие вот выводы… Вообще всеобщий враг рунета - “яша так как не являясь цензором” Продолжает падла банить и выкидывать сайты из индекса ни за что!!! Думаю пора его байкотировать и перестать на него равняться! Ибо ЗАЕ..АЛО!!!
Во-первых - из индекса вылетают белые сайты, на которых кроме контекста ничего и нет. Во-вторых - в индексе легко находятся сайты с твоей статьей по простому запросу в виде предложения в кавычках из статьи. И за счет своей трастовости, эти сайты признаются Яндексом как первоисточник.
А насчет байкота… Среднестатистические Васи, Пети, Оли Маши пользуются Яндексом. Поэтому никуда нам от него не деться =))
Васи и пети перестанут пользоваться если ничего там не будут находить ;)
—Во-первых - из индекса вылетают белые сайты, на которых кроме контекста ничего и нет.—
Не спорю. написал же ни за что!
—Во-вторых - в индексе легко находятся сайты с твоей статьей—
Вот именно что САЙТЫ - почему не сайт ? Принцип отбора по которому он решает кому в индексе быть с одной и тойже статьей а кому нет ?
—И за счет своей трастовости, эти сайты признаются Яндексом как первоисточник.—
Откуда у сплога трастовость ? 0_о
Да и еще, если уж так получилось что у сплогов трастовость выше чем у авторского блога… Стоит задуматься о смене домена блога имхо… :)
либо о смене вида деятельности :))))))))))) (может имеет смысл в сплоггеры завербоваться) “Не всем же дано статьи писать ” :)))
По поводу кому быть в индексе - буквально недавно руководители Яндекса сказали, что не против использования чужих статей на сайте при условии обратной ссылки на первоисточник и если это будет полезно для пользователей сайта. Так вот у нас пиздиют статью некий крутой раскрученный СДЛ. На него тут же ставятся обратки, как на интересную полезную статью. Совсем не сложно предположить, кто может быть признан первоисточником в глазах Яндекса. Очевидно дублирование в выдаче и определяется неким алгоритмом Яндекса по дублям и оригиналу статьи.
А признание первоисточником сплога - ну маловероятно конечно =)) Я в принципе и не о них говорил…
Дак я ж писал в своем первом комменте про СДЛ :))) У СДЛов надо ссылки на себя выбивать да и все )))
да легче всего воспользоваться уже готовым материалом, чем создавать что-то новое…
крадут контент с моего сайта - пришлось пожаловаться в гугл, спасибо за ссылку
А настолько ли важно воруют/не воруют? Поисковик же все равно разберется кто автор, а это главное)
Спасибо за советы) Кое что используем у себя)
Не факт, что Яша разберется.
Спасибо, очень интересно почитать
Весьма интересно!
Спасибо автору за интересные новости и сообщения, занесла блог в favorits ;)
Спасибо вам за сайт, очень классный ресурс, мне очень нравится.
Хорошо пишете. Надеюсь, когда-нибудь увижу нечто подобное и на своем блоге…
Интересно, я и сама замечала, какна других сайтах часть моих мыслей использовалась. Но как реально бороться не знаю. Да в принципе и не уверена что это вообще возможно
Увлекательно. Поброжу у вас еще. А долго ли писали этот пост?
Ну просто каждый пост у вас шедевр, просто дух захватывает в каждой статье, вам бы ещё пару блогов открыть не мешало!
Перелинковку кажеться пропустил.
Кстати, из статьи про Google, на сайт который был в конце статьи, и правда работает.