Этот вопрос нас всех волнует очень и очень. И вопросы на эту тему уже выносились. Сайт-воришка появился относительно недавно, и создается впечатление, что он полностью ориентирован на вопросы проекта "Большой вопрос". Наши вопросы очень быстро появляются на его страницах и прекрасно индексируются в Яндексе. При чем было очень обидно, когда проект БВ почти не отражался в поисковике, а наши вопросы в нем были на первых строчках, но с другого сайта(. Только просмотры и начисления утекали мимо нас, авторов.
Я полагаю, что это вопрос администрации нашего проекта. Она должна отстаивать наши и свои интересы, сообщать заинтересованным "органам", тому же Яндексу, о сайте-воре, живущем за счет плагиата. Думаю, что какие-то меры по защите своего контента администрация все-таки предпринимает. Ей тоже не интересно терять прибыль от проекта. Вот так отвечал Администратор на вопрос о подобном сайте:
Людей обладающих энциклопедическими знаниями очень мало, а на БВ их раз, два и обчелся. Поэтому большинство ответов на вопросы, типа: Что такое..? или Кто такой(ая)..?, как правило взяты из инета. Я стараюсь пропускать такие вопросы, так как не вижу интереса отвечать на них. Другое дело, когда вопросы со смыслом или необычные, придуманные самими участниками БВ. На такие вопросы ответить или попытаться ответить одно удовольствие. А как может быть иначе, какой смысл искать ответ в поисковиках, тупа копировать, немного отредактировать и выдать за свой. Не курсовую же пишим, иногда полезно и "мозгами пошевелить".
Совсем недавно слушала лекцию от Яндекса об этом. Они говорят о том, что если вы использовали покупные голоса, имитирующие присутствие на вашем сайте других людей, то попадете в БАН и выбраться из него можно лишь через 8 месяцев.
Также серьезно наказывается покупка ссылок на ваш сайт. Этим занимается программа Минусинск. Но тут позиции сайта падают на 20 пунктов вниз и можно вернуться, если снять ссылки, уже примерно через 3-4 месяца.
Дело в том, что Яндекс не ищет по содержимому картинок и не умеет отличить огурец от гималайского медведя. Он ищет по тексту, который сопровождает эти картинки: в тегах, в метаданных файлов, и в самом отображаемом тексте. Кроме того, используются алгоритмы оценки сходства двух изображений. И если на порносайтах порнография сопровождается метаинформацией, которая позволяет находить ее легко и надежно, то когда кто-то выкладывает порнокартинку в обсуждении какого-нибудь мультика, он не снабжает ее флагом "это порно". И она попадает в результаты поиска.
Naya, я вас прекрасно понимаю, т.к. сам всегда достаточно долго готовлю каждый вопрос. И чтобы не получать штрафы за дублирование существующих вопросов, я стараюсь максимально точно прописывать ТЭГИ. После того как задам вопрос, я сразу же смотрю в правой колонке окно с похожими вопросами. И вот если там я ничего похожего на мой вопрос не увидел, то вопрос оставляю, а если есть аналогичный вопрос, то я успеваю самостоятельно удалить свой вопрос, без штрафных санкций.
Дополнительно, для надёжности, перед тем как создавать вопрос, лучше взять каждый тэг из своего будущего вопроса, и попробовать по внутреннему поиску БВ (окно вверху справа) найти все вопросы по этой теме и просмотреть их на предмет дублей.
А поиск на БВ, поверьте, очень даже качественный. Многим более серьёзным сайтам до такого поиска ещё очень далеко.)
А улучшать нужно не поиск, а саму систему с дублирующимися вопросами.