The below is an off-site archive of all tweets posted by @scheibo_ ever

October 6th, 2016

AliCologne Passiert nur alle paar tausend Jahre:

Alle Planeten auf einer Linie..^^ pic.twitter.com/53SU42iHvz

via TweetDeck (retweeted on 10:37 PM, Oct 6th, 2016 via Tweetbot for iΟS)

@xitnelat @heavyinternet Aber dann ist es schon zu spät. Dann haben sie mindestens schon die Home. Man müsste sie komplett blocken können.

via TweetDeck in reply to xitnelat

@heavyinternet Dafür bin ich viel zu wenig Serverlastig unterwegs und kenne mich zu wenig aus.

via TweetDeck in reply to heavyinternet

@xitnelat @heavyinternet Wie kann ich gewährleisten, dass diese speziellen Seiten nur auf die Honeypot seite gehen und nur dieses crawlen?

via TweetDeck in reply to xitnelat

@heavyinternet Danke, dass muss ich mal in ruhe durchgehen. Präventiv wäre halt schön.

via TweetDeck in reply to heavyinternet

@heavyinternet Mann muss dazu sagen, die Domain ist schon ewig “abgeschaltet”. Der Content ist somit überhaupt nicht mehr korrekt.

via TweetDeck in reply to heavyinternet

@heavyinternet Ja, bzw will ich verhindern, dass sie weitere Domains von mir crawlen. Das ist die erste Suchergebnisseite.

via TweetDeck in reply to heavyinternet

@heavyinternet Beispiel von einer alten Domain von mir. Da kommt mir alles hoch. pic.twitter.com/IuMiel0Hrn

via Twitter Web Client in reply to heavyinternet from München, Bayern

@heavyinternet Ich habe im Moment nur das, was mir google zeigt, und das ist zum kotzen.

via TweetDeck in reply to heavyinternet

@heavyinternet Aber bestimmt nicht über igre eigene Domain. Ich schätze, so schlau werden sie sein.

via TweetDeck in reply to heavyinternet

@heavyinternet robots.txt werden ignoriert. Rewrite verhindert nur den Aufruf von der Domain aus, nicht das Crawling selbst, oder?

via TweetDeck in reply to heavyinternet

@faulancr Damit verhindere ich, wenn ich es richtig verstehe, nicht das Crawling, sondern nur den Aufruf von dieser Seite aus.

via TweetDeck in reply to faulancr

Oder hat jemand eine Liste, von den bekanntesten Spam-Crawling-Webseiten? twitter.com/scheibo_/statu…

via TweetDeck

Hat jemand eine Idee/Lösung, wie man Seiten wie findsimilarsites, webxtrakt, seoceros den Zugriff verweigern kann?

via TweetDeck