Question 1

Was ist ein AI-Crawler überhaupt?

Accepted Answer

Ein Programm, das im Auftrag von OpenAI, Anthropic, Google, Perplexity und Co. Webseiten liest — entweder um damit KI-Modelle zu trainieren (GPTBot, ClaudeBot) oder um Live-Antworten in ChatGPT, Claude oder Perplexity mit aktuellen Quellen zu unterfüttern (OAI-SearchBot, PerplexityBot, Claude-SearchBot). Drei Typen: Trainings-, Such- und User-Abruf-Crawler.

Question 2

Warum sollte mich das interessieren?

Accepted Answer

Wenn Sie wollen, dass ChatGPT, Claude oder Perplexity Ihre Webseite kennen und zitieren, müssen Sie die richtigen Crawler reinlassen. Viele Mittelständler haben die robots.txt vor Jahren angelegt und blocken aus Versehen genau die Bots, die heute über AI-Sichtbarkeit entscheiden. Unser Tool zeigt das in zwei Sekunden pro Domain.

Question 3

Was prüft das Tool genau?

Accepted Answer

Wir laden die robots.txt Ihrer Domain (zum Beispiel https://ihre-domain.de/robots.txt), parsen die Regeln und gleichen sie mit der aktuellen Liste der relevanten AI-Crawler ab. Für jeden Bot zeigen wir: erlaubt, blockiert, teilweise blockiert oder nur über die Wildcard-Regel erfasst. Inklusive Auswirkungs-Erklärung pro Bot.

Question 4

Welche Bots werden geprüft?

Accepted Answer

Aktuell zwölf Bots aus den vier wichtigsten Ökosystemen: OpenAI (GPTBot, OAI-SearchBot, ChatGPT-User), Anthropic (ClaudeBot, Claude-SearchBot, Claude-User), Perplexity (PerplexityBot, Perplexity-User), Google-Extended für Gemini-Training, Applebot-Extended für Apple Intelligence, plus Bytespider (ByteDance/Doubao) und CCBot (Common Crawl — Grundlage fast aller Open-Source-LLMs).

Question 5

Was bedeutet 'Status: teilweise blockiert'?

Accepted Answer

Der Bot ist nicht vollständig gesperrt, aber bestimmte Pfade Ihrer Seite sind verboten. Klassisches Beispiel: /admin oder /search ist disallowed, aber der Rest erlaubt. Für AI-Sichtbarkeit meistens unproblematisch — wenn Sie unsicher sind, prüfen Sie die einzelnen Regeln im Detail (klick auf 'robots.txt einsehen' im Tool).

Question 6

Warum sagt das Tool 'Wildcard-Regel'?

Accepted Answer

Ihre robots.txt hat keinen Block speziell für diesen Bot, fällt aber auf die User-agent: * Wildcard zurück. Das heißt: der Bot ist über die allgemeine Regel erfasst, nicht über eine bot-spezifische. Funktional gleich, aber Sie haben weniger Kontrolle.

Question 7

Reicht es, robots.txt zu setzen, oder muss ich mehr tun?

Accepted Answer

Für die meisten Bots ja — GPTBot, ClaudeBot, Google-Extended, Applebot-Extended und CCBot respektieren robots.txt zuverlässig. Drei Bots tun das nicht oder nur teilweise: Perplexity-User (öffentlich bestätigt), PerplexityBot (teilweise) und Bytespider (bekannt für Ignorieren). Wer diese wirklich blocken will, braucht Server-Side-Filtering auf User-Agent-Ebene (Reverse-Proxy, Cloudflare WAF) oder IP-Range-Blocks.

Question 8

Sollte ich ChatGPT, Claude und Perplexity erlauben oder blockieren?

Accepted Answer

Faustregel: Search- und User-Fetch-Bots erlauben (sie bringen Sichtbarkeit in Live-Antworten), Trainings-Bots können Sie nach Geschmack blockieren — ohne Sichtbarkeitsverlust. Konkret: OAI-SearchBot, PerplexityBot, Claude-SearchBot, ChatGPT-User, Claude-User unbedingt erlauben. GPTBot, ClaudeBot, Google-Extended, CCBot können Sie blocken, falls Ihnen unbehaglich ist, dass Ihre Texte ins Training fließen.

Question 9

Ist das Tool kostenlos? Brauche ich einen Account?

Accepted Answer

Komplett kostenlos, keine Anmeldung, keine E-Mail nötig. Wir speichern Ihre Eingabe nicht dauerhaft — die Anfrage geht direkt an unseren Server, lädt die öffentliche robots.txt Ihrer Domain und wertet sie aus. Datenstand der Bot-Liste: Juni 2026, wir aktualisieren bei neuen Bots.

Question 10

Was, wenn ich keine robots.txt habe?

Accepted Answer

Dann sagt das Tool 'Keine robots.txt gefunden' und alle Bots gelten implizit als erlaubt — das ist der HTTP-Standard. Wenn Sie gezielt Kontrolle wollen, legen Sie eine Datei /robots.txt im Root Ihrer Domain an. Wir bauen Ihnen das auf Wunsch zusammen mit einer Strategie ein (siehe GEO-Audit).

AI-Crawler-Checker — sehen ChatGPT, Claude und Perplexity Ihre Seite?

Was ist ein AI-Crawler?

Die drei Bot-Typen

1. Trainings-Crawler

2. Such-Crawler

3. User-Fetch-Bots

Die zwölf wichtigsten Bots im Überblick

Trainings-Crawler (6)

Such-Crawler (3)

User-Fetch-Bots (3)

Wie unser Checker funktioniert

robots.txt richtig schreiben — Beispiel für AI-Sichtbarkeit

Was robots.txt nicht kann

Häufige Fragen zum AI-Crawler-Check

Sie wollen das nicht selbst pflegen?