Structured Data & Technical GEO
Die technische Seite von GEO: JSON-LD-Schemata, llms.txt, AI-Crawler-Management und der Markdown-Mirror — letzteres als gelebtes Experiment dieser Seite.
von Jean Pierre Kolb ·
Technisches GEO sorgt dafür, dass eine Maschine deinen Inhalt sauber lesen, zuordnen und zitieren kann — bevor es überhaupt um die Formulierung geht. Strukturierte, maschinenlesbare Inhalte werden bevorzugt; unstrukturierte Textblöcke werden zunehmend ignoriert. Ich behandle hier zwei Ebenen: die Daten-Auszeichnung (JSON-LD, Tabellen, llms.txt) und das technische Fundament (Crawler-Management, Markdown-Alternate, Server-Side-Rendering). Den Markdown-Teil schreibe ich aus erster Hand — diese Seite hier ist selbst das Experiment. Den Rahmen liefert der GEO-Pillar Was ist GEO?.
Strukturierte Daten: JSON-LD und maschinenlesbare Formate
Strukturierte Daten geben einer Maschine explizit vor, was ein Inhalt bedeutet — statt es aus Fließtext erraten zu müssen. Für GEO sind vor allem diese Bausteine relevant. Wichtig zur Einordnung: Google erklärt Schema für seine eigene KI-Suche als nicht erforderlich (siehe Googles AI-Optimization-Guide), für andere KI-Engines bleibt es aber ein nützliches Signal.
| Baustein | Zweck |
|---|---|
FAQPage, HowTo | Frage-Antwort- und Schritt-für-Schritt-Inhalte direkt extrahierbar machen |
Article | Artikel mit Autor, Datum und dateModified auszeichnen |
Review, Product | Bewertungen und Produktdaten mit expliziten Attributen versehen |
Organization, Person | sichtbar machen, wer hinter dem Inhalt steht — Basis für E-E-A-T und Zuordnung |
Tabellen mit <th> | korrekt ausgezeichnete HTML-Tabellen sind maschinenlesbar und hoch zitierfähig |
| Definitionslisten | <dl>/<dt>/<dd> für Glossare und Schlüssel-Wert-Erklärungen |
llms.txt | Markdown-Datei im Domain-Root, die Zweck und Struktur der Seite für KI beschreibt |
Das Organization- und Person-Schema ist der unterschätzte Teil: KI nutzt es, um Erfahrung, Expertise und Autorität (E-E-A-T) zu verifizieren und ein Zitat korrekt zuzuordnen. Wer anonym publiziert, verschenkt genau diese Zuordnung.
Der Markdown-Mirror: das Experiment dieser Seite
Der wirksamste technische Hebel ist eine saubere Markdown-Version jeder Seite — und genau das setze ich hier um. KI-Agenten extrahieren Inhalt aus Markdown deutlich zuverlässiger als aus gerendertem HTML, weil Navigation, Werbung und Styling-Rauschen fehlen. Es gibt zwei Wege, das anzubieten, und diese Seite nutzt beide:
- Statischer
.md-Mirror plus Link im<head>— jede Seite hier hat ein Markdown-Gegenstück und einen<link rel="alternate" type="text/markdown" href="…">im Kopf. Crawler, die nicht verhandeln, finden den Inhalt so trotzdem. - Content-Negotiation über HTTP — schickt ein Agent
Accept: text/markdown, antwortet der Server mitContent-Type: text/markdownstatt HTML.
Ich betreibe das auf dieser Wissensplattform unter /db/ als bewusstes Experiment: Jeder Artikel — auch dieser hier — liegt zusätzlich nativ als Markdown vor, damit KI-Systeme rauschfrei auf die Daten zugreifen können. Du kannst das selbst ausprobieren, indem du die Markdown-Variante dieser Seite öffnest. Für mich ist das kein theoretischer Tipp, sondern gelebte Praxis — und die Grundlage, auf der ich beurteile, was funktioniert.
Technisches Fundament: Crawler, Rendering, URLs
Damit KI deinen Inhalt überhaupt erreicht, muss die Technik stimmen. Vier Punkte sind dabei entscheidend.
- AI-Crawler-Management — die gängigen KI-Crawler heißen
GPTBot,OAI-SearchBot,Google-Extended,ClaudeBot,PerplexityBot,CCBotundBytespider. Du erlaubst oder blockierst sie gezielt in derrobots.txt. Eine bewusste Entscheidung ist hier wichtiger als pauschales Blocken oder Zulassen. - Server-Side-Rendering — KI-Crawler kommen mit reinen JavaScript-Seiten schlecht zurecht. Der kritische Inhalt muss in der initialen HTML-Antwort stehen.
- Schnelle Ladezeiten — KI-Crawler respektieren Crawl-Delays und überspringen langsame Seiten. Optimiere die Time to First Byte, aktiviere Kompression, nutze ein CDN.
- Saubere URLs und internes Linking — logische, beschreibende URLs helfen bei der thematischen Einordnung, und eine starke interne Linkstruktur macht deine Themen-Autorität sichtbar.
Das llms.txt rundet das ab: eine Markdown-Datei im Domain-Root, die deine Seite, ihre Kern-Inhaltsbereiche und die gewünschte Zitierweise beschreibt. Sie ist noch experimentell, gewinnt aber an Verbreitung. Mehr zur Verbreitung und zum Standard findest du auf llmstxt.org (englisch).
FAQ
Brauche ich Schema-Markup für GEO?
Es kommt auf die Engine an. Google erklärt Schema für seine eigene KI-Suche ausdrücklich als nicht erforderlich, weil diese den klassischen Suchindex nutzt. Für Perplexity, ChatGPT, Claude und andere Engines bleibt strukturierte Auszeichnung aber ein nützliches Signal — und sie schadet nie. Meine Empfehlung: Organization/Person und passende Inhaltstypen wie Article oder FAQPage dort einsetzen, wo sie ohnehin den Inhalt korrekt beschreiben.
Was ist ein Markdown-Mirror und brauche ich ihn?
Ein Markdown-Mirror ist eine saubere Markdown-Version deiner Seite ohne Navigation, Werbung und Styling-Rauschen — angeboten per <link rel="alternate" type="text/markdown"> oder per HTTP-Content-Negotiation. KI-Agenten extrahieren daraus zuverlässiger als aus HTML. Pflicht ist er nicht, aber ein klarer Vorteil. Ich betreibe ihn auf dieser Seite für jeden Artikel und kann den Unterschied bestätigen.
Soll ich AI-Crawler blockieren oder zulassen?
Das ist eine bewusste Entscheidung, keine Standardvorgabe. Wer in KI-Antworten zitiert werden will, lässt die relevanten Crawler wie GPTBot, OAI-SearchBot, Google-Extended, ClaudeBot und PerplexityBot zu. Wer Inhalte vor dem Training schützen, aber in der Suche sichtbar bleiben will, differenziert in der robots.txt zwischen Trainings- und Such-Bots. Pauschales Blocken kostet Sichtbarkeit.
Weiterlesen
Der Rahmen ist der GEO-Pillar Was ist GEO?. Wie Google Schema und llms.txt einordnet, klärt Googles AI-Optimization-Guide. Wie du den Inhalt selbst zitierfähig formulierst, steht in Schreiben für KI; wie KI Fragen in Teilabfragen zerlegt, in Multi-Turn und Query-Fan-out. Den technischen Zustand deiner Seite prüfst du mit dem SEO-&-GEO-Analyzer.