Methodik: KI-basierte Bewertung von E-Mail-Marketing-Tools

Dieses Projekt ist ein KI-gestütztes Research- und Aggregator-Projekt mit redaktioneller Verantwortung durch Simon. Es arbeitet ohne eigene Tool-Labore und ohne Konto-Zugriff auf jeden Anbieter. Deshalb muss jede Aussage auf Quelle, Datum, Kriterium und Grenze zurückgeführt werden.

Bewertungskriterien

Tool-Vergleiche werden nicht nach Gesamteindruck sortiert. Jede Empfehlung muss an mindestens einem Kriterium hängen und die Grenze des Kriteriums nennen.

Gewichtete Bewertungskriterien für Newsletter-Tool-Vergleiche

Gewichtete Bewertungskriterien für Newsletter-Tool-Vergleiche
Kriterium	Gewicht	Mess- oder Quellenpunkt	Grenze
Zustellbarkeits-Indikatoren	30 %	CSA-/Versandreputation, dokumentierte Zustellwerte, Domain-Setup, SPF/DKIM/DMARC-Hinweise	Indikatorgewicht, keine eigene Seed-List- oder Inbox-Placement-Messung und kein Posteingangsversprechen
Datenschutz und Rechtsrahmen	25 %	AVV/DPA, Datenregion, Subprozessoren, Transfermechanismus, Double-Opt-In-Nachweis	Keine Rechtsberatung und kein Account-Audit
Automation und Segmentierung	20 %	Tags, Listenmodell, Trigger, Ausschlüsse, Käuferstatus, API-/Shop-/Digistore24-Anbindung	Keine produktive Langzeitnutzung in Kundenaccounts
Kosten und Skalierung	15 %	Startpreis, Kontaktlimit, Versandlimit, Funktionslimit, Preissprung bei 1.000/10.000 Kontakten	Kein Checkout-Test; Preise sind Quellenstände
DACH-Bedienung und Support	10 %	Sprache, Supportkanal, Dokumentation, deutschsprachige Reviews, Verein-/KMU-Fit	Kein eigener Support-Ticket-Test

Quellen-Hierarchie

Wenn Quellen widersprechen, entscheidet nicht die lautere Aussage. Entscheidend ist die Quellenrolle: Gesetz oder Anbieter-Dokumentation vor Reviewgefühl, Reviewdaten vor Einzelmeinung, GSC-Daten vor Bauchgefühl zur Suchintention.

Quellenrang, Nutzung und Bewertungsgrenze

Quellenrang, Nutzung und Bewertungsgrenze
Quelle	Nutzung	Grenze
1. Primärquellen	Gesetze, Behörden, Gerichtsurteile, offizielle Anbieter-Dokumentation, Preis- und Hilfe-Center-Seiten	Höchste Priorität für Tatsachen; Marketingformulierungen werden nicht als neutrale Bewertung übernommen
2. Öffentliche Reviewdaten	OMR Reviews, Capterra, G2 oder Trustpilot mit Note, Anzahl, Abrufdatum und wiederkehrenden Kritikpunkten	Bewertungen zeigen Nutzerwahrnehmung, nicht automatisch Rechtskonformität oder Zustellbarkeit
3. Branchen- und Benchmarkquellen	Litmus, Mailchimp Benchmarks, HubSpot Reports, Bitkom und DACH-Studien als Kontext für Markt- und Kanalfragen	Benchmarkwerte werden nicht auf ein einzelnes Projekt übertragen, wenn Branche, Land oder Stichprobe nicht passen
4. Eigene GSC- und Repo-Daten	Indexstatus, Impressionen, Klicks, Query-Familien, interne Links, Sitemap und Canonical-Signale	GSC erklärt Nachfrage und technische Sichtbarkeit, aber nicht automatisch Kaufbereitschaft
5. KI-Zusammenfassung	Strukturieren, Gegenüberstellen, Lücken markieren und klare Handlungslogik formulieren	KI-Zusammenfassung zählt nur mit Quelle, Datum und Grenze; keine erfundenen Tests

Quellenrollen

Eine Quelle beantwortet nie alle Fragen. OMR kann Nutzungsfrust zeigen, aber keinen AVV prüfen. Eine Anbieterpreisseite zeigt Tarife, aber keine Zustellbarkeit. Diese Trennung steht auch im Quellenverzeichnis.

Quellenrollen und Grenzen

Quellenrollen und Grenzen
Quelle	Nutzung	Grenze
Anbieter- und Preisseiten	Tarife, Featuregrenzen, AVV/DPA-Hinweise, Datenregion	Herstellerangaben können Marketing-Sprache enthalten
OMR Reviews und Capterra	Bewertung, Bewertungsanzahl, deutschsprachige Nutzerhinweise	Reviews ersetzen keine Datenschutz- oder Funktionsprüfung
Quellenverzeichnis	Claim, Datum, Quelle, Bewertungsgrenze und Affiliate-Status	Quellenstand statt Echtzeitdaten
Google Search Console	Query-Intent, Länderanteile, Seiten mit Impressionen ohne Klick	GSC zeigt Nachfrage, keine Inhaltsqualität
Rechts- und Behördenquellen	DSGVO, Einwilligung, Auftragsverarbeitung, internationale Transfers	Keine individuelle Rechtsberatung

Aktualitäts-Intervalle

Ein Stand-Datum ist nur nützlich, wenn klar ist, wann es neu geprüft wird. Die Prüfung richtet sich nach Risiko und Hebel: Preise, Recht, Affiliate-Status und nicht indexierte Money-Seiten werden früher kontrolliert als reine Begriffsartikel.

Refresh-Regeln nach Seitentyp und Datenrisiko

Refresh-Regeln nach Seitentyp und Datenrisiko
Schritt	Input	Output
Money-Pages und Tool-Vergleiche	Preise, Affiliate-Status, Reviewzahlen, DACH-/DSGVO-Signale	Monatlich bei GSC-Auffälligkeit oder Tool-Änderung; sonst spätestens quartalsweise prüfen
Rechts- und Datenschutzseiten	DSGVO, UWG, TDDDG, DPF/SCC, Gerichtsurteile, Behördenhinweise	Bei Gesetzes-/Urteilsänderung sofort; sonst mit sichtbarem Quellenstand weiterführen
Branchen- und Benchmarkdaten	Jahresreports, Branchenbenchmarks, DACH-Studien	Beim neuen Report oder wenn eine Zahl in einem Artikel verwendet wird
Indexierung und interne Links	GSC-Cache, Sitemap, URL-Inspection, interne Linkanalyse	Bei frischem GSC-Stand und nach Content-/Layout-Rollouts prüfen

KI-Ablauf

Die KI darf Inhalte strukturieren, vergleichen und formulieren. Sie darf keine erfundenen Tests, keine ungeprüften Superlative und keine Rechtsurteile als Tatsache ausgeben.

KI-Arbeitsablauf von Query bis Veröffentlichung

KI-Arbeitsablauf von Query bis Veröffentlichung
Schritt	Input	Output
1. Query lesen	GSC-Export, SERP-/PAA-Beobachtung, bestehende Seiten	Suchabsicht mit Seite, Query-Familie und Klicklücke
2. Claims extrahieren	Anbietertexte, Review-Portale, interne Money-Pages	Liste aus Zahlen, Featureaussagen und Datenschutzbehauptungen
3. Claim begrenzen	Quelle, Datum, Testart, fehlender Test	Claim mit Grenze: kein Account-Test, kein Checkout-Test, keine Rechtsberatung
4. Entscheidung formulieren	Kriterientabelle, Zielgruppe, Kosten-/Datenschutzgrenze	Anbieterempfehlung mit Ausschlussgrund und nächstem Schritt
5. Verifizieren	Build, Todo-Referenzen, Browser-Ansicht, Link-/Schema-Prüfung, Live-Browser-Check nach Deployment	Nur Änderungen mit lokaler Prüfung und Live-Abgleich werden als erledigte Todo abgeschlossen

Grenzen der Methode: Was nicht behauptet wird

Keine eigene Nutzung aller 12 Newsletter-Tools über mehrere Monate.
Keine eigene Inbox-Placement-Messung mit Seed-Listen.
Kein eigener Checkout-Test für jedes Preismodell.
Kein eigener Support-Ticket-Test je Anbieter.
Keine Rechtsberatung für konkrete Unternehmen, Vereine oder Shops.

Adjektive werden zu Kriterien

Wörter wie „gut“, „stark“, „einfach“, „fair“ oder „besser“ zählen nicht als Bewertung. Eine Aussage ist erst verwendbar, wenn sie in ein beobachtbares Merkmal übersetzt wurde: Preis, Limit, Review-Anzahl, Datenort, Funktionsgrenze, Support-Sprache, Einwilligungsnachweis oder URL.