Methodik: KI-basierte Bewertung von E-Mail-Marketing-Tools
Dieses Projekt ist ein KI-gestütztes Research- und Aggregator-Projekt mit redaktioneller Verantwortung durch Simon. Es arbeitet ohne eigene Tool-Labore und ohne Konto-Zugriff auf jeden Anbieter. Deshalb muss jede Aussage auf Quelle, Datum, Kriterium und Grenze zurückgeführt werden.
Bewertungskriterien
Tool-Vergleiche werden nicht nach Gesamteindruck sortiert. Jede Empfehlung muss an mindestens einem Kriterium hängen und die Grenze des Kriteriums nennen.
Gewichtete Bewertungskriterien für Newsletter-Tool-Vergleiche
| Kriterium | Gewicht | Mess- oder Quellenpunkt | Grenze |
|---|---|---|---|
| Zustellbarkeits-Indikatoren | 30 % | CSA-/Versandreputation, dokumentierte Zustellwerte, Domain-Setup, SPF/DKIM/DMARC-Hinweise | Indikatorgewicht, keine eigene Seed-List- oder Inbox-Placement-Messung und kein Posteingangsversprechen |
| Datenschutz und Rechtsrahmen | 25 % | AVV/DPA, Datenregion, Subprozessoren, Transfermechanismus, Double-Opt-In-Nachweis | Keine Rechtsberatung und kein Account-Audit |
| Automation und Segmentierung | 20 % | Tags, Listenmodell, Trigger, Ausschlüsse, Käuferstatus, API-/Shop-/Digistore24-Anbindung | Keine produktive Langzeitnutzung in Kundenaccounts |
| Kosten und Skalierung | 15 % | Startpreis, Kontaktlimit, Versandlimit, Funktionslimit, Preissprung bei 1.000/10.000 Kontakten | Kein Checkout-Test; Preise sind Quellenstände |
| DACH-Bedienung und Support | 10 % | Sprache, Supportkanal, Dokumentation, deutschsprachige Reviews, Verein-/KMU-Fit | Kein eigener Support-Ticket-Test |
Quellen-Hierarchie
Wenn Quellen widersprechen, entscheidet nicht die lautere Aussage. Entscheidend ist die Quellenrolle: Gesetz oder Anbieter-Dokumentation vor Reviewgefühl, Reviewdaten vor Einzelmeinung, GSC-Daten vor Bauchgefühl zur Suchintention.
Quellenrang, Nutzung und Bewertungsgrenze
| Quelle | Nutzung | Grenze |
|---|---|---|
| 1. Primärquellen | Gesetze, Behörden, Gerichtsurteile, offizielle Anbieter-Dokumentation, Preis- und Hilfe-Center-Seiten | Höchste Priorität für Tatsachen; Marketingformulierungen werden nicht als neutrale Bewertung übernommen |
| 2. Öffentliche Reviewdaten | OMR Reviews, Capterra, G2 oder Trustpilot mit Note, Anzahl, Abrufdatum und wiederkehrenden Kritikpunkten | Bewertungen zeigen Nutzerwahrnehmung, nicht automatisch Rechtskonformität oder Zustellbarkeit |
| 3. Branchen- und Benchmarkquellen | Litmus, Mailchimp Benchmarks, HubSpot Reports, Bitkom und DACH-Studien als Kontext für Markt- und Kanalfragen | Benchmarkwerte werden nicht auf ein einzelnes Projekt übertragen, wenn Branche, Land oder Stichprobe nicht passen |
| 4. Eigene GSC- und Repo-Daten | Indexstatus, Impressionen, Klicks, Query-Familien, interne Links, Sitemap und Canonical-Signale | GSC erklärt Nachfrage und technische Sichtbarkeit, aber nicht automatisch Kaufbereitschaft |
| 5. KI-Zusammenfassung | Strukturieren, Gegenüberstellen, Lücken markieren und klare Handlungslogik formulieren | KI-Zusammenfassung zählt nur mit Quelle, Datum und Grenze; keine erfundenen Tests |
Quellenrollen
Eine Quelle beantwortet nie alle Fragen. OMR kann Nutzungsfrust zeigen, aber keinen AVV prüfen. Eine Anbieterpreisseite zeigt Tarife, aber keine Zustellbarkeit. Diese Trennung steht auch im Quellenverzeichnis.
Quellenrollen und Grenzen
| Quelle | Nutzung | Grenze |
|---|---|---|
| Anbieter- und Preisseiten | Tarife, Featuregrenzen, AVV/DPA-Hinweise, Datenregion | Herstellerangaben können Marketing-Sprache enthalten |
| OMR Reviews und Capterra | Bewertung, Bewertungsanzahl, deutschsprachige Nutzerhinweise | Reviews ersetzen keine Datenschutz- oder Funktionsprüfung |
| Quellenverzeichnis | Claim, Datum, Quelle, Bewertungsgrenze und Affiliate-Status | Quellenstand statt Echtzeitdaten |
| Google Search Console | Query-Intent, Länderanteile, Seiten mit Impressionen ohne Klick | GSC zeigt Nachfrage, keine Inhaltsqualität |
| Rechts- und Behördenquellen | DSGVO, Einwilligung, Auftragsverarbeitung, internationale Transfers | Keine individuelle Rechtsberatung |
Aktualitäts-Intervalle
Ein Stand-Datum ist nur nützlich, wenn klar ist, wann es neu geprüft wird. Die Prüfung richtet sich nach Risiko und Hebel: Preise, Recht, Affiliate-Status und nicht indexierte Money-Seiten werden früher kontrolliert als reine Begriffsartikel.
Refresh-Regeln nach Seitentyp und Datenrisiko
| Schritt | Input | Output |
|---|---|---|
| Money-Pages und Tool-Vergleiche | Preise, Affiliate-Status, Reviewzahlen, DACH-/DSGVO-Signale | Monatlich bei GSC-Auffälligkeit oder Tool-Änderung; sonst spätestens quartalsweise prüfen |
| Rechts- und Datenschutzseiten | DSGVO, UWG, TDDDG, DPF/SCC, Gerichtsurteile, Behördenhinweise | Bei Gesetzes-/Urteilsänderung sofort; sonst mit sichtbarem Quellenstand weiterführen |
| Branchen- und Benchmarkdaten | Jahresreports, Branchenbenchmarks, DACH-Studien | Beim neuen Report oder wenn eine Zahl in einem Artikel verwendet wird |
| Indexierung und interne Links | GSC-Cache, Sitemap, URL-Inspection, interne Linkanalyse | Bei frischem GSC-Stand und nach Content-/Layout-Rollouts prüfen |
KI-Ablauf
Die KI darf Inhalte strukturieren, vergleichen und formulieren. Sie darf keine erfundenen Tests, keine ungeprüften Superlative und keine Rechtsurteile als Tatsache ausgeben.
KI-Arbeitsablauf von Query bis Veröffentlichung
| Schritt | Input | Output |
|---|---|---|
| 1. Query lesen | GSC-Export, SERP-/PAA-Beobachtung, bestehende Seiten | Suchabsicht mit Seite, Query-Familie und Klicklücke |
| 2. Claims extrahieren | Anbietertexte, Review-Portale, interne Money-Pages | Liste aus Zahlen, Featureaussagen und Datenschutzbehauptungen |
| 3. Claim begrenzen | Quelle, Datum, Testart, fehlender Test | Claim mit Grenze: kein Account-Test, kein Checkout-Test, keine Rechtsberatung |
| 4. Entscheidung formulieren | Kriterientabelle, Zielgruppe, Kosten-/Datenschutzgrenze | Anbieterempfehlung mit Ausschlussgrund und nächstem Schritt |
| 5. Verifizieren | Build, Todo-Referenzen, Browser-Ansicht, Link-/Schema-Prüfung, Live-Browser-Check nach Deployment | Nur Änderungen mit lokaler Prüfung und Live-Abgleich werden als erledigte Todo abgeschlossen |
Grenzen der Methode: Was nicht behauptet wird
- Keine eigene Nutzung aller 12 Newsletter-Tools über mehrere Monate.
- Keine eigene Inbox-Placement-Messung mit Seed-Listen.
- Kein eigener Checkout-Test für jedes Preismodell.
- Kein eigener Support-Ticket-Test je Anbieter.
- Keine Rechtsberatung für konkrete Unternehmen, Vereine oder Shops.
Adjektive werden zu Kriterien
Wörter wie „gut“, „stark“, „einfach“, „fair“ oder „besser“ zählen nicht als Bewertung. Eine Aussage ist erst verwendbar, wenn sie in ein beobachtbares Merkmal übersetzt wurde: Preis, Limit, Review-Anzahl, Datenort, Funktionsgrenze, Support-Sprache, Einwilligungsnachweis oder URL.