🌐 Eine öffentliche Website mit Mayday verbinden

👋 Einführung


Das Zentralisieren Ihres Wissens ist die Mission von Mayday: es zu verwalten, zu steuern und dessen Wert zu kapitalisieren, um Ihren Beratern und Endkunden zu helfen, die richtigen Informationen so schnell wie möglich zu finden. Diese Integration ermöglicht es Ihnen nun, öffentliche Websites mit Ihrer Knowledge Base zu verbinden 🌐

Was ist diese Funktion?


Es handelt sich um eine neue Datenquelle "Öffentliche Website", die im Integrationskatalog von Mayday Admin (Verwaltungszentrum) verfügbar ist. Sie ergänzt die bestehenden Integrationen (z. B. SharePoint) und ermöglicht die Indexierung und Synchronisierung kompatibler öffentlicher Websites, um deren Inhalte in Mayday zugänglich und verwaltbar zu machen. Diese Funktion richtet sich an Administratoren, die externe Inhalte neben ihren internen Dokumenten zentralisieren möchten. 🧩

🤔 Wie funktioniert das?


Öffnen Sie den Integrationskatalog

cleanshot_2025_11_03_at_19_33_17_2x___kuozskodqdxnuowl.png

Klicken Sie im Integrationskatalog auf Externe Inhalte.

Erstellen Sie die Datenquelle

cleanshot_2025_11_03_at_19_35_08_2x___tzltlbse93lmqzwd.png

Erstellen Sie eine neue Datenquelle und wählen Sie den Typ Öffentliche Website.

👥 Definieren Sie die Zugriffe

Definieren Sie die Gruppen, die Zugriff auf diese Datenquelle haben werden.

🎯 Definieren Sie den Umfang

cleanshot_2025_11_03_at_19_36_05_2x___258mrj3uwaowyhul.png

  • Fügen Sie die URL der zu verbindenden Website ein und klicken Sie auf Überprüfen.

  • Fügen Sie bei Bedarf Unter-URLs hinzu, um nur bestimmte Teile oder Unterdomänen zu verbinden (z. B. eine einzelne Sprache oder einen spezifischen Bereich eines Helpdesks).

🔎 Lassen Sie Mayday überprüfen

  • Mayday überprüft, ob die URL gültig ist, die Website existiert, ob es sich um eine zugängliche Website handelt und ob eine sitemap.xml gefunden wird.

  • Die sitemap.xml zeigt uns, welche Seiten abgerufen werden sollen, und wir überprüfen, ob die technischen Voraussetzungen gegeben sind, um die Informationen der Website korrekt zu sammeln.

Wählen Sie die Frequenz

  • Wählen Sie eine Synchronisation wöchentlich oder monatlich.

  • Alle indexierten Seiten werden mit dieser Frequenz aktualisiert (Hinzugefügte, geänderte und gelöschte Inhalte).

  • Wenn sich die Informationen kaum ändern, empfiehlt es sich, monatlich zu synchronisieren.

🔄 Starten Sie die erste Synchronisation

  • Wenn die URL validiert ist und Sie speichern, kann die erste Synchronisation 5 bis 10 Minuten dauern.

  • 💡 Sobald die URL validiert ist, zeigt ein Mouseover die Anzahl der erkannten Seiten an.

Überprüfen Sie den Status

Nach Abschluss der Synchronisation wechselt die Datenquelle in den Status Aktiv.

🤖 Öffentliche Websites mit einem KI-Agenten verbinden


Sobald eine öffentliche Website verbunden und aktiv ist, können die Informationen darauf abgerufen werden:

  • Direkt über die Suchmaschine.

  • In den Antworten, die von KI-Agenten bereitgestellt werden.

Um einem KI-Agenten Zugriff auf diese Informationen zu geben, muss ihm explizit Zugriff auf die Datenquelle gewährt werden :

cleanshot_2025_11_03_at_19_38_17_2x___xqjfoudfu3iiwnnd.png

  1. Wählen Sie im Tab „Quellen“ des KI-Agenten die Quelle „Mayday Inhalte“.

  2. Aktivieren Sie die externe Datenquelle, die der gewünschten öffentlichen Website entspricht.

Nur die Gruppen, die Zugriff auf diese Datenquelle haben, können von den darin enthaltenen Informationen profitieren.

Um zu erfahren, wie Sie einen KI-Agenten personalisieren können, konsultieren Sie die entsprechende Dokumentation:

Informationen und Grenzen


Wichtige Information


  • Die Anzahl der von einer Website abgerufenen Seiten ist auf 50.000 Seiten begrenzt.

  • Seiten, die über diese Grenze hinausgehen, werden nicht abgerufen.

Bekannte Grenzen


  • Viele Websites sind nicht geeignet, da sie den Abruf von Informationen auf die benötigte Art und Weise verhindern, und wir können diese Einschränkungen nicht umgehen.

  • Beispiele für ungeeignete Websites:

    • Websites mit sehr großem Umfang, mit einem enormen Volumen an Seiten (z. B. https://support.apple.com/fr-fr).

    • Single Page Apps (SPAs), die mit diesem Verfahren nicht kompatibel sind.

    • Help Centers Zendesk, die dieses Abrufverfahren ebenfalls blockieren.

    • Viele andere Websites, die durch diverse Methoden geschützt sind, die nicht dem Standard robots.txt entsprechen.

Zu wissen über die URL-Überprüfung


  • Einige ungeeignete Websites können bereits bei der URL-Überprüfung blockiert werden, andere nicht.

  • Zu den Fällen, die bereits bei der Überprüfung erkannt werden können:

    • Websites, die das Scraping ausdrücklich über ihre Datei robots.txt verbieten.

    • Websites, deren Sitemap mehr als 60 Sekunden zum Laden benötigt.

Es ist daher möglich, dass einige öffentliche Websites validiert werden, jedoch anschließend nicht funktionieren.
Überprüfen Sie daher den Status der Datenquelle einige Minuten nach dem Start der Synchronisation.

💡 Gute Praktiken


  • Empfehlen Sie eine monatliche Synchronisierung, wenn sich der Inhalt der Website kaum verändert, um unnötige Updates zu vermeiden.

  • Verwenden Sie Unter-URLs, um den Umfang zu begrenzen (nach Sprache oder Bereich) und bequem unter der 50.000-Seiten-Grenze zu bleiben.

🔭 Zukünftiges


Die Abdeckung von Websites erweitern, um Ihnen die Verbindung zu möglichst vielen Websites zu ermöglichen.

Hat dir dieser Artikel geholfen?

Kontaktiere uns