👋 Einführung
Das Zentralisieren Ihres Wissens ist die Mission von Mayday: es zu verwalten, zu steuern und dessen Wert zu kapitalisieren, um Ihren Beratern und Endkunden zu helfen, die richtigen Informationen so schnell wie möglich zu finden. Diese Integration ermöglicht es Ihnen nun, öffentliche Websites mit Ihrer Knowledge Base zu verbinden 🌐
❓ Was ist diese Funktion?
Es handelt sich um eine neue Datenquelle "Öffentliche Website", die im Integrationskatalog von Mayday Admin (Verwaltungszentrum) verfügbar ist. Sie ergänzt die bestehenden Integrationen (z. B. SharePoint) und ermöglicht die Indexierung und Synchronisierung kompatibler öffentlicher Websites, um deren Inhalte in Mayday zugänglich und verwaltbar zu machen. Diese Funktion richtet sich an Administratoren, die externe Inhalte neben ihren internen Dokumenten zentralisieren möchten. 🧩
🤔 Wie funktioniert das?
⚙ Öffnen Sie den Integrationskatalog

Klicken Sie im Integrationskatalog auf Externe Inhalte.
➕ Erstellen Sie die Datenquelle

Erstellen Sie eine neue Datenquelle und wählen Sie den Typ Öffentliche Website.
👥 Definieren Sie die Zugriffe
Definieren Sie die Gruppen, die Zugriff auf diese Datenquelle haben werden.
🎯 Definieren Sie den Umfang

Fügen Sie die URL der zu verbindenden Website ein und klicken Sie auf Überprüfen.
Fügen Sie bei Bedarf Unter-URLs hinzu, um nur bestimmte Teile oder Unterdomänen zu verbinden (z. B. eine einzelne Sprache oder einen spezifischen Bereich eines Helpdesks).
🔎 Lassen Sie Mayday überprüfen
Mayday überprüft, ob die URL gültig ist, die Website existiert, ob es sich um eine zugängliche Website handelt und ob eine
sitemap.xmlgefunden wird.Die
sitemap.xmlzeigt uns, welche Seiten abgerufen werden sollen, und wir überprüfen, ob die technischen Voraussetzungen gegeben sind, um die Informationen der Website korrekt zu sammeln.
⏱ Wählen Sie die Frequenz
Wählen Sie eine Synchronisation wöchentlich oder monatlich.
Alle indexierten Seiten werden mit dieser Frequenz aktualisiert (Hinzugefügte, geänderte und gelöschte Inhalte).
Wenn sich die Informationen kaum ändern, empfiehlt es sich, monatlich zu synchronisieren.
🔄 Starten Sie die erste Synchronisation
Wenn die URL validiert ist und Sie speichern, kann die erste Synchronisation 5 bis 10 Minuten dauern.
💡 Sobald die URL validiert ist, zeigt ein Mouseover die Anzahl der erkannten Seiten an.
✅ Überprüfen Sie den Status
Nach Abschluss der Synchronisation wechselt die Datenquelle in den Status Aktiv.
🤖 Öffentliche Websites mit einem KI-Agenten verbinden
Sobald eine öffentliche Website verbunden und aktiv ist, können die Informationen darauf abgerufen werden:
Direkt über die Suchmaschine.
In den Antworten, die von KI-Agenten bereitgestellt werden.
Um einem KI-Agenten Zugriff auf diese Informationen zu geben, muss ihm explizit Zugriff auf die Datenquelle gewährt werden :

Wählen Sie im Tab „Quellen“ des KI-Agenten die Quelle „Mayday Inhalte“.
Aktivieren Sie die externe Datenquelle, die der gewünschten öffentlichen Website entspricht.
Nur die Gruppen, die Zugriff auf diese Datenquelle haben, können von den darin enthaltenen Informationen profitieren.
Um zu erfahren, wie Sie einen KI-Agenten personalisieren können, konsultieren Sie die entsprechende Dokumentation:
⛔ Informationen und Grenzen
ℹ Wichtige Information
Die Anzahl der von einer Website abgerufenen Seiten ist auf 50.000 Seiten begrenzt.
Seiten, die über diese Grenze hinausgehen, werden nicht abgerufen.
⚠ Bekannte Grenzen
Viele Websites sind nicht geeignet, da sie den Abruf von Informationen auf die benötigte Art und Weise verhindern, und wir können diese Einschränkungen nicht umgehen.
Beispiele für ungeeignete Websites:
Websites mit sehr großem Umfang, mit einem enormen Volumen an Seiten (z. B. https://support.apple.com/fr-fr).
Single Page Apps (SPAs), die mit diesem Verfahren nicht kompatibel sind.
Help Centers Zendesk, die dieses Abrufverfahren ebenfalls blockieren.
Viele andere Websites, die durch diverse Methoden geschützt sind, die nicht dem Standard robots.txt entsprechen.
✅ Zu wissen über die URL-Überprüfung
Einige ungeeignete Websites können bereits bei der URL-Überprüfung blockiert werden, andere nicht.
Zu den Fällen, die bereits bei der Überprüfung erkannt werden können:
Websites, die das Scraping ausdrücklich über ihre Datei robots.txt verbieten.
Websites, deren Sitemap mehr als 60 Sekunden zum Laden benötigt.
Es ist daher möglich, dass einige öffentliche Websites validiert werden, jedoch anschließend nicht funktionieren.
Überprüfen Sie daher den Status der Datenquelle einige Minuten nach dem Start der Synchronisation.
💡 Gute Praktiken
Empfehlen Sie eine monatliche Synchronisierung, wenn sich der Inhalt der Website kaum verändert, um unnötige Updates zu vermeiden.
Verwenden Sie Unter-URLs, um den Umfang zu begrenzen (nach Sprache oder Bereich) und bequem unter der 50.000-Seiten-Grenze zu bleiben.
🔭 Zukünftiges
Die Abdeckung von Websites erweitern, um Ihnen die Verbindung zu möglichst vielen Websites zu ermöglichen.