đ EinfĂŒhrung
Das Zentralisieren Ihres Wissens ist die Mission von Mayday: es zu verwalten, zu steuern und dessen Wert zu kapitalisieren, um Ihren Beratern und Endkunden zu helfen, die richtigen Informationen so schnell wie möglich zu finden. Diese Integration ermöglicht es Ihnen nun, öffentliche Websites mit Ihrer Knowledge Base zu verbinden đ
â Was ist diese Funktion?
Es handelt sich um eine neue Datenquelle "Ăffentliche Website", die im Integrationskatalog von Mayday Admin (Verwaltungszentrum) verfĂŒgbar ist. Sie ergĂ€nzt die bestehenden Integrationen (z. B. SharePoint) und ermöglicht die Indexierung und Synchronisierung kompatibler öffentlicher Websites, um deren Inhalte in Mayday zugĂ€nglich und verwaltbar zu machen. Diese Funktion richtet sich an Administratoren, die externe Inhalte neben ihren internen Dokumenten zentralisieren möchten. đ§©
đ€ Wie funktioniert das?
â Ăffnen Sie den Integrationskatalog

Klicken Sie im Integrationskatalog auf Externe Inhalte.
â Erstellen Sie die Datenquelle

Erstellen Sie eine neue Datenquelle und wĂ€hlen Sie den Typ Ăffentliche Website.
đ„ Definieren Sie die Zugriffe
Definieren Sie die Gruppen, die Zugriff auf diese Datenquelle haben werden.
đŻ Definieren Sie den Umfang

FĂŒgen Sie die URL der zu verbindenden Website ein und klicken Sie auf ĂberprĂŒfen.
FĂŒgen Sie bei Bedarf Unter-URLs hinzu, um nur bestimmte Teile oder UnterdomĂ€nen zu verbinden (z. B. eine einzelne Sprache oder einen spezifischen Bereich eines Helpdesks).
đ Lassen Sie Mayday ĂŒberprĂŒfen
Mayday ĂŒberprĂŒft, ob die URL gĂŒltig ist, die Website existiert, ob es sich um eine zugĂ€ngliche Website handelt und ob eine
sitemap.xmlgefunden wird.Die
sitemap.xmlzeigt uns, welche Seiten abgerufen werden sollen, und wir ĂŒberprĂŒfen, ob die technischen Voraussetzungen gegeben sind, um die Informationen der Website korrekt zu sammeln.
â± WĂ€hlen Sie die Frequenz
WÀhlen Sie eine Synchronisation wöchentlich oder monatlich.
Alle indexierten Seiten werden mit dieser Frequenz aktualisiert (HinzugefĂŒgte, geĂ€nderte und gelöschte Inhalte).
Wenn sich die Informationen kaum Àndern, empfiehlt es sich, monatlich zu synchronisieren.
đ Starten Sie die erste Synchronisation
Wenn die URL validiert ist und Sie speichern, kann die erste Synchronisation 5 bis 10 Minuten dauern.
đĄ Sobald die URL validiert ist, zeigt ein Mouseover die Anzahl der erkannten Seiten an.
â ĂberprĂŒfen Sie den Status
Nach Abschluss der Synchronisation wechselt die Datenquelle in den Status Aktiv.
đ€ Ăffentliche Websites mit einem KI-Agenten verbinden
Sobald eine öffentliche Website verbunden und aktiv ist, können die Informationen darauf abgerufen werden:
Direkt ĂŒber die Suchmaschine.
In den Antworten, die von KI-Agenten bereitgestellt werden.
Um einem KI-Agenten Zugriff auf diese Informationen zu geben, muss ihm explizit Zugriff auf die Datenquelle gewÀhrt werden :

WĂ€hlen Sie im Tab âQuellenâ des KI-Agenten die Quelle âMayday Inhalteâ.
Aktivieren Sie die externe Datenquelle, die der gewĂŒnschten öffentlichen Website entspricht.
Nur die Gruppen, die Zugriff auf diese Datenquelle haben, können von den darin enthaltenen Informationen profitieren.
Um zu erfahren, wie Sie einen KI-Agenten personalisieren können, konsultieren Sie die entsprechende Dokumentation:
â Informationen und Grenzen
âč Wichtige Information
Die Anzahl der von einer Website abgerufenen Seiten ist auf 50.000 Seiten begrenzt.
Seiten, die ĂŒber diese Grenze hinausgehen, werden nicht abgerufen.
â Bekannte Grenzen
Viele Websites sind nicht geeignet, da sie den Abruf von Informationen auf die benötigte Art und Weise verhindern, und wir können diese EinschrÀnkungen nicht umgehen.
Beispiele fĂŒr ungeeignete Websites:
Websites mit sehr groĂem Umfang, mit einem enormen Volumen an Seiten (z. B. https://support.apple.com/fr-fr).
Single Page Apps (SPAs), die mit diesem Verfahren nicht kompatibel sind.
Help Centers Zendesk, die dieses Abrufverfahren ebenfalls blockieren.
Viele andere Websites, die durch diverse Methoden geschĂŒtzt sind, die nicht dem Standard robots.txt entsprechen.
â Zu wissen ĂŒber die URL-ĂberprĂŒfung
Einige ungeeignete Websites können bereits bei der URL-ĂberprĂŒfung blockiert werden, andere nicht.
Zu den FĂ€llen, die bereits bei der ĂberprĂŒfung erkannt werden können:
Websites, die das Scraping ausdrĂŒcklich ĂŒber ihre Datei robots.txt verbieten.
Websites, deren Sitemap mehr als 60 Sekunden zum Laden benötigt.
Es ist daher möglich, dass einige öffentliche Websites validiert werden, jedoch anschlieĂend nicht funktionieren.
ĂberprĂŒfen Sie daher den Status der Datenquelle einige Minuten nach dem Start der Synchronisation.
đĄ Gute Praktiken
Empfehlen Sie eine monatliche Synchronisierung, wenn sich der Inhalt der Website kaum verÀndert, um unnötige Updates zu vermeiden.
Verwenden Sie Unter-URLs, um den Umfang zu begrenzen (nach Sprache oder Bereich) und bequem unter der 50.000-Seiten-Grenze zu bleiben.
đ ZukĂŒnftiges
Die Abdeckung von Websites erweitern, um Ihnen die Verbindung zu möglichst vielen Websites zu ermöglichen.