Zum Hauptinhalt springen

🌐 Eine öffentliche Website mit Mayday verbinden

👋 EinfĂŒhrung


Das Zentralisieren Ihres Wissens ist die Mission von Mayday: es zu verwalten, zu steuern und dessen Wert zu kapitalisieren, um Ihren Beratern und Endkunden zu helfen, die richtigen Informationen so schnell wie möglich zu finden. Diese Integration ermöglicht es Ihnen nun, öffentliche Websites mit Ihrer Knowledge Base zu verbinden 🌐

❓ Was ist diese Funktion?


Es handelt sich um eine neue Datenquelle "Öffentliche Website", die im Integrationskatalog von Mayday Admin (Verwaltungszentrum) verfĂŒgbar ist. Sie ergĂ€nzt die bestehenden Integrationen (z. B. SharePoint) und ermöglicht die Indexierung und Synchronisierung kompatibler öffentlicher Websites, um deren Inhalte in Mayday zugĂ€nglich und verwaltbar zu machen. Diese Funktion richtet sich an Administratoren, die externe Inhalte neben ihren internen Dokumenten zentralisieren möchten. đŸ§©

đŸ€” Wie funktioniert das?


⚙ Öffnen Sie den Integrationskatalog

cleanshot_2025_11_03_at_19_33_17_2x___kuozskodqdxnuowl.png

Klicken Sie im Integrationskatalog auf Externe Inhalte.

➕ Erstellen Sie die Datenquelle

cleanshot_2025_11_03_at_19_35_08_2x___tzltlbse93lmqzwd.png

Erstellen Sie eine neue Datenquelle und wĂ€hlen Sie den Typ Öffentliche Website.

đŸ‘„ Definieren Sie die Zugriffe

Definieren Sie die Gruppen, die Zugriff auf diese Datenquelle haben werden.

🎯 Definieren Sie den Umfang

cleanshot_2025_11_03_at_19_36_05_2x___258mrj3uwaowyhul.png

  • FĂŒgen Sie die URL der zu verbindenden Website ein und klicken Sie auf ÜberprĂŒfen.

  • FĂŒgen Sie bei Bedarf Unter-URLs hinzu, um nur bestimmte Teile oder UnterdomĂ€nen zu verbinden (z. B. eine einzelne Sprache oder einen spezifischen Bereich eines Helpdesks).

🔎 Lassen Sie Mayday ĂŒberprĂŒfen

  • Mayday ĂŒberprĂŒft, ob die URL gĂŒltig ist, die Website existiert, ob es sich um eine zugĂ€ngliche Website handelt und ob eine sitemap.xml gefunden wird.

  • Die sitemap.xml zeigt uns, welche Seiten abgerufen werden sollen, und wir ĂŒberprĂŒfen, ob die technischen Voraussetzungen gegeben sind, um die Informationen der Website korrekt zu sammeln.

⏱ WĂ€hlen Sie die Frequenz

  • WĂ€hlen Sie eine Synchronisation wöchentlich oder monatlich.

  • Alle indexierten Seiten werden mit dieser Frequenz aktualisiert (HinzugefĂŒgte, geĂ€nderte und gelöschte Inhalte).

  • Wenn sich die Informationen kaum Ă€ndern, empfiehlt es sich, monatlich zu synchronisieren.

🔄 Starten Sie die erste Synchronisation

  • Wenn die URL validiert ist und Sie speichern, kann die erste Synchronisation 5 bis 10 Minuten dauern.

  • 💡 Sobald die URL validiert ist, zeigt ein Mouseover die Anzahl der erkannten Seiten an.

✅ ÜberprĂŒfen Sie den Status

Nach Abschluss der Synchronisation wechselt die Datenquelle in den Status Aktiv.

đŸ€– Öffentliche Websites mit einem KI-Agenten verbinden


Sobald eine öffentliche Website verbunden und aktiv ist, können die Informationen darauf abgerufen werden:

  • Direkt ĂŒber die Suchmaschine.

  • In den Antworten, die von KI-Agenten bereitgestellt werden.

Um einem KI-Agenten Zugriff auf diese Informationen zu geben, muss ihm explizit Zugriff auf die Datenquelle gewÀhrt werden :

cleanshot_2025_11_03_at_19_38_17_2x___xqjfoudfu3iiwnnd.png

  1. WĂ€hlen Sie im Tab „Quellen“ des KI-Agenten die Quelle „Mayday Inhalte“.

  2. Aktivieren Sie die externe Datenquelle, die der gewĂŒnschten öffentlichen Website entspricht.

Nur die Gruppen, die Zugriff auf diese Datenquelle haben, können von den darin enthaltenen Informationen profitieren.

Um zu erfahren, wie Sie einen KI-Agenten personalisieren können, konsultieren Sie die entsprechende Dokumentation:

⛔ Informationen und Grenzen


â„č Wichtige Information


  • Die Anzahl der von einer Website abgerufenen Seiten ist auf 50.000 Seiten begrenzt.

  • Seiten, die ĂŒber diese Grenze hinausgehen, werden nicht abgerufen.

⚠ Bekannte Grenzen


  • Viele Websites sind nicht geeignet, da sie den Abruf von Informationen auf die benötigte Art und Weise verhindern, und wir können diese EinschrĂ€nkungen nicht umgehen.

  • Beispiele fĂŒr ungeeignete Websites:

    • Websites mit sehr großem Umfang, mit einem enormen Volumen an Seiten (z. B. https://support.apple.com/fr-fr).

    • Single Page Apps (SPAs), die mit diesem Verfahren nicht kompatibel sind.

    • Help Centers Zendesk, die dieses Abrufverfahren ebenfalls blockieren.

    • Viele andere Websites, die durch diverse Methoden geschĂŒtzt sind, die nicht dem Standard robots.txt entsprechen.

✅ Zu wissen ĂŒber die URL-ÜberprĂŒfung


  • Einige ungeeignete Websites können bereits bei der URL-ÜberprĂŒfung blockiert werden, andere nicht.

  • Zu den FĂ€llen, die bereits bei der ÜberprĂŒfung erkannt werden können:

    • Websites, die das Scraping ausdrĂŒcklich ĂŒber ihre Datei robots.txt verbieten.

    • Websites, deren Sitemap mehr als 60 Sekunden zum Laden benötigt.

Es ist daher möglich, dass einige öffentliche Websites validiert werden, jedoch anschließend nicht funktionieren.
ÜberprĂŒfen Sie daher den Status der Datenquelle einige Minuten nach dem Start der Synchronisation.

💡 Gute Praktiken


  • Empfehlen Sie eine monatliche Synchronisierung, wenn sich der Inhalt der Website kaum verĂ€ndert, um unnötige Updates zu vermeiden.

  • Verwenden Sie Unter-URLs, um den Umfang zu begrenzen (nach Sprache oder Bereich) und bequem unter der 50.000-Seiten-Grenze zu bleiben.

🔭 ZukĂŒnftiges


Die Abdeckung von Websites erweitern, um Ihnen die Verbindung zu möglichst vielen Websites zu ermöglichen.

Hat dir dieser Artikel geholfen?