Microsoft SharePoint Connector

Ähnliche Dokumente
LDAP Connector. Installation und Konfiguration. Version 2017 Summer Release

EMC Documentum Connector

JiveSoftware Jive Connector

SharePoint Online Connector

IBM Lotus Connector. Installation und Konfiguration. Version 2016 Fall Release

Microsoft File Connector (Legacy)

Kerberos Authentifizierung

Konfiguration von Fabasoft Mindbreeze Enterprise für IBM Lotus

Konfiguration des Web Connectors

Google Search Appliance Feed Indizierung mit Mindbreeze InSpire

Microsoft Exchange 2010 Connector

Atlassian Confluence Sitemap Generator Add-On

Mindbreeze Web Parts. für Microsoft SharePoint. Version 2016 Fall Release

Konfiguration des Novell GroupWise Connectors

Microsoft Exchange 2010 Connector

Benachrichtigungen. Installation und Konfiguration. Version 2017 Summer Release

Einrichten der Mindbreeze InSpire Appliance Setzen einer statischen Netzwerkadresse von einem Microsoft Windows PC. Version 2017 Summer Release

Vokabulare für Synonyme und Autovervollständigung. Version 2016 Fall Release

Web Connector. Installation und Konfiguration. Version 2016 Fall Release

app.telemetry Statistiken zu Suchanfragen ad-hoc Reports und Statistik Dashboard Charts Version 2017 Summer Release

White Paper. Domänenübergreifende Lizenzprüfung Winter Release

Office 365 User Integration

Datenbank auf neuen Server kopieren

Tastaturbedienung. Version 2016 Fall Release Status: 04. Mai 2016

Windows 10 Passwortwechsel

Indizierungs- und Suchlogs. Version 2015

STARFACE MS Outlook Connector 2.0

Pervasive.SQL ODBC Treiber. ab ABACUS er-Version Installationsanleitung

So legen Sie eine gelöschte Resource wieder an

Office 365 User Integration

White Paper. Installation und Konfiguration der PVP Integration

Passwortwechsel mit Windows

MGE Datenanbindung in GeoMedia

Anleitung zur Integration der /data.mill API in SAP Java Applikationen

Network-Attached Storage mit FreeNAS

2.3 - Das Verwaltungsmodul moveon installieren - SQL-Version

Komponenten und Komponententypen

Softwareproduktinformation

Entity Recognition. Konfiguration. Version 2017 Summer Release

Release Notes für Mindbreeze InSpire. Version 2015 Summer Release

ColdFusion Konfiguration für den Betrieb mit hyscore. ColdFusion Administrator. Notwendige Konfiguration für hyscore. PDF-Dokument: config_cf10.

Technische Informationen

Sequenzer als Service: Konfiguration Service-Modus für Workstations einrichten und Sequenzen konfigurieren

Security. Stefan Dahler. 6. Zone Defense. 6.1 Einleitung

Typo 3 installieren. Schritt 1: Download von Typo3

Zugriff von zuhause auf die Netzlaufwerke der Schule

NoSpamProxy 12.0 Outlook Add-In Gruppenrichtlinien. Protection Encryption Large Files

Installation von Microsoft SQL Server 2014 Express in Verbindung mit Postbuch

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen mit SQL Server-Daten

Dokumente verwalten mit Magnolia das Document Management System (DMS)

BusinessPlanner Installationsanleitung

White Paper. Installation und Konfiguration der Fabasoft Integration für CalDAV

Durch einen kleinen Geldbetrag kann mehr Speicher dazu gekauft werden. Eines der Systeme mit guten Referenzen ist mydrive.

T. Csizmadia, DEVWARE GmbH 1.2

Einrichten von CMSMobile

Kurzanleitung für den MyDrive Client

Technische Informationen

TimeMachine. Installation und Konfiguration. Version 1.4. Stand Dokument: install.odt. Berger EDV Service Tulbeckstr.

Anleitung zum Prüfen von WebDAV

Anwenderdokumentation anthesis Outlook Add-In

Installationsanleitung E-Newsletter

Installation DataExpert Paynet-Adapter (SIX)

Authentication Policy. Konfigurationsbeispiel ZyXEL ZyWALL USG-Serie. Juni 2010 / HAL

Übung - Überwachen und Verwalten von Systemressourcen in Windows Vista

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen zu SQL Server Analysis Services-Daten

White Paper. Konfiguration und Verwendung des Auditlogs Winter Release

Ein neues Outlook Konto können Sie im Control Panel über den Eintrag Mail erstellen.

Windows 10 Kein Zugriff mehr auf Projektverzeichnisse/Gruppenpostfächer

Installations Guide für YAJSW und DTLDAP

FINISS Support Team Konfiguration des Datafeed Zugriffs auf Markt Daten via FINISS

Process: Installationsleitfaden

BSCW-Benutzung Kurze Einführung

Installation Netzwerk Client

Docusnap X Docusnap Web Installation auf Server 2008 R2. Installationsbeschreibung für Windows Server 2008 R2

Sichern des Acrolinx Servers mit HTTPS

Konfiguration von Trusted Peer Authentication für die Mindbreeze Search Appliance. Version 2017 Summer Release

Folgende Voraussetzungen für die Konfiguration müssen erfüllt sein:

DoIT! ExchangeSync. DoIT! ExchangeSync Version 1.0. S eite 1 von 7

FileZilla - Anleitung

Handbuch Xlive FILE ROUTER Intrexx Konfiguration

Erstellen sicherer ASP.NET- Anwendungen

HOSTED SHAREPOINT. Skyfillers Kundenhandbuch. Generell Online Zugang SharePoint Seite... 2 Benutzerpasswort ändern... 2

VPN für Linux (Ubuntu + Kubuntu)

BlackBerry Dynamics einrichten - Android

SQL Server 2016 Installationsanleitung

White Paper. Fabasoft egov-vps

Docusnap X Discovery Service. Installation und Konfiguration

SMARTentry Notification

Administratives. Modul WEB Info. Übersetzungs- oder Lokalisierungsübersicht

Collax Web Application

Installationsanleitung Laurus Projekte System (Aufgaben / Projekte mit Gantt Chart)

Aktualisieren auf Adobe Experience Manager Forms on JEE für Websphere

Browser mit SSL und Java, welcher auf praktisch jedem Rechner ebenso wie auf vielen mobilen Geräten bereits vorhanden ist

STP Handout. bea-unterstützung im LEXolution.DMS Outlook Desk

1 Axis Kamera-Konfiguration IP-Konfiguration Datum und Uhrzeit einstellen Die Option Anonymous viewer login...

Transkript:

Microsoft SharePoint Connector Installation und Konfiguration Version 2017 Winter Release Status: 13. April 2017

Copyright Mindbreeze GmbH, A-4020 Linz, 2017. Alle Rechte vorbehalten. Alle verwendeten Hard- und Softwarenamen sind Handelsnamen und/oder Marken der jeweiligen Hersteller. Diese Unterlagen sind streng vertraulich. Durch die Übermittlung und Präsentation dieser Unterlagen alleine werden keine Rechte an unserer Software, an unseren Dienstleistungen und Dienstleistungsresultaten oder sonstigen geschützten Rechten begründet. Die Weitergabe, Veröffentlichung oder Vervielfältigung ist nicht gestattet. Aus Gründen der einfacheren Lesbarkeit wird auf die geschlechtsspezifische Differenzierung, z.b. Benutzer/- innen, verzichtet. Entsprechende Begriffe gelten im Sinne der Gleichbehandlung grundsätzlich für beide Geschlechter. Microsoft SharePoint Connector 2

Inhalt 1 Installation 4 1.1 Erweitern von Mindbreeze für den Gebrauch des Microsoft SharePoint Connectors 4 1.2 Benötigte Crawling-User Rechte 4 1.3 Installation von Services für Microsoft SharePoint 6 1.4 Installation des Sharepoint SSL Zertifikats für Java 7 2 Konfiguration von Mindbreeze 7 2.1 Konfiguration der Datenquelle 9 2.1.1 Microsoft Sharepoint Connection 9 2.1.2 Crawl URLs 10 2.1.3 Security Settings 10 2.1.4 Alias URLs Mapping 11 2.1.5 Content Type Settings 11 2.1.6 Synchronization Settings 12 2.1.7 Crawler Performance Settings 12 2.1.8 Content Metadata Extract Setting 12 2.2 Bearbeiten von Microsoft Office Dokumenten im SharePoint 13 2.3 Konfiguration der integrierten Authentifikation des Microsoft SharePoint Crawlers 13 3 Problemlösungsmöglichkeiten 14 3.1 Crawling User Unauthorized 14 3.2 SharePoint URL FQDN 15 3.3 SharePoint Webservices mit SOAP-Calls mittels curl testen 16 3.3.1 SOAP-Calls vorbereiten 16 3.3.2 SOAP-Calls testen 17 3.4 Dokumente von Crawler IGNORED 19 3.5 Konfiguration von Metadatenkonvertierungsregeln in der ConnectorMetadataMapping.xml Datei 20 3.5.1 Content XPath Konfiguration 20 3.5.2 Referenzierung 20 3.5.3 String Formatierung 20 4 Deinstallation des Microsoft SharePoint Connectors 21 Microsoft SharePoint Connector 3

1 Installation Bevor der Microsoft SharePoint Connector installiert wird, muss sichergestellt werden, dass der Mindbreeze Server bereits installiert ist und dieser Connector auch in der Mindbreeze Lizenz inkludiert ist. 1.1 Erweitern von Mindbreeze für den Gebrauch des Microsoft SharePoint Connectors Der Microsoft SharePoint Connector ist als ZIP File erhältlich. Dieses File muss wie folgt im Mindbreeze Server via mesextension.exe registriert werden: mesextension --interface=plugin --type=archive -- file=microsoftsharepointconnector<version>.zip install ACHTUNG: Der Connector kann über mesextention auch upgedatet werden. Mindbreeze wird automatisch die erforderlichen Updates durchführen. 1.2 Benötigte Crawling-User Rechte Der Microsoft SharePoint Connector erlaubt das Crawlen und Durchsuchen von Microsoft SharePoint Elementen und Objekten. Um eine Microsoft Sharepoint Datenquelle konfigurieren zu können, müssen folgende Voraussetzungen erfüllt sein Die verwendete Microsoft SharePoint Version muss SharePoint 2013, SharePoint 2010 oder SharePoint 2007 sein. Für eine Kerberos Authentifizierung des Service Benutzers auf dem Mindbreeze Node mit der SharePoint Datenquelle muss der Benutzer zumindest Full Read Rechte in der SharePoint Web Applikation besitzen. Kerberos muss als Authentifizierungs - Methode für diese Web Applikation ausgewählt sein. Für eine Basis Authentifizierung mittels Benutzernamen und Passwort eines Accounts mit vollen Leserechten auf der SharePoint Web Applikation muss dies in der Mindbreeze Manager Konfiguration unterstützt werden. Für diese Web Applikationen muss Basic Authentication als Authentifizierungsrichtlinie ausgewählt werden. Ein Benutzer kann wie folgt zu den SharePoint Site Administratoren hinzugefügt werden: Central Administration -> Application Management -> Manage web applications Web Application -> User Policy (Siehe unten) Dem Service-Benutzer Full Read -Rechte geben. Microsoft SharePoint Connector 4

Konfiguration von Authentication Provider : Navigiere zu Central Administration -> Application Management Web Application auswählen Authentication Providers konfigurieren (Sieh unten) Für NTLM und Basic Authentication soll der Benutzer-Name und Passwort im Mindbreeze Konfiguration eingegeben werden. (Siehe Abschnitt 2.1) Microsoft SharePoint Connector 5

Für das Crawlen von Benutzerprofile in SharePoint 2013 muss der Service Benutzer zur List der Search Crawlers hinzugefügt werden. Dafür navigieren Sie zu Central Administratation Manage service application User Profile Service Application und fügen Sie den Service Benutzer zur Liste der Search Crawlers hinzu. (Siehe unten) 1.3 Installation von Services für Microsoft SharePoint Die Services für Microsoft SharePoint müssen folgendermaßen installiert werden: 1. Login auf dem SharePoint Server dessen Seiten vom Connector gecrawlt werden sollen. 2. Öffnen des ISAPI Verzeichnisses in SharePoint. Wird die Standard Installation verwendet, lautet der Verzeichnispfad C:\Program Files\Common Files\Microsoft Shared\web server extensions\14\isapi (SharePoint 2010) und C:\Program Files\Common Files\Microsoft Shared\web server extensions\15\isapi (SharePoint 2013) 3. Kopieren Sie diese Files aus den Systemvoraussetzungen, wie in Schritt 2 definiert, in den ISAPI Ordner. GSBulkAuthorization.asmx GSBulkAuthorizationdisco.aspx GSBulkAuthorizationwsdl.aspx GSSiteDiscovery.asmx GSSiteDiscoverydisco.aspx GSSiteDiscoverywsdl.aspx GssAcl.asmx GssAcldisco.aspx GssAclwsdl.aspx MesAcl.asmx Microsoft SharePoint Connector 6

MesAcldisco.aspx MesAclwsdl.aspx 4. Die Konnektivität des Web Servers kann mit folgenden URLs verifiziert werden: http://mycomp.com/_vti_bin/gsbulkauthorization.asmx http://mycomp.com/_vti_bin/gssitediscovery.asmx http://mycomp.com/_vti_bin/gssacl.asmx http://mycomp.com ist die SharePoint Seiten URL. Nachdem die oben genannten URLs geöffnet wurden, sollten alle Web Methoden des Web Services sichtbar sein. 1.4 Installation des Sharepoint SSL Zertifikats für Java Speichern Sie die SSL Zertifikat des Sharepoints z.b. in c:\temp\sharepointserver.cer Installation: <jre_home>/bin>keytool -import -noprompt -trustcacerts -alias sharepointserver.cer -file /tmp/sharepointserver.cer -keystore../lib/security/cacerts storepass changeit 2 Konfiguration von Mindbreeze Wählen Sie die Advanced Installation: Microsoft SharePoint Connector 7

Klicken sie auf Indices und auf das Add new index Symbol um einen neuen Index zu erstellen. Eingabe eines neuen Index Pfades z.b, /data/indices/sharepointt. Falls notwendig muss der Display Name des Index Services und des zugehörigen Filter Services geändert werden. Mit Add new custom source unten rechts kann eine neue Datenquelle hinzugefügt werden. Microsoft SharePoint Connector 8

2.1 Konfiguration der Datenquelle 2.1.1 Microsoft Sharepoint Connection Diese Information wird nur für Basic Authentifizierung benötigt: SharePoint Server URL: Um den gesamten Inhalt von Microsoft SharePoint zu crawlen, muss der URL von Microsoft SharePoint Servers in das Feld eingegeben werden. Es ist auch möglich nur eine bestimmte SharePoint Seite URL hier einzutrage. Damit wird nur diese Seite gecrawlt. Die Anmeldedaten für diese Seite sollen über Endpoints im Network Registerkarte konfiguriert werden wenn kein Kerberos Authentisierung vewendet wird. SharePoint Server URL und Location Feld im Endpoint müssen identisch sein. Logon Account For Principal Resolution, Domain und Password: Falls ein Principal Resolution Cache Service oder Kerberos verwendet wird, sind diese Anmeldedaten nicht notwendig. Wenn ein Sharepoint Principal Cache verwendet wird, können die Anmeldeinformationen nicht in der Datenquelle definiert werden. Sondern sie werden im Network-Reiter unter Credentials einmal konfiguriert und für mehrere SharePoint Server URLs unter Endpoints ausgewählt. Microsoft SharePoint Connector 9

2.1.2 Crawl URLs Es ist möglich die zu crawlenden Daten z.b. bestimmte Seiten zu limitieren. Dafür müssen die zu crawlenden Seiten in das Feld Included URL eingefügt werden. Es ist auch möglich, Seiten auszuschließen oder nicht zu crawlen. Diese Seiten müssen in das Feld Excluded URL eingetragen werden. Es ist möglich hier eine Regular Expression zu verwenden. Eine Regular Expression muss regexp: oder regexpignorecase: Präfix haben. Für das Crawlen von Benutzer Profilen muss Crawl User Profile ausgewählt werden und die MySite URL und Collection Name for User Profiles entsprechend konfiguriert werden. 2.1.3 Security Settings Durch das Verschieben von Dokumente von einem Verzeichnis zum anderen Verzeichnis ändern sich auch URLs dieser Dokumente. Um diese Änderungen auch im Index zu aktualisieren sollte die Track Document URL Changes Option ausgewählt werden. Resolve Sharepoint Groups sollte nicht ausgewählt werden, wenn Sharepoint Principals Cache Service ausgewählt ist. Mit der Konfiguration von Normalize ACLs werden alle AD Benutzer und Gruppen in ACLs in Distinguished Name Format umgewandelt. Für das Crawlen von SharePoint Seiten mit anonymer Zugriffsrechten muss Include Documents without ACLs ausgewählt werden. Um SharePoint Seiten durch aktivieren von bestimmten Feature vom Crawlen auszuschließen ist es notwendig die ID (GUID) von diesen Features im Feld Exclude Documents From Sites With These Features einzutragen. Microsoft SharePoint Connector 10

2.1.4 Alias URLs Mapping Alias URLs ermöglichen es, interne URLs von Sharepoint zu überschreiben und zu indizieren. Das ist nur dann notwendig wenn der Benutzer keine Zugriffsrechte auf diese interne URLs haben. Die Alias URLs sind entsprechend der Alternative Access Mapping am Sharepoint Server zu konfiguriert. 2.1.5 Content Type Settings Um nicht publizierte Dokumente crawlen zu können, muss die Include Unpublished Documents selektiert werden. Um weitere spezifische Inhaltstypen crawlen zu können, müssen diese dem Additional Content Types Muster entsprechen. Der SharePoint Connector verwendet eine vorkonfigurierte Content Type Mapping Description XML Datei, die in der Connector Archivdatei vorhanden ist. Falls eine spezifische Änderung erwünscht ist kann diese Datei bearbeitet werden und in einem anderen Verzeichnis gespeichert werden. Um diese bearbeitete Konfiguration zu verwenden ist es notwendig im Content Type Mapping Description File Feld der Pfad zur der bearbeitete Datei einzutragen. In Content Type Mapping Description Datei kann man Regeln für bestimmte Inhaltstypen definieren. Z.B. nur Dokumente von Inhaltstype Document zu crawlen. Daher kann es sein, dass nach der Änderung von dieser Regel das Löschen von bereits indizierten anderen Inhaltstypen vom Index notwendig wird. Mit der Option Delete Ignored Documents From Index können dann diese Dokumente vom Index gelöscht werden. Microsoft SharePoint Connector 11

2.1.6 Synchronization Settings Synchronize with Index on Startup: Der crawler speichert lokal sein Zustand vom letzten Lauf. Dadurch wird das Abgleichen einzelner Dokumente im Index mit denen vom Sharepoint Server vermieden. Manchmal, wegen Transport oder Filter Problemen, kann es passieren dass dieser Zustand von Index abweicht. Um diese Abweichung zu korrigieren ist die Synchronize with Index on Startup Option auszuwählen. Synchronization Timeout (Hours): Gibt eine Anzahl von Stunden an, nach dem das Synchronisieren abgebrochen und er gespeicherte Zustand verwendet wird. Reset Connector State if it is not consistent with index: Wenn der crawler Status nicht konsistent mit dem Indexstatus ist, wird er gelöscht und ein voller Indizierungslauf gestartet. Wird diese Option deaktiviert, so wird der Status nicht gelöscht. 2.1.7 Crawler Performance Settings Bach Size: Definiert die Anzahl von Dokumente die von Sharepoint Server geholt werden, bevor sie zum Index geschickt werden. Number of Threads: Threads, die parallel die gesammlten Dokumente an Index schicken. Document Size Limit (MB): Dieses Wert muss Maximum Input Size (MB) von Filter Service entsprechen. 2.1.8 Content Metadata Extract Setting Um Metadaten aus dem HTML Inhalt zu extrahieren wird folgende Konfiguration benötigt. Microsoft SharePoint Connector 12

Name: Name des Metadatums. XPath: zum Metadatumswert. Format: String, Datum, URL, Path und Signatur. Format Options: 2.2 Bearbeiten von Microsoft Office Dokumenten im SharePoint Beim Öffnen der Office Dokumente vom Suchresultat im Internet Explorer können die geöffneten Dokumente bearbeitet und im SharePoint gespeichert werden. Dafür werden Schreibrechte auf das Dokument benötigt. Bei der Verwendung anderer Browser werden die Dokumente schreibgeschützt geöffnet. 2.3 Konfiguration der integrierten Authentifikation des Microsoft SharePoint Crawlers Windows: Wenn die Installation auf einem Microsoft Windows Server durchgeführt wird, kann die Kerberos Authentifizierung des aktuellen Mindbreeze Services für den Microsoft SharePoint Crawler benutzt werden. In diesem Fall muss der Service Benutzer für die Microsoft SharePoint Web Services authentifiziert sein. Linux: Für eine Installation unter Linux müssen folgende Schritte ausgeführt werden: Erzeugen eines keytab für den privileged user mittels ktutil: o Start ktutil on the command line and carry out these commands in the ktutil shell: addent -password -p <principal>@<realm> -k 0 -e arcfour-hmac (for example: addent -password -p crawler_user@mydomain.com -k 0 -e arcfour-hmac) Enter the user password. wkt <keyab_path> Hochladen des Keytab: Microsoft SharePoint Connector 13

Konfiguration des Keytab und des enthaltenen Principals (im Reiter Authentication): WICHTIG: Das keytab muss den Schlüssel des oben genannten Benutzers enthalten. Das keytab für das Mindbreeze Client Service kann hier nicht verwendet werden. 3 Problemlösungsmöglichkeiten Allgemein können Probleme bei der Indizierung von SharePoint-Datenquellen zuallererst in den entsprechenden Logdateien des Mindbreeze Log-Ordners gefunden werden. Im Mindbreeze Basis-Log-Ordner gibt es für den konfigurierten SharePoint-Crawler einen entsprechenden Unterordner der z.b. wie folgt heißen könnte: C:\logs\current\log-mescrawler_launchedservice- Microsoft_SharePoint_Sharepoint+2007 Darin befindet sich dann für jeden Crawl-Lauf ein Datums-Unterordner und darin zwei Log-Dateien: log-mescrawler_launchedservice.log: Log-Datei mit allen relevanten Log-Informationen und möglichen Fehlern mes-pusher.csv: CSV-Datei mit SharePoint-URLs die vom Crawler gefunden wurden und deren Status Sollte die Datei mes-pusher.csv nicht auftauchen, gibt es vermutlich ein Konfigurations- oder Berechtigungsproblem, welches anhand der Fehlermeldungen in der ersten Log-Datei analysiert werden muss. 3.1 Crawling User Unauthorized Problem-Verhalten: Der Crawler bekommt keine Dokumente von SharePoint und erzeugt auch keine Datei-Liste in der Logdatei mes-pusher.csv. In der Logdatei log-mescrawler_launchedservice.log ist eine Fehlermeldung folgender Art zu finden: com.mindbreeze.enterprisesearch.gsabase.crawler.initializationexception: Invalid connector config: message Cannot connect to the given SharePoint Site URL with the supplied Domain/Username/Password.Reason:(401)Unauthorized oder: com.mindbreeze.enterprisesearch.gsabase.crawler.initializationexception: Unable to set connector config, response message: Cannot connect to the Services for SharePoint on the given Crawl URL with the supplied Microsoft SharePoint Connector 14

Domain/Username/Password.Reason:(401)Unauthorized, status message:null, status code:5223 (INVALID_CONNECTOR_CONFIG) oder: enterprise.connector.sharepoint.wsclient.soap.gsbulkauthorizationws INTERNALWARNING: Can not connect to GSBulkAuthorization web service. cause:(401)unauthorized Problembeschreibung und -lösung: Aufgrund von Berechtigungsproblemen ist es dem verwendeten Service-Benutzer nicht möglich Datei-Auflistungen von SharePoint abzufragen. Folgende Punkte sind zu prüfen: Verwendete Authentisierungsmethoden bei SharePoint/IIS prüfen: o o Soll Integrated/Kerberos Authentisierung verwendet werden, muss das Mindbreeze Node Service unter diesem Benutzer-Account laufen. Für NTLM/Basic Authentisierung muss der Service-Benutzer in der Mindbreeze Konfiguration der SharePoint Datenquelle eingetragen sein. Berechtigungen des verwendeten Service-Benutzers in SharePoint prüfen GssSiteDiscovery.asmx und GSBulkAuthorization.asmx Webservice testen (siehe später) Testen Sie auch das Öffnen der SharePoint Dokument-Seiten sowie das Öffnen ausgewählter Dokumente aus SharePoint über einen Web-Browser ausgehend vom Mindbreeze Server mit dem konfigurierten Service-Benutzer 3.2 SharePoint URL FQDN Problem-Verhalten: Der Crawler bekommt keine Dokumente von SharePoint und erzeugt auch keine Datei-Liste in der Logdatei mes-pusher.csv. In der Logdatei log-mescrawler_launchedservice.log ist eine Fehlermeldung folgender Art zu finden: com.mindbreeze.enterprisesearch.gsabase.crawler.initializationexception: Unable to set connector config, response message: The SharePoint Site URL must contain a fully qualified domain name., status message:null, status code:5223 (INVALID_CONNECTOR_CONFIG) Problembeschreibung und -lösung: Für den Mindbreeze SharePoint Connector ist es essentiell, dass der SharePoint-Server über den FQDN-Hostnamen angesprochen wird. Sowohl in der SharePoint Konfiguration muss die externe URL konsistent als FQDN-Eintrag konfiguriert sein (siehe SharePoint Operations > group Global Configuration > Alternate access mappings ) Microsoft SharePoint Connector 15

Auch in der Mindbreeze-Konfiguration muss diese externe (FQDN) URL als Crawling Root konfiguriert sein. 3.3 SharePoint Webservices mit SOAP-Calls mittels curl testen Um Berechtigungsprobleme sowie Probleme mit den SharePoint Webservices zu analysieren kann man von der Kommandozeile aus SOAP-Calls mittels curl absetzen und das Ergebnis der einzelnen SOAP-Calls analysieren. Das Kommandozeilen Tool curl wird mit Mindbreeze InSpire (für Microsoft Windows) in folgendem Ordner mit ausgeliefert: C:\setup\tools\curl\bin und muss nur mehr zur Microsoft Windows Umgebungsvariable PATH hinzugefügt werden um einfach verwendbar zu sein. 3.3.1 SOAP-Calls vorbereiten Die Vorgehensweise zur Vorbereitung der SOAP-Calls für die einzelnen Tests ist immer die gleiche und wird hier einmalig anhand eines Beispiels beschrieben und kann für alle Checks analog angewandt werden. Als Beispiel verwenden wir CheckConnectivity von GSSiteDiscovery.asmx Das entsprechende SharePoint Webservice im Browser öffnen und die gewünschte Aktions- Methode für den Test auswählen um den Content der abgeschickt werden muss zu bekommen. Microsoft SharePoint Connector 16

Der Einfachheit halber verwenden wir die Interface-Beschreibung für SOAP 1.2 und kopieren den XML-Content des ersten Blocks (Request Teil) in eine Datei und speichern den Inhalt unter einem frei wählbaren Namen (z.b. C:\Temp\sp-site-check.xml). Je nach Interface-Definition müssen möglicherweise gewisse Werte im XML-Content an die eigene Infrastruktur angepasst werden. 3.3.2 SOAP-Calls testen Aufbauend auf dem vorbereiteten Beispiel testen wir nun den SOAP-Call mittels curl in einem Commandline-Fenster: Man wechselt in den Ordner, in dem auch die XML-Content-Datei liegt und führt das curl- Kommando analog zu folgendem Beispiel aus: (<Werte in spitzer Klammer> sind entsprechend zu ersetzen) Microsoft SharePoint Connector 17

C:\Temp>curl --ntlm --user <testlab\domainsrv>:<mypassword> --header "Content- Type: application/soap+xml;charset=utf-8" --data @<sp-site-check.xml> http://<spserver2007.testlab...>/_vti_bin/gssitediscovery.asmx Die Ausgabe wird direkt angezeigt, kann aber auch in eine Datei umgeleitet werden: > out.xml Folgende SharePoint Webservices und Methoden können Probleme relativ rasch aufdecken: http://<spserver2007.testlab>/_vti_bin/gssitediscovery.asmx o o CheckConnectivity: sollte success zurückliefern GetAllSiteCollectionFromAllWebApps: benötigt einen SharePoint Admin-Account! http://<spserver2007.testlab>/_vti_bin/gsbulkauthorization.asmx o CheckConnectivity: sollte success zurückliefern http://<spserver2007.testlab>/docs/_vti_bin/gssacl.asmx (dieser Test sollte auf das Unterverzeichnis in dem die SharePoint-Dokumente liegen (Bsp.: /Docs) ausgeführt werden) o o CheckConnectivity: sollte success zurückliefern GetAclForUrls: das ist der erste Test bei dem die Content-XML-Datei angepasst werden muss (siehe unterhalb) man gibt z.b. die Basis AllItems.aspx URL an, in der alle Dokumente enthalten sind, oder die SharePoint-URL eines ausgewählten Dokuments und sollte alle berechtigen Benutzer in der Antwort zurückbekommen GetAclForUrls Content-XML: <?xml version="1.0" encoding="utf-8"?> <soap12:envelope xmlns:xsi="http://www.w3.org/2001/xmlschema-instance" xmlns:xsd="http://www.w3.org/2001/xmlschema" xmlns:soap12="http://www.w3.org/2003/05/soap-envelope"> <soap12:body> <GetAclForUrls xmlns="gssacl.generated.sharepoint.connector.enterprise.google.com"> <urls> <string>http://spserver2007.testlab.mindbreeze.fabagl.fabasoft.com/docs/documents/ Forms/AllItems.aspx</string> <string>http://spserver2007.testlab.mindbreeze.fabagl.fabasoft.com/docs/documents/ testdoc2_server2007.rtf</string> </urls> </GetAclForUrls> </soap12:body> </soap12:envelope> SOAP-Call mit curl: C:\Temp>curl --ntlm --user <testlab\domainsrv>:<mypassword> --header "Content- Type: application/soap+xml;charset=utf-8" --data @data.xml http://spserver2007.testlab.mindbreeze.fabagl.fabasoft.com/docs/_vti_bin/gssacl.as mx > out.xml Das Ergebnis zeigt dann alle SharePoint-Berechtigungen zu den angegebenen URLs: Microsoft SharePoint Connector 18

3.4 Dokumente von Crawler IGNORED Werden die Dokumente von SharePoint korrekt ausgelesen aber gelangen trotzdem nicht in den Index, ist dies in der Logdatei mes-pusher.csv ersichtlich. Zeigt die Spalte ActionType den Wert IGNORED an, ist in der Spalte Message der Grund dafür zu finden. Mögliche Ursachen und deren Lösung: IGNORED, property ContentType with value null not matched pattern o Haben die zu indizierenden SharePoint Dokumente einen Typ der nicht in der vom Standard-Connector vordefinierten Liste enthalten ist, werden diese ignoriert. Die Liste der zu indizierenden Dokumenttypen kann allerdings in der Mindbreeze Konfiguration mit der Eigenschaft Additional Content Types erweitert werden. Unable to generate SecurityToken from acl null o Können keine ACLs für ein Dokument von SharePoint ausgelesen werden, so wird das Dokument ebenfalls ignoriert. Hier ist zu prüfen ob die Berechtigungen des Service- Benutzers ausreichend sind und ob die gssacl.asmx Webservice Calls einwandfrei funktionieren. Microsoft SharePoint Connector 19

3.5 Konfiguration von Metadatenkonvertierungsregeln in der ConnectorMetadataMapping.xml Datei Folgende Beispiele zeigen wie man bestimmte Regeln im ConnectorMetadataMapping.xml konfigurieren kann um neue Metadaten aus bestehende Metadaten zu generieren. 3.5.1 Content XPath Konfiguration <ConversionRule class="htmlcontentrule"> <Arg>//*[@id='ArticleContent'] </Arg> <!-- include XPath --> <Arg>//*[starts-with(@id, 'ECBItems_']</Arg> <!-- exclude XPath --> </ConversionRule> 3.5.2 Referenzierung <Metadatum join="true"> <SrcName>srcName</SrcName> <! srcname should be item ID --> <MappedName>mappedRef</MappedName> <ConversionRule class="sharepointkeyreferencerule"> <Arg>http://site/list/AllItems.aspx %s</arg> </ConversionRule> </Metadatum> 3.5.3 String Formatierung Zusammenführung von Metadaten: <Metadatum join="true"> <SrcName>srcName1,srcName2</SrcName> <! join values with --> <MappedName>mappedName</MappedName> <ConversionRule class="formatstringrule"> <Arg>%s %s</arg> </ConversionRule> </Metadatum> Trennung von einem Metadatum: <Metadatum split="true"> <SrcName>srcName</SrcName> <MappedName>mapped1,mapped2</MappedName> <!-- split srcname value --> <ConversionRule class="splitstringrule"> <Arg>:</Arg> </ConversionRule> </Metadatum> Ersetzung von Metadaten: <Metadatum> <SrcName>srcName</SrcName> <MappedName>mappedName</MappedName> Microsoft SharePoint Connector 20

<ConversionRule class="stringreplacerule"> <Arg>.*src="([^"]*)".*</Arg> <! regex pattern--> <Arg>http://mycompany.com$1</Arg> <!-- replacement --> </ConversionRule> </Metadatum> 4 Deinstallation des Microsoft SharePoint Connectors Um den Microsoft SharePoint Connector zu deinstallieren, müssen zuerst alle Microsoft SharePoint Crawler gelöscht und danach folgender Befehl ausgeführt werden: mesextension --interface=plugin --type=archive -- file=microsoftsharepointconnector<version>.zip uninstall Microsoft SharePoint Connector 21