Acrolinx IQ. Konfigurieren der serverseitigen Segmentierung

Ähnliche Dokumente
Übung - Datensicherung und Wiederherstellung in Windows 7

Übung - Datensicherung und Wiederherstellung in Windows Vista

Erstellen eines Formulars

Um dies zu tun, öffnen Sie in den Systemeinstellungen das Kontrollfeld "Sharing". Auf dem Bildschirm sollte folgendes Fenster erscheinen:

1 Einleitung. Lernziele. Symbolleiste für den Schnellzugriff anpassen. Notizenseiten drucken. eine Präsentation abwärtskompatibel speichern

12. Dokumente Speichern und Drucken

Optionen. Optionen Allgemein

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

Sichern der persönlichen Daten auf einem Windows Computer

Clients in einer Windows Domäne für WSUS konfigurieren

So importieren Sie einen KPI mithilfe des Assistenten zum Erstellen einer Scorecard

Speichern. Speichern unter

INDEX. Öffentliche Ordner erstellen Seite 2. Offline verfügbar einrichten Seite 3. Berechtigungen setzen Seite 7. Öffentliche Ordner Offline

Verwenden von Adobe LiveCycle ES3 Connector für Microsoft SharePoint

Handbuch ECDL 2003 Professional Modul 2: Tabellenkalkulation Vorlagen benutzen und ändern

Bauteilattribute als Sachdaten anzeigen

Tutorial -

Optionen. Optionen Allgemein

Web-Kürzel. Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter

Tipps und Tricks zu Netop Vision und Vision Pro

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Task: Nmap Skripte ausführen

Tutorials für ACDSee 12: Verschieben von Fotos und Metadaten auf einen anderen Computer

Backup Premium Kurzleitfaden

HTML5. Wie funktioniert HTML5? Tags: Attribute:

ACDSee Pro 3-Tutorials: Fotos (+ Datenbank) auf einen anderen Computer bringen

ACDSee Pro 2. ACDSee Pro 2 Tutorials: Übertragung von Fotos (+ Datenbank) auf einen anderen Computer. Über Metadaten und die Datenbank

Standard-Kontaktformular

Aktualisieren auf Adobe Experience Manager Forms on JEE für Websphere

Word 2010 Schnellbausteine

Bedienungsanleitung Joomla 3.xx für Redakteure mit Admin-Rechten

iphone-kontakte zu Exchange übertragen

ACDSee 2009 Tutorials: Importien von Fotos mit dem Fenster "Importieren von"

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage

Der neue persönliche Bereich/die CommSy-Leiste

Outlook Erstellen einer aus einer HTML - Vorlage INHALT

2. Word-Dokumente verwalten

Artikel Schnittstelle über CSV

Dateipfad bei Word einrichten

Windows. Workshop Internet-Explorer: Arbeiten mit Favoriten, Teil 1

Intrexx auf einem Windows 2012 Server

Anwendungsbeispiele Buchhaltung

Im Folgenden wird Ihnen an einem Beispiel erklärt, wie Sie Excel-Anlagen und Excel-Vorlagen erstellen können.

Vergleich: Positionen der Word 2003-Befehle in Word

Er musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt

VERWENDEN VON ADOBE DIGITAL ENTERPRISE PLATFORM DOCUMENT SERVICES CONNECTOR FÜR MICROSOFT SHAREPOINT 10.0

Outlook 2000 Thema - Archivierung

1. Handhabung Werkzeug- und Menüleiste

Die Dateiablage Der Weg zur Dateiablage

Frankieren in Microsoft Word mit dem E Porto Add in der Deutschen Post

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Kostenstellen verwalten. Tipps & Tricks

Microsoft Windows XP SP2 und windream

X-RiteColor Master Web Edition

Family Safety (Kinderschutz) einrichten unter Windows 7

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen mit SQL Server-Daten

Einrichten eines POP-Mailkontos unter Thunderbird Mail DE:

Anleitung zur Erstellung und Bearbeitung von Seiten in Typo3. Typo3. Anleitung. Wenpas Informatik

Lexware professional und premium setzen bis einschließlich Version 2012 den Sybase SQL-Datenbankserver

Acrolinx IQ. Verbindungen mit externen Terminologiedatenbanken 2.9

PowerMover. Eine Zusatz-Anwendung für Outlook-PowerUser. Damit können eingehende s schneller verwaltet werden. Vasquez Systemlösungen

AdmiCash-Wiederherstellung auf einem neuen PC oder Betriebssystem

Anleitung Captain Logfex 2013

Übung - Konfigurieren einer Windows-XP-Firewall

Roundcube Webmail Kurzanleitung

Anleitung zur Verwendung der VVW-Word-Vorlagen

Seminar DWMX DW Session 015

Leitfaden zur Einrichtung za-mail mit IMAP auf dem iphone

Fusszeile mit Datumsfeld und Dateiname

Aktivieren von Onlinediensten im Volume Licensing Service Center

Update und Konfiguraton mit dem ANTLOG Konfigurations-Assistenten

Anleitung Lernobjekt-Depot (LOD)

Einführung. Einführung in NTI Shadow. Übersicht über den Begrüßungsbildschirm

Intrexx unter Windows Server 2008

Grundfunktionen und Bedienung

MailUtilities: Remote Deployment - Einführung

Möglichkeiten des Parallelbetriebs der VR-NetWorld Software Parallelbetrieb VR-NetWorld Software 4.4x und Version 5.0 ab der 2. Beta!

Kommunikations-Management

Arbeiten mit dem Outlook Add-In

Hochschulrechenzentrum. chschulrechenzentrum #96. Freie Universität Berlin

SANDBOXIE konfigurieren

Live Update (Auto Update)

Adobe Volume Licensing

Anleitungen zum Publizieren Ihrer Homepage

Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten

BricsCAD System Variablen

EMC SourceOne TM für Microsoft SharePoint 7.1 Archivsuche Kurzreferenz

Treffpunkt Internet Reutlingen, B.Schüle 1

Step by Step Remotedesktopfreigabe unter Windows Server von Christian Bartl

Powermanager Server- Client- Installation

CVR Seniorentreff vom 04. und Serienbriefe/Seriendruck. Serienbriefe / Seriendruck

Sametime Meetings - Taskreferenz

OutlookExAttachments AddIn

Ordner Berechtigung vergeben Zugriffsrechte unter Windows einrichten

1. Zuerst muss der Artikel angelegt werden, damit später die Produktvarianten hinzugefügt werden können.

Das Modul Hilfsmittel ermöglicht den Anwender die Verwaltung der internen Nachrichten, Notizen, Kontakte, Aufgaben und Termine.

Erstellen einer in OWA (Outlook Web App)

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen zu SQL Server Analysis Services-Daten

Transkript:

Acrolinx IQ Konfigurieren der serverseitigen Segmentierung

2 Inhalt Überblick über die serverseitige Segmentierung 3 Kontextsegmentierungsdefinitionen (CSD)...3 Elemente und Segmentierungsregeln...6 CSD-Bewertung...9 Konfigurieren der serverseitigen Segmentierung 11 Erstellen und Bearbeiten serverseitiger CSD-Dateien...11 Zuordnen serverseitiger CSD-Dateien zu Sprachen und Regelsets...12 Konfigurieren der annotierten Ausgabe...12 Aktivieren der serverseitigen Segmentierung im Client...13

3 1 Überblick über die serverseitige Segmentierung Als Segmentierung wird der Prozess bezeichnet, mit dessen Hilfe die korrekten Wort- und Satzgrenzen ermittelt werden, wenn Text in XML-Dokumenten von Acrolinx IQ extrahiert und geprüft wird. Die Segmentierung wird normalerweise von den Acrolinx IQ Clients übernommen. Es ist jedoch auch möglich, Acrolinx IQ Server so zu konfigurieren, dass dieser die Segmentierung übernimmt. Dies ist in folgenden Situationen hilfreich: Bei der Entwicklung eines eigenen Clients, der die Acrolinx IQ Java API verwendet. Durch die Verwendung serverseitiger Segmentierung müssen die Komponenten für XML-Extraktion und -Segmentierung nicht in die Java API integriert werden. Beschränkung: Die serverseitige Segmentierung sollte nicht verwendet werden, wenn der Server so eingerichtet ist, dass Prüfberichte auf dem Computer des Clients gespeichert werden. Informationen zum erneuten Laden einer Sprachserverkonfiguration finden Sie im Acrolinx IQ Server Administrationshandbuch. Bei der Zentralisierung der Segmentierungseinstellungen für Benutzer des Batch Checkers. Anders als die Acrolinx IQ Plug-ins verfügt der Batch Checker nicht über eine Funktionalität für Modellbenutzer, mit der die Segmentierungseinstellungen zentralisiert werden können. Die Verwendung der serverseitigen Segmentierung ist eine Möglichkeit, diese Einschränkung zu umgehen. Beschränkung: Wenn die serverseitige Segmentierung im Acrolinx IQ Batch Checker verwendet wird, können nur XML-Dateien geprüft werden. Sie definieren serverseitige Segmentierungseinstellungen, indem Sie CSD-Dateien zu Ihrer Serverinstallation hinzufügen und die Sprachkonfigurationsdatei aktualisieren. Kontextsegmentierungsdefinitionen (CSD) Wozu dienen Kontextsegmentierungsdefinitionen? Bei der Prüfung von HTML- oder XML-Dateien werden die Segmentierungseinstellungen über die CSD-Dateien festgelegt. In einer CSD wird Folgendes definiert: Die Dokumenttypen, die mit den definierten Segmentierungseinstellungen verknüpft sind. Sentence-Break-Elemente No-Break-Elemente

4 Überblick über die serverseitige Segmentierung Elemente, die bei Prüfungen ein- oder ausgeschlossen werden. Attribute mit Werten, die geprüft werden sollen. CSD-Dateibenennung und -Speicherort CSD sind in Dateien mit dem folgenden Format enthalten: <DATEINAME>.properties Serverseitige CSD-Dateien werden standardmäßig im folgenden Verzeichnis gespeichert: <INSTALL_VER>\data\<SPRACH_ID> Dateistruktur CSD-Dateien bestehen aus folgenden Parametern: Parameter documenttypes Beschreibung Die Dokumenttypen, für die diese CSD angewendet wird. Beispiel: Sie können zum Beispiel eine CSD erstellen, um zu definieren, wie DITA Tasks segmentiert werden. DITA Task-Dateien enthalten die folgenden Doctype-Informationen. Werte Der Name des Dokumenttyps oder eine kommagetrennte Liste mit mehreren Namen von Dokumenttypen. Beispiel:task, concept,ditabase input_type <!DOCTYPE task PUBLIC "-//OASIS//DTD DITA Task//EN" "task.dtd"> Der Dokumenttyp ist task und die documenttypes sollten folgendermaßen festgelegt werden: documenttypes=task Definieren Sie die Eigenschaft folgendermaßen, um eine CSD für HTML-Dateien zu erstellen: documenttypes=html Das Format der zu überprüfenden Datei html, xml

5 Parameter sentence_break_eleme nts no_break_elements default_inclusion_mo de Beschreibung Sentence-Break-Elemente (siehe Seite 6) No-Break-Elemente (siehe Seite 6) Dieser Parameter legt fest, ob Elemente bei einer Prüfung standardmäßig ein- oder ausgeschlossen werden. Die folgenden Elemente werden immer ein- oder ausgeschlossen, unabhängig vom Wert des Parameters defaul t_inclusion_mode: Elemente, die als ex clusion_elements oder inclusion_ele ments definiert sind Untergeordnete Elemente von ausoder eingeschlossenen Elementen Werte Elementnamen, Elementnamen mit Attributen. Elementnamen, Elementnamen mit Attributen. include, exclude exclusion_elements inclusion_elements empty_elements Elemente, die immer ausgeschlossen sind. Untergeordnete Elemente von ausgeschlossenen Elementen werden ebenfalls immer ausgeschlossen. Elemente, die immer eingeschlossen sind. Untergeordnete Elemente von eingeschlossenen Elementen werden ebenfalls immer eingeschlossen. Elemente ohne Inhalt, die aber Teil der Satzstruktur sind und als Substabtive Elementnamen, Elementnamen mit Attributen. Elementnamen, Elementnamen mit Attributen. Elementnamen

6 Überblick über die serverseitige Segmentierung Parameter extract_attributes mark_excluded_elemen ts Beschreibung behandelt werden sollen. Attribute mit Werten, die für die Prüfung an den Server übermittelt werden sollen Konfiguriert den Server, damit beim Verarbeiten des Texts Platzhalter für Ausschlusselemente eingefügt werden. Mit dieser Eigenschaft vermeiden Sie fehlerhafte Markierungen, die von ausgeschlossenen Elementen verursacht werden. Informationen über diese Eigenschaft finden Sie in der Dokumentation des Batch Checkers. Werte Attributnamen, Elementnamen mit Attributen. true, false Elemente und Segmentierungsregeln Hintergrund Damit Dokumente korrekt geprüft werden können, muss Acrolinx IQ die folgenden Elemente erkennen können: Token: einzelne Wörter, Akronyme, Zahlen im Text Sätze: Zeichenfolgen, die wie Sätze behandelt werden Metadaten: zusätzliche Informationen zum Text, die nicht geprüft werden sollen In WYSIWYG-Editoren ( what you see is what you get") wie Microsoft Word sind Token, Sätze und Metadaten für Mensch und Computer einfach zu erkennen. In Auszeichnungssprachen wie HTML und XML ist dies hingegen schwieriger. Aus diesem Grund müssen Sie zusätzliche Informationen über den ausgezeichneten Text bereitstellen. Bei der Analyse eines ausgezeichneten Texts ist es sinnvoll, die Elemente in folgende Kategorien zu unterteilen: Ausschlusselemente Sentence-Break-Elemente No-Break-Elemente

7 Standardelemente Ausschlusselemente Die meisten Dokumente enthalten Text, der bei der Prüfung mit Acrolinx IQ ignoriert werden soll. Durch die Definition von Ausschlusselementen können Sie festlegen, welche Teile eines Texts nicht geprüft werden sollen. Elemente mit Metadaten innerhalb eines Dokuments gehören nicht zum eigentlichen Text, sondern liefern zusätzliche Informationen. In WYSIWYG-Editoren lassen sich Metadaten einfach identifizieren: Kopf- und Fußzeilen, Indexeinträge, Lesezeichen, Anmerkungen und ähnliche Elemente sind eindeutig nicht Teil des Dokumenttextes. In ausgezeichneten Dokumenten hingegen müssen Metadaten als Ausschlusselemente definiert werden. Bei einer Prüfung werden diese Metadaten dann von Acrolinx IQ ignoriert. Sie können auch anderen ausgezeichneten Text wie zum Beispiel Programmcode als Ausschlusselement definieren. Sentence-Break-Elemente In Text- oder WYSIWYG-Editoren sind Satzgrenzen einfach anhand von Zeilenschaltungen erkennbar. Durch sie wird offensichtlich, wo Textfolgen wie zum Beispiel Titel beginnen und enden. In ausgezeichnetem Text müssen diese Elemente dagegen als Sentence-Break-Elemente definiert werden. No-Break-Elemente Einige Zeichenfolgen wie zum Beispiel chemische Formeln enthalten spezielle Elemente, durch die sie beim Ausdrucken oder Anzeigen auf dem Bildschirm eine bestimmte Form bekommen. So wird zum Beispiel die Zeichenfolge HO 2 -Konzentration in HTML folgendermaßen angezeigt: HO<sub>2</sub>-Konzentration Damit diese Zeichenfolge von Acrolinx IQ als einzelnes Token bewertet werden kann, müssen Sie das Element <sub> als No-Break-Element definieren. Leere Elemente Leere Elemente sind XML-, GML- oder HTML-Elemente, die keinen Text enthalten. So handelt es sich zum Beispiel beim Element <image href="1. jpg"></image> um ein leeres Element. Acrolinx IQ ersetzt leere Elemente mit einem Leerzeichen, wenn der Text für die Prüfung verarbeitet wird. In einigen Fällen kann es durch leere Elemente in Satzstrukturen zu fehlerhaften Markierungen durch Stil- oder Grammatikregeln kommen. Im folgenden Beispiel enthält das xref-element keinen Text, ist im Satz aber das Substantiv. <para>slide the <xref xidtype="ibswitch" xrefid="ib001"></xref> firmly into place.</para> In der Standardeinstellung wird der Text Slide the firmly into place. an den Server übermittelt und der Satz wird wegen der fehlerhaften Grammatik markiert.

8 Überblick über die serverseitige Segmentierung Sie können diese Fehler verhindern, indem Sie leere Elemente in einer CSD-Datei so definieren, dass sie als Substantive behandelt werden. Leere Elemente sind vergleichbar mit Ausschlusselementen. Der Vorteil von leeren Elementen ist, dass sie keine fehlerhaften Satzzahlen verursachen und dass weniger Text an den Server gesendet werden muss. Verwenden Sie leere Elemente, um leere Elemente explizit zu isolieren und sie von Ausschlusselementen zu unterscheiden. Klassifizierungsrichtlinien Klassifizieren Sie die unterschiedlichen Elemente nach folgenden Richtlinien: Elemente mit untergeordneten Elementen, bei denen es sich um Sentence-Break-Elemente handelt: Falls das Element Absätze oder Domänen betrifft, handelt es sich normalerweise um ein Standardelement. Bei XML-Dateien gibt häufig der Name des Elements einen Hinweis, zum Beispiel: <topiccollection> <topic> <caution> <table> <row> <tbody> Tipp: Diese Elemente können oft auch als Sentence-Break-Elemente klassifiziert werden. Weil diese Elemente aber in der Regel bereits Sentence-Break-Elemente wie <para> enthalten, ist dies nicht notwendig. Titel sind meist Sentence-Break-Elemente, zum Beispiel: <title> <subtitle> Elemente, die Text enthalten, der auf einen Satzumbruch endet, sind meist Sentence-Break-Elemente, zum Beispiel: <usersuppliedtext> <paragraph> Elemente wie Metadaten und Indizes sind meist Ausschlusselemente, zum Beispiel: <metadata> <index> Elemente innerhalb eines Wortes sind meist No-Break-Elemente, zum Beispiel: <sub> (subscript) <sup> (superscript) Tipp: Wenn der Fehler Satz zu lang auftritt, ist das Element, mit dem der nicht erkannte Satz endet, wahrscheinlich ein

9 Sentence-Break-Element. Falls Sie sich nicht sicher sind, ob ein Element ein Sentence-Break- oder ein Standardelement ist, belassen Sie es als Standardelement. Fehler vom Typ Satz zu lang sind leicht zu erkennen. CSD-Bewertung Wenn Sie mit unterschiedlichen Dokumenttypen arbeiten und mehrere CSD-Dateien demselben Regelset zugeordnet haben, müssen Sie sicherstellen, dass der Server bei Prüfungen die korrekte CSD-Datei auswählt. Die Reihenfolge, in der die CSD-Dateien verwendet werden, hängt davon ab, wie diese konfiguriert wurden. Um sicherzustellen, dass der Server immer die für das jeweilige Dokument angemessene CSD-Datei wählt, müssen Sie die Einstellungen in den CSD-Dateien prüfen. Hier erkennen Sie, ob immer die am besten passenden CSDs zuerst gewählt werden. Ablauf der CSD-Bewertung Die Reihenfolge, in der die CSDs bewertet werden, hängt davon ab, wie die Eigenschaft documenttypes definiert ist. 1. CSDs, die keinem bestimmten Dokumenttyp zugewiesen sind, werden zuerst bewertet. 2. CSDs, die einem oder mehreren bestimmten Dokumenttypen zugewiesen sind, werden als zweites bewertet. Die Bewertung basiert darauf, wie vielen Dokumenttypen die CSD zugeordnet ist, wobei hier die CSD mit den meisten zugeordneten Dokumenttypen zuerst berücksichtigt wird. CSDs, die nur einem bestimmten Dokumenttyp zugewiesen sind, werden zuletzt bewertet. 3. Wenn für das geprüfte Dokument keine entsprechenden CSDs verfügbar sind, wird das Dokument mit einer als Sicherung im Server integrierten CSD geprüft. Sie können zum Beispiel eine CSD für DITA Tasks erstellen und hier die Eigenschaft documenttypes=task einfügen. Gleichzeitig erstellen Sie eine allgemeine CSD-Datei, die für keinen bestimmten Dokumenttyp gilt. Wenn ein Benutzer jetzt einen DITA Task prüft, wird die allgemeine CSD anstelle der speziell für DITA Tasks konfigurierten CSD verwendet. Um diese Probleme zu vermeiden, können Sie entweder in jeder CSD-Datei einen Dokumenttyp festlegen oder für jeden Dokumenttyp eine eigene CSD erstellen. Backup-CSDs Die Backup-CSDs werden verwendet, wenn ein Benutzer eine Datei prüft, die keinen Dokumenttyp enthält oder für die keine CSD-Datei definiert ist. Es gibt zwei Backup-CSDs: eine für HTML und eine für XML. Diese CSDs sind fest in Acrolinx IQ Server integriert und können nicht modifiziert werden.

10 Überblick über die serverseitige Segmentierung Die Backup-CSD für HTML enthält die folgenden Einstellungen: documenttypes=html input_type=html sentence_break_elements=address,base,basefont,blockquote,body, br,button,caption,center,col,dd,del,dir,div,dl,dt,fieldset,form, frame,frameset,h1,h2,h3,h4,h5,h6,head,hr,html,iframe,input,ins, isindex,label,legend,li,map,menu,meta,noframes,noscript,ol, optgroup,option,p,pre,select,table,tbody,td,tfoot,th,thead,title, tr,ul,textarea no_break_elements=a,abbr,acronym,b,big,cite,code, dfn,em,font,i,kbd,q,s,samp,small,span,strike,strong,sub,sup,tt, u,var default_inclusion_mode=include exclusion_elements=applet, area,bdo,colgroup,img,link,object,param,script,style inclusion_elements= empty_elements= Die Backup-CSD für XML enthält die folgenden Einstellungen: documenttypes= input_type=xml sentence_break_elements= no_break_elements= default_inclusion_mode=include exclusion_elements= inclusion_elements= empty_elements= Die meisten Eigenschaften in der Backup-CSD für XML-Dateien sind leer, mit Ausnahme des standardmäßigen Einschlussmodus. Standardmäßig werden alle XML-Elemente geprüft, wenn diese CSD verwendet wird.

11 2 Konfigurieren der serverseitigen Segmentierung â So konfigurieren Sie die serverseitige Segmentierung 1. Erstellen Sie eine serverseitige CSD-Datei (siehe "Erstellen und Bearbeiten serverseitiger CSD-Dateien" auf Seite 11). 2. Ordnen Sie die serverseitige CSD-Datei einer Sprache oder einem Regelset zu (siehe "Zuordnen serverseitiger CSD-Dateien zu Sprachen und Regelsets" auf Seite 12). 3. (Optional) Konfigurieren Sie Acrolinx IQ Server so, dass eine annotierte Kopie des geprüften Dokuments erstellt wird (siehe "Konfigurieren der annotierten Ausgabe" auf Seite 12). 4. Aktivieren Sie die serverseitige Segmentierung im Client (siehe "Aktivieren der serverseitigen Segmentierung im Client" auf Seite 13). Erstellen und Bearbeiten serverseitiger CSD-Dateien â So erstellen Sie eine CSD-Datei 1. Erstellen Sie eine Textdatei mit dem Namen <DATEINAME>.properties und speichern Sie diese Datei auf dem Servercomputer. Beispiel: <INSTALL_VER>\data\<SPRACH_ID> 2. Kopieren Sie die folgenden Parameter in die Textdatei: documenttypes= input_type= sentence_break_elements= no_break_elements= default_inclusion_mode= exclusion_elements= inclusion_elements= empty_elements= 3. Geben Sie für jeden dieser Parameter (siehe "Kontextsegmentierungsdefinitionen (CSD)" auf Seite 3) die entsprechenden Werte ein. 4. Speichern und schließen Sie die CSD-Datei. â So bearbeiten Sie eine vorhandene CSD-Datei 1. Suchen und öffnen Sie die CSD-Textdatei in dem Verzeichnis, in dem die CSD-Profile gespeichert sind: Beispiel: <INSTALL_VER>\data\<SPRACH_ID> 2. Bearbeiten Sie die Parameter (siehe "Kontextsegmentierungsdefinitionen (CSD)" auf Seite 3). 3. Speichern und schließen Sie die CSD-Datei.

12 Konfigurieren der serverseitigen Segmentierung Zuordnen serverseitiger CSD-Dateien zu Sprachen und Regelsets Bei der Prüfung von XML-Dateien werden die Segmentierungseinstellungen von den CSD-Dateien festgelegt. Um serverseitige CSD-Dateien für Prüfungen verwenden zu können, müssen Sie diese Dateien zunächst in der Sprachkonfigurationsdatei definieren. â So ordnen Sie eine serverseitige CSD-Datei einem Regelset zu 1. Öffnen Sie die Sprachkonfigurationsdatei für die Prüfsprache: <INSTALL_VER>\data\<SPRACH_ID>\configuration.properties 2. Fügen Sie mindestens eine der folgenden Zeilen hinzu: <REGELSET>.contextSegmentationDefinitions=<CSD_SPEICHERORT>.properties Fügen Sie diese Zeile hinzu, um eine oder mehrere CSD-Dateien einem bestimmten Regelset zuzuordnen. contextsegmentationdefinitions=<csd_speicherort>.properties Fügen Sie diese Zeile hinzu, um eine oder mehrere CSD-Dateien allen Prüfungen in einer bestimmten Sprache zuzuordnen. Wenn ein Benutzer ein Regelset auswählt, das keiner CSD-Datei zugeordnet ist, verwendet der Server die in dieser Eigenschaft definierten CSD-Dateien. Der Speicherort der CSD-Datei ist relativ zum Speicherort der Sprachkonfigurationsdatei. Wenn Ihre CSD-Datei zum Beispiel im Verzeichnis <INSTALL_VER>\data \<SPRACH_ID> gespeichert ist, müssen Sie die Eigenschaft folgendermaßen eingeben: Standard.contextSegmentationDefinitions=default.properties Wenn Sie mehrere CSD verschiedenen Dokumenttypen zuordnen möchten, können Sie auch eine kommagetrennte Liste mit CSD-Dateien hinzufügen. Beispiel: Standard.contextSegmentation Definitions=default1.properties,default2.properties 3. Speichern und schließen Sie die Sprachkonfigurationsdatei. 4. Laden Sie die Sprachserverkonfiguration neu. Konfigurieren der annotierten Ausgabe Bei der Verwendung der serverseitigen Segmentierung wird von Acrolinx IQ Server eine annotierte Kopie des geprüften Dokuments im Ausgabeverzeichnis des Servers erstellt. Beispiel: <INSTALL_VER>\server\www\output\en\<DATEINAME>_annotated.xml.

13 Standardmäßig werden Dokumente mit verschiedenen Verarbeitungsdaten annotiert, die markierten Text anzeigen. Dies ist hilfreich, wenn in einem automatisierten Workflow Dokumente anhand der Metadaten verarbeitet werden können. Über die Hauptserver-Eigenschaft xml.annotationtype können Sie anpassen, wie annotierte Ausgabedateien vom Server erstellt werden. â So konfigurieren Sie die annotierte Ausgabe 1. Öffnen Sie die Sprachkonfigurationsdatei: <INSTALL_VER>\acrolinxIQ\data\<SPRACH_ID>\configuration.properties 2. Fügen Sie die folgende Zeile hinzu: xml.annotationtype=<wert> Sie können folgende Werte verwenden: none, damit vom Server keine annotierte Kopie des geprüften Dokuments erstellt wird. pi, damit eine annotierte Kopie mit Verarbeitungseinstellungen erstellt wird. element, damit eine annotierte Kopie mit Acrolinx-spezifischen XML-Elementen erstellt wird. Der Standardwert lautet pi. 3. Speichern und schließen Sie die Sprachkonfigurationsdatei. 4. Laden Sie die Sprachserverkonfiguration neu. Tipp: Wenn Sie die Acrolinx IQ Java API verwenden, können Sie den Speicherort der annotierten Ausgabedatei ermitteln, indem Sie die Methode getannotatedxmluri() im Interface CheckResult aufrufen. Aktivieren der serverseitigen Segmentierung im Client Sie aktivieren die serverseitige Segmentierung, indem Sie Ihren Client so konfigurieren, dass XML-Markup an Acrolinx IQ Server übermittelt wird und anstelle der lokal gespeicherten CSD-Dateien die auf dem Servercomputer gespeicherten Dateien verwendet werden. â So aktivieren Sie die serverseitige Segmentierung im Client 1. Konfigurieren Sie die Eigenschaft useserversidexmlextraction so, damit der Client die serverseitigen CSD-Dateien verwendet. Wenn Sie die Acrolinx IQ Java API verwenden, müssen Sie den Client so konfigurieren, dass er die Eigenschaft useserversidexmlextraction=true übermittelt. Fügen Sie die Systemeigenschaft useserversidexmlextraction=true hinzu, wenn Sie den Acrolinx IQ Batch Checker verwenden. Weitere Informationen finden Sie im Abschnitt Aktivieren der serverseitigen Segmentierung im Acrolinx IQ Batch Checker Benutzerhandbuch.

14 Konfigurieren der serverseitigen Segmentierung 2. Konfigurieren Sie den Client so, dass dieser den Inhalt von XML-Dateien als Text übermittelt. Sie verwenden diese Konfiguration, um zu verhindern, dass der Client das XML-Markup entfernt, bevor es an den Server übermittelt wird. Wenn Sie die Acrolinx IQ Java API verwenden, müssen Sie den Client so konfigurieren, dass er beim Prüfen von XML-Dateien die Eigenschaft input_type=text übermittelt. Wenn Sie den Acrolinx IQ Batch Checker verwenden, um XML-Dateien zu prüfen, müssen Sie die Dateierweiterung.xml im Dialogfeld Dateitypen verwalten zum Dateityp Text hinzufügen.

15 Index A Aktivieren der serverseitigen Segmentierung im Client 13 B Backup-CSDs 9 C CSD-Bewertung 9 F Festlegen der Verarbeitungseinstellungen 3 I Informationen über die serverseitige Segmentierung 3 Informationen über Elemente und Segmentierungsregeln 3, 6 Informationen über Kontextsegmentierungsdefinitionen (CSD) 3