Analyse qualitativer Daten mit dem Leipzig Corpus Miner
|
|
- Anneliese Schmidt
- vor 8 Jahren
- Abrufe
Transkript
1 Schriftenreihe des Verbundprjekts Pstdemkratie und Neliberalismus Discussin Paper Nr.5 Analyse qualitativer Daten mit dem Leipzig Crpus Miner Zur Vrbereitung des Wrkshps Text Mining in der Plitikwissenschaft Gregr Wiedemann & Andreas Niekler
2 ISSN Zitierweise: Wiedemann, Gregr / Niekler, Andreas (2014): Analyse qualitativer Daten mit dem Leipzig Crpus Miner Schriftenreihe des Verbundprjekts Pstdemkratie und Neliberalismus Discussin Paper Helmut-Schmidt-Universität Hamburg (UniBw) und Universität Leipzig 2
3 Zusammenfassung Der Leipzig Crpus Miner (LCM) ist eine Webanwendung, die verschiedene Text Mining Verfahren für die Analyse grßer Mengen qualitativer Daten bündelt. Durch eine einfach zu bedienende Benutzerberfläche ermöglicht der LCM Vlltextzugriff auf 3,5 Millinen Zeitungstexte, die nach Suchbegriffen und Metadaten zu Subkllektinen gefiltert werden können. Auf dem Gesamtdatenbestand swie auf den Subkllektinen können verschiedene cmputergestützte Auswertungsverfahren angewendet und zu Analysewrkflws kmbiniert werden. Damit ermöglicht der LCM die empirische Analyse szialwissenschaftlicher Fragestellungen auf Basis grßer Dkumentkllektinen, wbei qualitative und quantitative Analyseschritte miteinander verschränkt werden können. Dieser Artikel gibt einen Überblick über die Analysekapazitäten und mögliche Wrkflws zur Anwendung des LCM. 3
4 Inhaltsverzeichnis Vrbereitung zum Wrkshp vn Seiten des Teilprjekts Infrmatik Datenbestand Analysen auf dem Gesamtkrpus Dkumentselektin Cllectins Time Series Vlltextansicht Facets Analysen auf Basis vn Cllectins Frequenzanalyse Kkkurrenzanalyse Tpic Mdelle Term Extraktin KWIC Manuelle Anntatin Autmatische Klassifikatin Aufteilung vn Datengrundlagen Kmbinatin vn Einzelverfahren Cllectin-Größe und Berechnungszeiten Parameter Task spezifische Parameter Vrbereitung auf den Wrkshp / Operatinalisierung Weiterführende Literatur zur Vrbereitung
5 Vrbereitung zum Wrkshp vn Seiten des Teilprjekts Infrmatik Der LCM ist eine Serveranwendung, die im Rahmen des Prjekts epl Pstdemkratie und Neliberalismus in der Abteilung Autmatische Sprachverarbeitung an der Universität Leipzig entwickelt wird. Bei der Sftware handelt es sich um einen Prttypen, der für die Analysezwecke des epl-prjekts erstellt wurde und auf die Bedürfnisse eines kleinen Nutzerkreises abgestimmt wurde. Flglich sind die Analysekapazitäten für bestimmte Zwecke ptimiert. Für den Wrkshp werden Sie in die Benutzung des LCM eingewiesen, s wie wir sie uns im Rahmen des epl- Prjekts erdacht haben. Darüber hinaus werden Sie aber wmöglich Benutzungsweisen anwenden, welche wir nicht vrhergesehen haben. Dadurch swie durch den erstmaligen gleichzeitigen Einsatz der Sftware durch Sie als Teilnehmende kann es zu unerwarteten Ereignissen der Fehlfunktinen kmmen. Beim LCM handelt es nicht um ein fehlerfreies, fertiges 'Prdukt'. Wir möchten Sie hiermit als bitten, geduldig zu sein, wenn nicht alles reibungsls laufen sllte. Für Fragen zur Sftware stehen wir Ihnen immer zur Verfügung. Wir hffen, ein hilfreiches Stück Sftware für spannenden Analyse entwickelt zu haben. Andreas Niekler, Gregr Wiedemann 5
6 1. Datenbestand Im Rahmen des Wrkshps erhalten Sie Zugriff auf lizenzierte Daten vn deutschen Tages- bzw. Wchenzeitungen, die Sie für ihre Frschungsfragen auswerten können. Zeitung Frankfurter Allgemeine Zeitung (FAZ) abgedeckter Zeitraum Anzahl Ausgaben Anzahl Artikel Stichprbe Süddeutsche Zeitung (SZ) die tageszeitung (taz) Die Zeit Gesamt Die Zeitungsartikel liegen in einer Datenbank vr, auf die mit Hilfe der Webserveranwendung LCM zugegriffen werden kann. Drt können Sie nach Artikeln suchen, diese im Vlltext lesen, Kdierungen im Text vrnehmen und verschiedene Text Mining Verfahren auf gefilterten Subkllektinen anwenden. Für den Zugriff auf den LCM erhalten Sie einen Benutzeraccunt zu Beginn des Wrkshps. Dieser Accunt dient gleichzeitig dazu, ihre spezifischen Analyseschritte bzw. Ergebnisse abzuspeichern. Auswahlen vn Dkumenten werden als Subkllektinen benutzerspezifisch gespeichert. Sie können auch zu mehreren Persnen mit einer Subkllektin arbeiten. Das gleiche gilt für Kategriesysteme für den Fall, dass Sie Kdierungen am Text vrnehmen wllen. 2. Analysemöglichkeiten 2.1 Analysen auf dem Gesamtkrpus Dkumentselektin Über den LCM erhalten Sie Zugriff auf den Vlltext der 3,5 Mi. Zeitungsartikel. Dieser Krpus muss selbstverständlich für die Untersuchung knkreter Frschungsfragen auf möglichst relevante Artikel eingeschränkt werden. Dazu stellt der LCM die Möglichkeit einer kmplexen Vlltextsuche bereit. Artikel können nach einzelnen Suchbegriffen, Kmbinatinen vn Suchbegriffen und Metadaten (Zeitraum, Zeitung, Ressrt, Autr, Begriffsvrkmmen in Überschriften der Artikeltext) gefiltert werden. Für einfache Suchen nach Keywrds und Metadaten stehen Frmulare auf der Benutzerberfläche zur Verfügung. Für kmplexe Anfragen gibt es eine Anfragesprache (Lucene Query Language) mit der genauere Filterungen vrgenmmen werden können. Im Vlltextindex sind die flgenden Infrmatinen erfasst und durchsuchbar: 1. Überschrift* 2. Unterüberschrift* 6
7 3. Dachtitel* 4. Dkumenttext (Absätze)* 5. Ressrt 6. Subressrt 7. Schlagwrte (nur bei manchen ZEIT-Daten) 8. Autr 9. Verlag 10. Nachrichtenagentur 11. Named-Entities 12. Datum 13. Seite Die mit * gekennzeichneten Datenfelder sind in zwei Varianten vlltextindiziert: nrmal und raw : nrmale Indexierung: ermöglichst Suche nach Schlüsselbegriffen hne Berücksichtigung vn Grß-Kleinschreibung aber mit Stemming und Entfernung vn Stppwrten1 raw -Indexierung: ermöglichst Suche nach Schlüsselbegriffen hne Berücksichtigung vn Grß-Kleinschreibung, hne Stemming und hne Entfernung vn Stppwrten Im LCM finden sich 3 Such-Möglichkeiten: Simple: einfache Suche nach Schlagwrtsuche auf den indexierten Textfeldern. Auswahl b auf "_raw" der nrmalen Indexfeldern gesucht wird Detailed: zusätzliche Sucheinschränkung nach Metadaten Custm: Eingabe eines Suchstrings in Lucene Query Syntax. Für eine Custm Query kann die mächtige Lucene Query Syntax direkt mit flgenden Feldnamen genutzt werden 1. Title bzw. Title_raw 2. Subtitle bzw. Subtitle_raw 3. Rftitle bzw. Rftitle_raw 4. Paragraph bzw. Paragraph_raw 5. Sectin 6. Subsectin 7. Subject 8. Creatr 9. Cmpany 10. NewsAgency 11. Entity 12. Date 13. Page 14. PublicatinType Beispiel 1 Eine Suche nach allen Artikeln aus der FAZ der taz, die "keine Alternative" im Untertitel enthalten 1 Unter Stppwörtern versteht man die Wrtarten, welche in einer Sprache sehr häufig für den Satzaufbau genutzt werden. Sie haben keine semantische Bedeutung für die Textinhalte. 7
8 kann flgendermaßen gestellt werden: Subtitle:"keine Alternative" AND (Cmpany:taz OR Cmpany:faz) --> liefert 2822 Treffer, vn denen die viele das Wrt "Alternative" der "Alternativen", aber nicht "keine Alternative" enthalten. Das liegt daran, dass wir hier auf dem Feld Subtitle gesucht haben, bei dem Stppwrte (wie "keine") nicht berücksichtigt werden Subtitle_raw:"keine Alternative" AND (Cmpany:taz OR Cmpany:faz) --> liefert 166 Treffer, vn denen alle die Phrase "keine Alternative" enthalten. Subtitle_raw:"keine Alternativen" AND (Cmpany:taz OR Cmpany:faz) --> liefert 16 Treffer, vn denen alle die Phrase "keine Alternativen" enthalten. (Subtitle_raw:"keine Alternative" OR Subtitle_raw:"keine Alternativen") AND (Cmpany:taz OR Cmpany:faz) --> liefert = 182 Treffer Beispiel 2 Suche nach allen Artikeln vn Karen Hrn in unserem Krpus: Creatr: (Karen Hrn) --> 21 Treffer, nämlich alljene, bei denen genau der Name als Autr- Metadatum in unserer DB ist. Frau Hrn schreibt aber auch unter Kürzel "rn" Creatr: (Karen Hrn) OR Paragraph_raw:rn --> 169 Treffer, aber auch ein paar Unerwünschte durch schlechtes OCR. Alle die nicht vn der FAZ sind könnten wir nch ausschließen (Creatr: (Karen Hrn) OR Paragraph_raw:rn) AND Cmpany:FAZ --> 73 Treffer Beispiel 3 Suche nach Date Ranges: Paragraph: Cbain AND Date:[ T00:00:00Z TO T00:00:00Z] -> 8 Treffer aus der Wche in der Kurt Cbain verstarb Cllectins Sbald sie ihre Suchanfrage passend für ihr Frschungsvrhaben frmuliert haben, können Sie aus der Treffermenge eine Cllectin anlegen, auf der dann weitere Analysen ausgeführt werden können. Cllectins haben einen selbst zu vergebenden Namen und sind mindestens einer NutzerIn zugerdnet. Tipp: Sbald Sie eine Suchanfrage zusammengestellt haben, die Sie als Grundlage für eine Cllectin nehmen möchten, sllten Sie sich die Suchanfrage separat in ein Textdkument abspeichern Time Series Treffer zu Suchanfragen können direkt als Zeitreihe visualisiert werden. Dabei lassen sich auch die Ergebnisse mehrerer Anfrage in einer Grafik kmbinieren. 8
9 Zusätzlich können Treffermengen auch als Heatmaps zu einzelnen Tagen des Suchzeitraums visualisiert werden Vlltextansicht Zeitungsartikel können im Vlltext gelesen werden. Schlussflgerungen und Interpretatinen auf Basis quantifizierender Auswertungsschritte können und sllten auf diese Weise immer mit einem qualitativen Blick in die Daten validiert werden Facets Bestimmte Metadaten zu Treffern vn Suchanfragen können aggregiert dargestellt werden. S ist es möglich zu erfassen, b eine Suchanfrage in einer bestimmten Publikatin, einem bestimmten Ressrt der in Zusammenhang mit einem bestimmten Eigennamen abslut der relativ häufig gemeinsam miteinander auftritt. Beispiel: Suchanfrage Olympia 9
10 2.2 Analysen auf Basis vn Cllectins Die flgenden Analysen können auf nach Suchanfragen gefilterten und anschließend gespeicherten Cllectins durchgeführt werden Frequenzanalyse Der LCM erlaubt die Berechnung vn Begriffsfrequenzen über die Zeit. Ergebnisse lassen sich in absluten und relativen Häufigkeiten (relativ in Bezug zur Gesamtmenge an Artikeln innerhalb der Cllectin). Beispiel: Cllectin Mindestlhn in den 1990er Jahren, Relative Frequenz der Begriffe Arbeitszeit und Arbeitsbedingungen 10
11 2.2.2 Kkkurrenzanalyse Statistisch signifikant überzufällig häufig miteinander auftretende Begriffe innerhalb vn Sätzen, Absätzen der Dkumenten lassen sich als Graphen darstellen. gerichteter Graph: linke / rechte Nachbarn eines Terms innerhalb des Texts ungerichteter Graph: gemeinsames Vrkmmen innerhalb einer Kntexteinheit (Satz, Absatz, Dkument) zweier Begriffe Matrix: gemeinsames Vrkmmen innerhalb einer Kntexteinheit Für die Berechnung der Kkkurrenzen ist eine Filterung nach Eigennamen möglich. S ist es beispielsweise möglich gemeinsam innerhalb eines Dkuments auftretende Eigennamen (Named Entities) zu messen. Beispiel: Cllectin Mindestlhn, gemeinsames Auftreten vn Named Entities zu Angela Merkel in Dkumenten 11
12 2.2.3 Tpic Mdelle Tpic Mdelle bilden glbale Begriffszusammenhänge auf Ebene einer Dkumentkllektin mit Hilfe latenter Variablen, den sgenannten Tpics, ab (Blei 2012). Die mit diesem Verfahren autmatisch berechneten Begriffszusammenhänge, können als latente Sinnkmplexe der Thematiken interpretiert werden, deren Verteilung über den Krpus insgesamt untersucht werden kann. Diese Verteilungen wiederum lassen sich zur Themenidentifikatin anwenden, mit deren Hilfe auf Artikelebenen bestimmte Themenkategrien in der Untermenge vn Artikeln aus dem Plitik-Ressrt des Zeitungskrpus separiert werden können. Der LCM erlaubt die Berechnung vn Tpic Mdels mit Hilfe einer Online-LDA Implementierung, mit der schnell sehr grße Kllektinen analysiert werden können. Als zweites steht ein Hierarchical Pitman-Yr Prcess zur Verfügung, der ggf. exaktere Tpics aber mit wesentlich längerer Berechnungszeit liefert. Berechnete Tpics aus einem Tpic Mdell auf Basis einer Cllectin können: zur Identifikatin vn Themen innerhalb einer Kllektin herangezgen werden (Tpic- Wahrscheinlichkeiten in der Kllektin und der die Tpics knstitiuerenden Begriffslisten) abslut der relativ über die Zeit visualisiert werden zur Verfeinerung der Cllectin genutzt werden (z.b. Filterung aller Dkumente die mit dem Thema Musik in Zusammenhang stehen aus einer Cllectin die anhand des Suchbegriffes Funk erzeugt wurde) Term Extraktin Tpic Mdellen extrahieren glbale Begriffszusammenhänge über latente Variablen. Die Begriffe, die Tpics repräsentieren können auch genutzt werden, um Listen wichtiger Begriffe einer Cllectin generell zu beschreiben. Der LCM bietet die Möglichkeit slche Listen vn Schlüsselbegriffen auf Basis vn Tpic-Mdellen zu berechnen und sich Beispiele für das Auftreten slche Begriffe in der Cllectin anzeigen zu lassen KWIC Begriffe aus der Liste der extrahierten Terme lassen sich als Keywrd in Cntext anzeigen. Dabei werden aus der aktuellen Cllectin Beispiel-Abschnitte extrahiert, die den ausgewählten Begriff enthalten und s eine qualitative Überprüfung der Verwendungsweise eines Begriffes ermöglichen Manuelle Anntatin Methdlgien der qualitativen Datenanalyse arbeiten in der Regel mit Kategrien, die entweder induktiv aus dem empirischen Material durch gründliches Lesen und interpretieren gewnnen werden der deduktiv auf Basis existierender Therien angeleitet und peratinalisiert werden (z.b. mit Hilfe vn Begriffslisten, sgenannten Diktinären). Der LCM unterstützt slche Arten der Analyse mit flgenden Funktinen: Definitin hierarchischer Kategriesysteme Kdierung vn Dkumenten der Textstellen mit Kategrien des Kategriesystems (vgl. zu Cde-and-Retrieve-Sftware a wie etwa MAXQDA der Atlas.ti) Messung vn Intercder-Übereinstimmungen bei der Vergabe vn Cdes durch 12
13 unterschiedliche Benutzer Beispiel Cllectin Mindestlhn : Kdierte Sätze, die eine Zustimmung bzw. Ablehnung zur Frderung nach einem Mindestlhn zum Ausdruck bringen Autmatische Klassifikatin Kategrien, für die sich eine hhe Intercder-Reliabilität erzielen lässt, die als hinreichend eindeutig definiert sind, s dass verschiedene Kdierer (größtenteils) die gleichen Kategrien für Dkumente der Textstellen vergeben, eignen sich auch für autmatische Klassifikatinsverfahren. Überwachte maschinelle Lernverfahren zur Klassifikatin lernen anhand gegebener Trainingsbeispiele die Einteilung in Zugehörigkeiten einer Datenentität zu einer definierten Klasse. Übersetzt für die Arbeit mit Texten bietet der LCM die Möglichkeit, Textstellen die einer Kategrie X zugerdnet wurden, als Trainingsbeispiele für die Klasse Zugehörigkeit zu X anzunehmen. Textstellen in anntierten Dkumenten, die nicht mit X kdiert sind, werden zu Trainingsbeispielen mit der Annahme nicht Zugehörig zu X. Aus genügend vielen Trainingsbeispielen für hinreichend diskriminative Kategrien lernt der LCM Textmerkmale (Wrtvrkmmen und deren Kmbinatinen), die auf das Vrhandensein einer bestimmten Klasse schließen lassen. Smit ist es möglich, zu bereits kdierten Textstellen neue Textstellen in Dkumenten einer Kllektin zu identifizieren, die höchstwahrscheinlich zur Kategrie passen. Auf diese Weise wird es möglich, sehr grße Dkumentmengen zu kdieren. Zur Bestimmung der Qualität der autmatischen Klassifikatin kmmen Evaluierungsmaße auf den Trainingsdaten zum Einsatz (Niekler/Dumm 2014). Zu iterativen Verbesserung der autmatischen Klassifikatin können die autmatisch ermittelten Zurdnungen bestätigt bzw. krrigiert werden ( Active Learning ). S wird das autmatische Klassifikatinsergebnis schrittweise verbessert. Auf diesem Wege können wenige Hand-kdierte Textabschnitte (n < 100) mit relativ wenig Aufwand auf größere Mengen vn Beispieltextabschnitten erweitert werden. Sbald die Evaluatinsmaße für die autmatische Klassifikatin befriedigende Ergebnisse liefern, kann mit der Anwendung des Klassifikatrs auf eine Cllectin eine zuverlässige Aussage über die Verteilung vn Kategrien, z.b. im Zeitverlauf getrffen werden. Beispiel: Häufigkeit der Kategrie Mindestlhn Zustimmung aus autmatisch klassifizierten Sätzen wie 13
14 DGB-Chef Michael Smmer hat einen gesetzlichen Mindestlhn vn 7,50 Eur gefrdert. der Die Vrwürfe zum Pst-Mindestlhn seien völlig ungerechtfertigt 3 Wrkflws und Hinweise zur Umsetzung Die ben vrgestellten Text Mining Verfahren, die im LCM zur Verfügung gestellt werden, können als Einzelverfahren zur Unterstützung vn Inhaltsanalysen genutzt werden. Durch die Kmbinatin vn Verfahren lassen sich für die Analyse aber erheblich mehr Erkenntnisse aus den prduzierten Ergebnissen ableiten. Die durch Text Mining Verfahren prduzierten Ergebnisse sind mitunter schwer als Einzelergebnisse für sich stehend zu interpretieren. Erkenntnisse können in diesem Fällen über den Vergleich vn Einzelergebnissen auf unterschiedlichen Grundgesamtheiten vn Daten gewnnen werden. 3.1 Aufteilung vn Datengrundlagen Cllectins aus Zeitungsartikeln als Repräsentanten einer Grundgesamtheit in Bezug auf eine bestimmte Fragestellung können am einfachsten nach Meta-Daten aufgeteilt werden. S lässt sich eine Cllectin, die anhand bestimmter Suchbegriffe identifiziert wurde, beispielsweise in verschiedene Zeitabschnitte der nach Zeitung der Zeitungsressrt der Kmbinatinen aus all diesen Metadaten aufteilen. Der Vergleich vn Ergebnissen aus Kkkurrenzanalysen zu bestimmten Schlüsselbegriffen kann s zum Beispiel zur Erfassung vn Bedeutungswandel über die Zeit beitragen (vgl. Lemke 2014 zum Begriff Sziale Marktwirtschaft ). 3.2 Kmbinatin vn Einzelverfahren Die zusammenhängende Betrachtung vn Ergebnissen aus den Einzelverfahren ermöglicht interessante Analyseprzesse. S lassen sich zum Beispiel aus der Bebachtung vn Frequenzen über den Zeitverlauf Zeitabschnitte erkennen, die auf eine gleichartige Verwendungsweise vn Begriffen hindeuten und Zeitpunkte, an denen Veränderungen stattfinden. Diese Zeitabschnitte 14
15 können zur Aufteilung einer Cllectin in Sub-Cllectins genutzt werden, auf denen dann weitere vergleichende Analysen wie Tpic Mdell- der Kkkurrenzberechnungen angewendet werden können. Tpic Mdelle selbst eignen sich über die Beschreibung vn thematischen Zusammenhängen hinaus zur Filterung vn Cllectins. S können spezifische semantische Zusammenhänge selektiert werden, mit denen die Aussagekraft vn Frequenzanalysen deutlich erhöht werden kann. Im Rahmen des epl-prjekts haben wir beispielsweise das Vrkmmen vn sgenannter Alternativlsigkeitsrhetrik in den Zeitungsartikeln gemessen. Dabei handelt es sich im Wesentlichen um ein Dictinary, dass Begriffe wie alternativls, keine Alternative, unvermeidbar, unumgänglich etc. enthält. Eine Messung der Begriffe auf dem Gesamtkrpus kann kaum aussagekräftig sein, da nichts über die Verwendungskntexte der Begriffe bekannt ist. Selektiert man aber Artikel aus dem Ressrt Plitik und filtert diese über ein Tpic Mdel zu einer Dkumentmenge, die Dkumente mit einem Themenanteil-Anteil EU, Eurpa, Eurpäische Integratin vn mindestens 20% enthalten, s werden Zählungen vn Begriffen der Knzepten (Begriffslisten) durch ihre Kntextualisierung deutlich aussagekräftiger. 3.3 Cllectin-Größe und Berechnungszeiten Der LCM erlaubt das Ausführen der.g. Analyseschritte und das Einstellen vn bestimmten Parametern über die Webanwendung. Einzelne Analyseschritte können dabei sehr lange Berechnungszeiten in Anspruch nehmen. Eine Kllektin mit ca Dkumenten benötigt zur Zeit für die Berechnung einer Frequenzextraktin ca. 11 Stunden, für ein Tpic Mdell ca. 12 Std. Dies sllten Sie für ihre Analyseplanung im Hinterkpf behalten. Für die Berechnungen wird außerdem sehr viel Arbeitsspeicher verbraucht, s.d. nur eine begrenzte Anzahl an Berechnungen parallel auf dem epl-server laufen kann. Das bedeutet, dass die vn Ihnen beauftragten Analysen vm Server unter Umständen einige Zeit in einer Warteschleife hängen. Denken Sie als daran, wenn Sie Analysetasks während des Wrkshps starten, dass Sie den anderen TeilnehmerInnen nicht durch ein Nacheinanderauslösen sehr vieler aufwändiger Tasks die Nutzungsmöglichkeiten zu sehr einschränken. Für den Wrkshp werden wir Kllektinen auf maximal Dkumente zu beschränken. Schränken Sie bei größeren Suchergebnismengen ihre Suche nach Zeitung, Zeitraum etc. ein und berechnen Sie Ergebnisse auf kleineren Cllectins. 3.4 Parameter Für Text Mining Anwendungen werden Textdaten in numerische Daten umgewandelt. In der Regel werden dafür Wrtvrkmmen in Dkumenten (bzw. Absätzen, Sätzen) gezählt. Die Zählungen über dem gesamten Vkabular einer Dkumentkllektin (als alle enthalten verschiedenen Wrtfrmen, sg. Types) werden pr Dkument in einem Vektr gespeichert. Alle Dkument- Vektren einer Kllektin bilden eine Term-Dkument-Matrix (TDM), auf der dann verschiedene textstatistische Auswertungen gemacht werden können. Slch eine TDM bildet die Bag-f-Wrds- Hypthese ab, bei der lediglich das Vrhandensein vn Wrtvrkmmen Berücksichtigung findet, nicht jedch die spezifische Reihenflge. Dies ist eine krasse Vereinfachungsannahme zur Mdellierung vn Sprachbedeutung, die sich jedch für viele Anwendungen als nützlich herausstellt. Vn besnderer Bedeutung für die Analysen sind die Vrverabreitungsschritte, wie diese TDM 15
16 erzeugt wird. Zum Beispiel sllten Wrtvrkmmen unter einem gewissen Schwellwert ignriert werden. Vrkmmen der Wrtvrkmmen Haus, Häuser, Hauses sllten ggf. zu Haus unifiziert werden. Für bestimmte Analysen sllen gar nur Nmen der Eigennamen berücksichtigt werden. Wenig Bedeutung tragende Wrte wie der, die, das, sgenannte Stppwrte, sllten für die meisten Anwendungen generell unberücksichtigt bleiben. Die Vrverarbeitung im LCM kann durch Benutzer über Parametereinstellungen im Task Scheduler gesteuert werden. Flgende Parameter können standardmäßig eingestellt werden: Replace tken with multi-wrd-units and entities : Vrberechnete Mehrwrteinheiten wie Sziale Marktwirtschaftlich der Ludwig Erhardt werden als ein Wrt statt zwei Wrte behandelt Transfrm entities t cannical frm : Verschiedene Varianten vn Persnennamen wie Barack Obama und Barack Hussein Obama werden auf eine Frm Barack Obama unifiziert Basefrm: ein Wrt wird auf sein Lemma unifiziert (ging gehen, geht gehen) Stemming: ein Wrt wird auf seinen Stamm unifiziert (ging ging, gehen geh, geht geh) Remve Stpwrds : lässt eine Liste mit ca dt. Stppwrten für die Analyse unberücksichtigt Transfrm t lwercase : Unifiziert Grßbuchstaben auf Kleinbuchstaben N-Gram: 1 = Unigram, zählt in Dkumenten Einzel-Tkens für die Term-Dkument-Matrix 2 = Bigram, zählt zusätzlich zu den Unigrammen Vrkmmen zweier aufeinanderflgender Tkens 3 = Trigram, zählt zusätzlich zu den Unigrammen Vrkmmen dreier aufeinanderflgender Tkens Die Benutzung vn N-Grams > 1 kann für die Klassifikatin vn Textabschnitten nützlich sein, um die strikte Bag-f-Wrds Hypthese aufzuweichen, indem kurze Kntexteinheiten durch aufeinanderflgender Wrte berücksichtigt werden Pruning: Für die Bedeutungsknstitutin vn Aussagen sind Wrte die besnders häufig bzw. besnders selten vrkmmen in der Regel weniger relevant als Wrte, die zwischen diesen Extremen liegen. Zur Verringerung der zu bearbeitenden Datenmengen und zur Verbesserung vn Ergebnissen sllten deshalb bestimmte besnders häufige/seltene Wrte für die Erstellung der TDM nicht berücksichtigt werden: relatives Pruning (min x/max y): Unberücksichtigt bleiben alle Wrte, die in weniger als x Przent, in mehr als y Przent aller Dkumente einer Cllectin vrkmmen abslutes Pruning (min x/max y): Unberücksichtigt bleiben alle Wrte, die seltener als x, häufiger als y mal in einer Cllectin vrkmmen Append_POS: Part-f-Speech Tagging ist eine Text Mining Aufgabe, bei der zu jedem Wrt 16
17 ein Wrtartenlabel zugerdnet wird (z.b. Nmen, gebeugtes Verb, Adjektiv, ). Beim Einsatz vn Stemming wird bspw. Eurpa und eurpäisch zur eurpa unifiziert. Das Anhängen des POS-Labels kann helfen etwa für eine Frequenz-Zählung eurpa_ne als Eigennamen und eurpa_adj als Adjektiv zu unterscheiden POS-Types : ermöglicht eine generelle Filterung der TDM nach POS-Types. S können z.b. für bestimmte Analysen nur Nmen der Verben Berücksichtigung finden Tken Minimum Length: Lässt alle Wrte unberücksichtigt, die kürzer als n Zeichen sind Wir haben uns bemüht, für die meisten Anwendungen sinnvlle Default-Parameter-Werte einzustellen. Weitere Erläuterungen dazu erflgen während des Wrkshps. 3.5 Task spezifische Parameter Kkkurrenzanalyse Minimum Cccurrence Frequency: Gespeichert werden nur Wrt-Paare, die mindestens n mal gemeinsam miteinander in einer Kntexteinheit auftreten Cntext Unit: Die Zählung gemeinsamer Wrtvrkmmen bezieht sich auf ungerichtete Kkkurrenzen innerhalb eines Satzes, Absatzes der Dkuments Neighbrhd hrizn: die Zählung bezieht sich auf gerichtete Kkkurrenzen (linke, rechte Nachbarn) im Abstand vn n tkens Tpic Mdels use paragraph as dcument : Themenmischungen innerhalb eines Absatzes (anstelle des ganzen Dkuments) inferieren. Diese Einstellung ist nur bei sehr langen Dkumenten sinnvlle (etwa Buchkapitel) Minimum length f dcument: Dkumente, die kürzer als n Zeichen sind, werden bei der Mdellberechnnung nicht berücksichtigt Klassifikatin Cntext unit: Kntexteinheit, der ein Cde aus ihrem Kategriesystem per Klassifikatin zugerdnet werden sll. Wenn Sie im Przess der manuellen Anntatin Textabschnitte über mehrere Sätze kdiert haben, ist Absatz hier wahrscheinlich die beste Wahl. Ist ihre Kdierung vrwiegend auf Einzelsätzen bzw. Satzfragmenten erflgt, dann wählen Sie hier auch Sätze aus. Prject / Categry: Auswahl des Prjekts / der Kategrie des Kategriensystems aus der manuellen Anntatin zu der eine autmatische Klassifikatin durchgeführt werden sll. Mde: Evaluate: Führt eine 10-Fld-Crssvalidierung auf den Trainingsdaten (manuell vergebene Cdes und ggf. bestätigte/krrigierte Ergebnisse aus der autmatischen Klassifikatin) aus und gibt die Ergebnisse im Lg des Task Schedulers aus (Dumm/Niekler 2014) 17
18 Evaluate Optimize: Führt eine 10-Fld-Crssvalidierung auf den Trainingsdaten mit verschiedenen Parameter-Werten (Psitive Scre, C-Wert) aus und gibt die beste Knfiguratin für die aktuelle Trainingsdatensituatin im Lg des Task Scheduler aus; ACHTUNG: Das Ausprbieren der verschiedenen Wertekmbinatinen kann sehr viel Zeit in Anspruch nehmen Classify: Führt eine Klassifikatin mit den angegebenen Parametern auf der ausgewählten Kategrie aus. Es werden neue Beispiele für den Active Learning Przess generiert. Zudem werden Frequenzzählungen der vergebenen Kategrie für Zeitreihendarstellungen auf der gesamten Cllectin prduziert. Save t Database: Speichert die Ergebnisse in der Datenbank. Wählen Sie diese Optin nur, wenn die Evaluatinsergebnisse anzeigen, dass Sie einige richtige Ergebnisse aus dem Przess der autmatischen Klassifikatin erwarten können. Andernfalls prbieren Sie / ptimieren Sie verschiedene der zwei flgenden Parameter, anntieren Sie manuell mehr Trainingsbeispiele der überarbeiten Sie ihr Kategriesystem Psitive scre threshld: Der eingesetzte SVM-Klassifikatr gibt für die Wahrscheinlichkeit dass das ausgewählte Kategrielabel an die Kntexteinheit vergeben wird einen Wert zwischen 0 und 1 aus. Ein Schwellwert vn 0.5 bedeutet für die Vrhersage, dass die Zurdnung des Labels wahrscheinlicher ist, als dass es nicht vergeben werden sllte. Für geringe Trainingsmengen am Anfang eines Klassifikatinsprzesses macht es jedch ggf. Sinn, auch bei kleineren Wahrscheinlichkeiten ein Label zu vergeben (Erhöhung des Recall), um genug Beispiele für den Active Learning Przess zu generieren (Evaluatin und ggf. Berichtigung der autmatisch gefundenen Textsstellen). Für abschließende Klassifikatinen zu finalen Auswertung einer Kategrie können Werte > 0.5 sinnvlle sein, um möglichst nur die bestpassendsten Textstellen zu berücksichtigen (Erhöhung der Precisin) 2 SVM C value: Ein Optimierungsparameter des SVM-Klassifikatrs, der entscheidet, wie gut der Klassifikatr auf die Trainingsdaten passend trainiert wird. Daumenmaß: wenig Trainingsdaten kleiner C-Wert; viele Trainingsdaten grßer C-Wert 4. Vrbereitung auf den Wrkshp / Operatinalisierung Dieser Paper sll Ihnen einen Vrgeschmack auf die Möglichkeiten der Text Mining gestützten Inhaltsanalyse mit dem LCM geben. Für die ptimale Nutzung der Zeit während des Wrkshps würde wir Sie bitten, sich schn einmal ein paar Gedanken zur Operatinalisierung ihrer Frschungsfrage zu machen. In (Dumm/Niekler 2014) wird eine Strategie für die Operatinalisierung vn Mixed-Methd-Ansätzen vrgeschlagen. Demnach sllte die Operatinalisierung flgende Schritte beachten, um eine methdische Nachvllziehbarkeit und Qualitätssicherung zu implementieren. 2 Siehe (Dumm/Niekler 2014) 18
19 1. Die gesamte Frschungsfrage muss in geeignete Teilaufgaben zerlegt werden. Dies beinhaltet die Analyse des Frschungsprzesses und Identifikatin vn Teilergebnissen, die zur Beantwrtung der Frschungsfrage beitragen. 2. In jeder der Teilaufgaben muss die Frschungsmethde identifiziert und festgelegt werden. Es muss definiert werden, b eine Teilaufgabe quantitativer der qualitativer Natur ist und b die Erkenntnisse deduktiv der induktiv erzeugt werden. 3. Durch die genaue Einteilung der Teilaufgaben ist es möglich, die aus den Methdenkatalgen der Disziplinen gültigen Mess-, Bewertungs-, Güte- der Evaluierungsverfahren zu identifizieren und einzusetzen. Ihre Vrbereitung auf den Wrkshp sllte die flgenden Schritte umfassen: 1. Dkumentselektin: Welche Suchbegriffe / Kmbinatin vn Suchbegriffen (Einschluss, Ausschluss, Nähe vn Begriffen,) und Meta-Daten (Daten, Zeitschrift, Ressrt, ) können geeignet sein, ihre Grundgesamtheit zu bestimmen? 2. Welche Verfahren des LCM wllen Sie einsetzen? Arbeiten Sie eher explrativ / induktiv? Dann sind Tpic Mdelle, Frequenz- und Kkkurrenzanalysen primär interessant für Sie. Haben Sie ein theretisches Mdell, dass Sie in ein Kategriensystem übersetzen und deduktiv testen wllen? Dann sind manuelle Kdierung und Klassifikatin interessante Anwendungen. Evtl. möchten Sie beides kmbinieren? 3. Dkumentieren Sie ihre Vrgehensweise und ihre Eindrücke während der Arbeit mit dem LCM. Wir betrachten das ganze auch als NutzerInnenexperiment, das uns hilft, die Sftware zu verbessern. Vr allem aber möchten wir gerne die methdische und methdlgische Reflexin über den Einsatz vn Text Mining Verfahren in den Szialwissenschaften vran bringen. 19
20 Weiterführende Literatur zur Vrbereitung Dumm, Sebastian / Niekler, Andreas (2014): Methden und Gütekriterien. Cmputergestützte Diskurs- und Inhaltsanalyse zwischen Szialwissenschaft und Autmatischer Sprachverarbeitung, Discussin Paper 4, epl-schriftenreihe. Niekler, Andreas / Wiedemann, Gregr / Heyer, Gerhard (2014): Leipzig Crpus Miner - A Text Mining Infrastructure fr Qualitative Data Analysis, Lemke, Matthias (2014): Das Verschwinden der Szialen Marktwirtschaft. Analyse der Verwendungsknjunkturen eines plitisch-kulturellen Kernbegriffs der Bundesrepublik Deutschland mit Text Mining Verfahren, im Review aber per Mail an die Wrkshp-TN. Grimmer, Justin; Stewart, Brandn (2013): Text as Data: The Prmise and Pitfalls f Autmatic Cntent Analysis Methds fr Plitical Texts. In: Plitical Analysis, S Blei, David M. (2012): Prbabilistic tpic mdels. Surveying a suite f algrithms that ffer a slutin t managing large dcument archives. Cmmunicatins f the ACM, 55(4),
21 Schriftenreihe des Verbundprjekts Pstdemkratie und Neliberalismus Auswahl der Diskussinspapiere (Stand Juli 2014) Nr. 1 Neliberalismus und Pstdemkratie: Bausteine einer kritischen Gesellschaftstherie. Gary S. Schaal & Claudia Ritzi Nr. 2 Die Öknmisierung des Plitischen. Entdifferenzierungen in kllektiven Entscheidungsprzessen Matthias Lemke Nr. 3 Argumentmarker. Definitin, Generierung und Anwendung im Rahmen eines semiautmatischen Dkument-Retrieval-Verfahrens Sebastian Dumm & Matthias Lemke Nr. 4 Methden und Gütekriterien. Cmputergestützte Diskurs- und Inhaltsanalysen zwischen Szialwissenschaft und Autmatischer Sprachverarbeitung Sebastian Dumm & Andreas Niekler Nr. 5 Analyse qualitativer Daten mit dem Leipzig Crpus Miner. Zur Vrbereitung des Wrkshps Text Mining in der Plitikwissenschaft Gregr Wiedemann & Andreas Niekler Die Arbeitspapiere können bestellt werden/the discussin papers can be rdered: Helmut-Schmidt-Universität Hamburg Frschungsprjekt Pstdemkratie und Neliberalismus Prfessur für Plitische Therie und Ideengeschichte z. H. Susanne Kirst Hlstenhfweg Hamburg 21
Kurzübersicht. Grundeinstellungen. 1) Im Rakuten Shop
Kurzübersicht Die Anbindung an Rakuten ermöglicht es Ihnen Bestellungen aus Ihrem Rakuten Shp zu imprtieren und hieraus Lieferscheine und Rechnungen zu erstellen. Prdukte lassen sich aus dem Rakuten Shp
MehrErlä uterungen zu Meldungen IP Losses Art. 101 CRR
Erlä uterungen zu Meldungen IP Lsses Art. 101 CRR Rechtlicher Hintergrund Die Verlustdaten, welche in Art. 101 CRR gemeldet werden, werden vn der FMA herangezgen, um zu beurteilen, b die (begünstigten)
MehrSPLIT-PAYMENT BUCHHALTUNG
SPLIT-PAYMENT BUCHHALTUNG Laut dem Stabilitätsgesetzt 2015 wurden einige wesentlich Neuerungen eingeführt. Ein Teil davn ist Artikel 17-ter DPR 733/72: Dieser Artikel 17-ter betrifft die Rechnungen an
Mehrrmdata GeoProject Release Notes Version 2.4 Organisation und Verwaltung von rmdata Projekten Copyright rmdata GmbH, 2015 Alle Rechte vorbehalten
Release Ntes rmdata GePrject Versin 2.4 Organisatin und Verwaltung vn rmdata Prjekten Cpyright rmdata GmbH, 2015 Alle Rechte vrbehalten rmdata Vermessung Österreich rmdata Vermessung Deutschland Industriestraße
MehrComputational Science. Sommersemester 2015 Bachelor MI, Modul No 6.0 Barbara Grüter in Zusammenarbeit mit Andreas Lochwitz
Cmputatinal Science Smmersemester 2015 Bachelr MI, Mdul N 6.0 Barbara Grüter in Zusammenarbeit mit Andreas Lchwitz In der Lehrveranstaltung werden Themen und Verfahren der Mdellbildung an empirischen Beispielen
MehrDigital Director Kompatibiltätsliste für Kameras
Digital Directr Kmpatibiltätsliste für Kameras (eine Dwnlad-Versin steht zur Verfügung unter www.manfrtt.cm) Kapitel.1 Liste der kmpatiblen Kameras Kapitel.2 Besnderheiten für jedes Mdell Kapitel.1 Liste
MehrFact Sheet 2 Personalkosten
Fact Sheet 2 Persnalksten V e G ü2 7 G ü Zusammenfassung: Für den Anspruch auf Erstattung vn Persnalksten, das Erstattungsantragsverfahren swie für die zur Erstattung vrzulegenden Nachweise gelten ausführliche
MehrHausanschluss. Strom Gas Fernwärme Wasser
Hausanschluss Strm Gas Fernwärme Wasser Infrmatinen für Bauherren, Architekten und Planungsbürs Stadtwerke Detmld GmbH Am Gelskamp 10 32758 Detmld Telefn: 05231 607 0 Telefax: 05231 66043 inf@stadtwerke-detmld.de
MehrCATIA Richtlinien. Es wird zuerst ein quadratischer Tank (geschlossene Form) konstruiert, dieser wird zu:
CATIA Richtlinien Inhalt: 1. Benennung vn Bauteile 2. Benennung vn Baugruppen 3. Strukturierung vn CATIA-Dateien 4. Uplad auf Agra Um die Benennung und die Struktur in CATIA zu vereinheitlichen bitten
MehrMicrosoft Visual Studio 2005 Team System
Micrsft Visual Studi 2005 Team System Eine Einschätzung der Einsatzmöglichkeiten im Gebiet des Sftware Offshring. Sebastian Geiger [geiger@fzi.de] Inhaltsverzeichnis Beschreibung des Szenaris... 2 Eingesetzte
MehrHilfe zur Urlaubsplanung und Zeiterfassung
Hilfe zur Urlaubsplanung und Zeiterfassung Urlaubs- und Arbeitsplanung: Mit der Urlaubs- und Arbeitsplanung kann jeder Mitarbeiter in Coffee seine Zeiten eintragen. Die Eintragung kann mit dem Status anfragen,
MehrSchritt 1 der gender-sensitiven Personalauswahl und -beurteilung: Anleitung Anforderungsanalyse
Schritt 1 der gender-sensitiven Persnalauswahl und -beurteilung: Anleitung Anfrderungsanalyse Erstellt im Vrhaben Auswahl und Beurteilung vn Führungskräften in Wissenschaft und Wirtschaft - wie unterscheiden
MehrBewerbung für die Auszeichnung RheumaPreis Fragebogen. Bitte füllen Sie diesen Fragebogen aus und senden Sie ihn an die folgende Adresse:
Bewerbung für die Auszeichnung RheumaPreis Fragebgen Bitte füllen Sie diesen Fragebgen aus und senden Sie ihn an die flgende Adresse: Organisatinsbür RheumaPreis Pstfach 17 03 61 60077 Frankfurt/Main Angaben
Mehr1 Konto für HBCI/FinTS mit Chipkarte einrichten
1 Konto für HBCI/FinTS mit Chipkarte einrichten Um das Verfahren HBCI/FinTS mit Chipkarte einzusetzen, benötigen Sie einen Chipkartenleser und eine Chipkarte. Die Chipkarte erhalten Sie von Ihrem Kreditinstitut.
MehrSuche schlecht beschriftete Bilder mit Eigenen Abfragen
Suche schlecht beschriftete Bilder mit Eigenen Abfragen Ist die Bilderdatenbank über einen längeren Zeitraum in Benutzung, so steigt die Wahrscheinlichkeit für schlecht beschriftete Bilder 1. Insbesondere
MehrUrlaubsregel in David
Urlaubsregel in David Inhaltsverzeichnis KlickDown Beitrag von Tobit...3 Präambel...3 Benachrichtigung externer Absender...3 Erstellen oder Anpassen des Anworttextes...3 Erstellen oder Anpassen der Auto-Reply-Regel...5
MehrHallo Frau / Herr. Vielen Dank, dass Sie sich Zeit nehmen, uns bei dieser Studie zu unterstützen. Mein Name ist und das ist mein/e Kollege/in.
Interview-Leitfaden Vrbereitung Labr / Mderatr Incentive Stifte für Mderatr und Prtkllant Uhr Aufnahmegerät Dkumente: Mderatinsleitfaden Einverständniserklärung Begrüßung Hall Frau / Herr. Vielen Dank,
MehrLehrer: Einschreibemethoden
Lehrer: Einschreibemethoden Einschreibemethoden Für die Einschreibung in Ihren Kurs gibt es unterschiedliche Methoden. Sie können die Schüler über die Liste eingeschriebene Nutzer Ihrem Kurs zuweisen oder
MehrDie Heinrich-Böll-Stiftung RLP macht sich für Demokratie stark
Die Heinrich-Böll-Stiftung RLP macht sich für Demkratie stark In Deutschland und in anderen Ländern. In einer Demkratie sllen alle Menschen sagen: Was ihnen wichtig ist. Und was sie nicht gut finden. Und
MehrElexis-BlueEvidence-Connector
Elexis-BlueEvidence-Connector Gerry Weirich 26. Oktober 2012 1 Einführung Dieses Plugin dient dazu, den Status Hausarztpatient zwischen der BlueEvidence- Anwendung und Elexis abzugleichen. Das Plugin markiert
MehrSehr wichtige Information
1 Sehr wichtige Infrmatin vn Mensch zuerst Netzwerk Peple First Deutschland e.v. Es gibt eine sehr wichtige Änderung für die Bilder aus 'Das neue Wörterbuch für Leichte Sprache'. Es geht um die bunten
MehrM@school online-administration - Frontersupport Selbstlernmaterial
Bildung und Sprt M@schl nline-administratin - Frntersupprt Selbstlernmaterial Hinweise zum Skript: LMK = Linker Mausklick LMT = Linke Maustaste RMK = Rechter Mausklick RMT = Rechte Maustaste Um die Lesbarkeit
MehrService Level Agreement (SLA) für OS4X Suite der c-works GmbH
Seite 1 vn 6 Service Level Agreement (SLA) für OS4X Suite der Datum des Inkrafttretens: 19-10-2011 Dkument-Eigentümer: Versin Versin Datum Beschreibung Autr 1.0 10.10.2011 Service Level Agreement H. Latzk
MehrAntragsstellung Führerschein. Information. Ersterteilung einer Fahrerlaubnis. Notwendige Unterlagen
Antragsstellung Führerschein Wir nehmen gemeinsam mit Ihnen den Führerscheinantrag auf und leiten diesen dann zur weiteren Bearbeitung an die Führerscheinstelle des Kreises Dithmarschen weiter. Sbald Ihr
MehrWDB Brandenburg: Online-Erfassung und -Pflege Schritt für Schritt
Für die Nutzung der Online-Erfassung und Pflege benötigen Sie Ihre Institutinsnummer und ein Passwrt. Sie sind nch nicht als Nutzer für die Online-Erfassung registriert? Betätigen Sie den Buttn Neu registrieren.
MehrBachelor-/Masterarbeit: Entwicklung eines Konzepts zur Gestaltung interaktiver Benutzeroberflächen (GUI/NUI) für Montagearbeitsplätze
Bachelr-/Masterarbeit: Entwicklung eines Knzepts zur Gestaltung interaktiver Benutzerberflächen (GUI/NUI) für Mntagearbeitsplätze - Hypthese: Unter der Berücksichtigung bestimmter, zu analysierender Faktren
MehrToshibaEdit - Software zum Bearbeiten von TV-Kanallisten für PC
TshibaEdit - Sftware zum Bearbeiten vn TV-Kanallisten für PC Inhalt: 1. Bevr Sie starten 2. Installatin 3. Kpieren Ihrer TV Kanalliste auf einen USB-Stick 4. Laden und bearbeiten vn TV Kanälen mit TshibaEdit
MehrKlausur Advanced Programming Techniques
Advanced Prgramming Techniques Autr: Prf. Dr. Bernhard Humm, FB Infrmatik, Hchschule Darmstadt Datum: 8. Juli 2008 Klausur Advanced Prgramming Techniques 1 Spielregeln zur Klausur Allgemeines Die Bearbeitungszeit
MehrImplementierung von Manufacturing Execution Systemen (MES) Zusammenfassung
Implementierung vn Manufacturing Executin Systemen (MES) Zusammenfassung Das Management der Fertigungs- und Mntageprzesse mit allen unmittelbar prduktinsbeeinflussenden Przessen wird zunehmend zu einer
MehrAnleitung zur Verwendung der VVW-Word-Vorlagen
Anleitung zur Verwendung der VVW-Word-Vorlagen v1.0. Feb-15 1 1 Vorwort Sehr geehrte Autorinnen und Autoren, wir haben für Sie eine Dokumentenvorlage für Microsoft Word entwickelt, um Ihnen die strukturierte
MehrUMSETZUNGSHILFE Exta Einladung zur Durchführung eines betrieblichen Eingliederungsmanagement nach 84 Abs. 2 SGB IX
UMSETZUNGSHILFE Exta Einladung zur Durchführung eines betrieblichen Eingliederungsmanagement nach 84 Abs. 2 SGB IX Mai 2015 & Thmas Hchgeschurtz 1. Anschreiben an Mitarbeiter zur Verfahrenseinleitung Einladung
MehrAnwendungsfelder Finanzmanager
Anwendungsfelder Finanzmanager Steuererklärung Bei allen Umsätzen, die steuerlich relevant (und absetzbar) sind, können Sie ESt in den Namen des Umsatzes hinzufügen. Bei der Bearbeitung der Steuererklärung
MehrLeitfaden #1a. "zanox Publisher-Statistik" (next generation)
Leitfaden #1a "zanox Publisher-Statistik" (next generation) Thema: Sortieren von Leads und Sales nach dem Bearbeitungsdatum (inklusive Abschnitt "Filterung nach Transaktionsstatus") 1/8 Leitfaden "Sortieren
MehrÖsterreichs erster Online-Shop zur Bestellung von Katalogen für Reisebüros
Österreichs erster Online-Shp zur Bestellung vn Katalgen für Reisebürs www.schengrundner.at einfach und sicher bestellen mehr als 500 Artikel Inhaltsbeschreibung der Artikel über 70 Anbieter Katalgvrschau
MehrMerkblatt 4-12. Sicherungsstrategien. Das Archivbit. Datensicherung. Es müssen prinzipiell zwei Arten von Sicherungsstrategien unterschieden werden:
Mdul 4 - Datensicherung Merkblatt 4-12 Datensicherung Sicherungsstrategien Es müssen prinzipiell zwei Arten vn Sicherungsstrategien unterschieden werden: Sicherung des Betriebsystems für eine Wiederherstellung
MehrPersönliches Adressbuch
Persönliches Adressbuch Persönliches Adressbuch Seite 1 Persönliches Adressbuch Seite 2 Inhaltsverzeichnis 1. WICHTIGE INFORMATIONEN ZUR BEDIENUNG VON CUMULUS 4 2. ALLGEMEINE INFORMATIONEN ZUM PERSÖNLICHEN
MehrHandbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken
Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen
MehrMwSt. Luxemburg ab 01/2015 Stand: 28. November 2014
MwSt. Luxemburg ab 01/2015 Stand: 28. Nvember 2014 Inhalt 1. Vrwrt... 2 2. Vraussetzungen... 2 3. Wer ist betrffen?... 2 4. Umstellung der neuen MwSt.-Cdes... 2 5. Umstellung im Detail... 4 6. Beispiele...
MehrAbgestimmte Kennwortrichtlinien
Abgestimmte Kennwrtrichtlinien Maik Görlich In Active Directry Dmänen unter Windws 2000 Server und Windws Server 2003 knnte jeweils nur eine einheitliche Kennwrtrichtlinie und eine Kntsperrungsrichtlinie
MehrDokumentation für die software für zahnärzte der procedia GmbH Onlinedokumentation
Dokumentation für die software für zahnärzte der procedia GmbH Onlinedokumentation (Bei Abweichungen, die bspw. durch technischen Fortschritt entstehen können, ziehen Sie bitte immer das aktuelle Handbuch
Mehrgeben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen
geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde
MehrMORE Profile. Pass- und Lizenzverwaltungssystem. Stand: 19.02.2014 MORE Projects GmbH
MORE Profile Pass- und Lizenzverwaltungssystem erstellt von: Thorsten Schumann erreichbar unter: thorsten.schumann@more-projects.de Stand: MORE Projects GmbH Einführung Die in More Profile integrierte
MehrKurzanleitung für Verkäufer
Kurzanleitung für Verkäufer Registrieren auf www.easybasar.de Einloggen Am Basar anmelden Artikel erfassen Artikel abgeben Artikel abholen Registrieren bei www.easybasar.de Sie sollten sich bereits vor
MehrZusammen machen die Betriebssysteme von Apple und Google fast 1/3 des Website-Traffic aus
Betriebssystem-Barmeter Zusammen machen die Betriebssysteme vn Apple und Ggle fast 1/3 des Website-Traffic aus Im Mai 2014 kamen 21,1 % des Website-Traffic in Eurpa über ein Betriebssystem vn Apple und
MehrDokumentation für Inventur
Dokumentation für Inventur dvc Computing, Software Service GmbH Kapitel 1 - Lagerstand merken Allgemein: Die Inventur wird im Programm AFL Lager Inventurprogramme aufgerufen. Für die Durchführung der Inventur
MehrMitarbeiterbefragung - Konzeptbeschreibung. Ziehen Ihre Mitarbeiter alle an einem Strang?
Mitarbeiterbefragung - Knzeptbeschreibung Ziehen Ihre Mitarbeiter alle an einem Strang? Im Grßen und Ganzen sind unsere Mitarbeiter recht zufrieden Beginnen wir mit einer Binsenweisheit: Eine der wichtigsten
MehrAnforderungen an die HIS
Anforderungen an die HIS Zusammengefasst aus den auf IBM Software basierenden Identity Management Projekten in NRW Michael Uebel uebel@de.ibm.com Anforderung 1 IBM Software Group / Tivoli Ein Feld zum
MehrLieferschein Dorfstrasse 143 CH - 8802 Kilchberg Telefon 01 / 716 10 00 Telefax 01 / 716 10 05 info@hp-engineering.com www.hp-engineering.
Lieferschein Lieferscheine Seite 1 Lieferscheine Seite 2 Inhaltsverzeichnis 1. STARTEN DER LIEFERSCHEINE 4 2. ARBEITEN MIT DEN LIEFERSCHEINEN 4 2.1 ERFASSEN EINES NEUEN LIEFERSCHEINS 5 2.1.1 TEXTFELD FÜR
MehrTactonWorks EPDM Integration. Lino EPDM pro. Whitepaper. unter Nutzung des TactonWorks Add-in EPDM von Tacton Systems AB
Lin EPDM pr Whitepaper unter Nutzung des TactnWrks Add-in EPDM vn Tactn Systems AB Ausgabedatum: 04.09.2013 - Dkumentversin: 1.1 Autr: Clemens Ambrsius / Rüdiger Dehn Cpyright Lin GmbH 2013 Alle Rechte
MehrARCO Software - Anleitung zur Umstellung der MWSt
ARCO Software - Anleitung zur Umstellung der MWSt Wieder einmal beschert uns die Bundesverwaltung auf Ende Jahr mit zusätzlicher Arbeit, statt mit den immer wieder versprochenen Erleichterungen für KMU.
MehrDiese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress.
Anmeldung http://www.ihredomain.de/wp-admin Dashboard Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress. Das Dashboard gibt Ihnen eine kurze Übersicht, z.b. Anzahl der Beiträge,
MehrDas ADR (Automatic Delivery Rewards) Programm in Europa
Das (Autmatic Delivery Rewards) Prgramm in Eurpa Vrteile ist ein mnatlicher autmatischer Lieferservice für Vertriebspartner, Vrzugskunden und Kunden. Das Prgramm fördert den mnatlichen Einkauf vn Nu Skin,
MehrGuide DynDNS und Portforwarding
Guide DynDNS und Portforwarding Allgemein Um Geräte im lokalen Netzwerk von überall aus über das Internet erreichen zu können, kommt man um die Themen Dynamik DNS (kurz DynDNS) und Portweiterleitung(auch
MehrDie Betriebliche Altersversorgung
Die Betriebliche Altersversrgung Die Betriebliche Altersversrgung Arbeitgeberexemplar Penning Steuerberatung Clumbusstraße 26 40549 Düsseldrf Tel.: 0211 55 00 50 Fax: 0211 55 00 555 Tückingstraße 6 41460
MehrErfassen von Service-Meldungen über das Web-Interface auf www.peras.de
Erfassen von Service-Meldungen über das Web-Interface auf www.peras.de Web Self Service Erfassen von Service-Meldungen Version 3.1 Seite 2 von 12 Anwenderdokumentation Version 3.1 Stand September 2011
MehrAbamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER
Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER Abamsoft Finos in Verbindung mit der Webshopanbindung wurde speziell auf die Shop-Software shop to date von DATA BECKER abgestimmt. Mit
MehrAnleitung Administrationsbereich www.pastoraler-raum-biedenkopf.de
Anleitung Administratinsbereich www.pastraler-raum-biedenkpf.de Anmeldung unter www.pastraler-raum-biedenkpf.de Für Eingabe vn neuen Beiträgen, Hchladen des Pfarrbriefs, Veränderungen an bestehenden Inhalten.ä.
MehrNewsletter e-rechnung an die öffentliche Verwaltung
Vn: E-Rechnung an den Bund Gesendet: Dnnerstag, 16. Oktber 201413:16 Betreff: ERB-Newsle)er: Deutsch Newsletter e-rechnung an die öffentliche Verwaltung Sehr geehrte Abnnentin, sehr
MehrMediumwechsel - VR-NetWorld Software
Mediumwechsel - VR-NetWorld Software Die personalisierte VR-NetWorld-Card wird mit einem festen Laufzeitende ausgeliefert. Am Ende der Laufzeit müssen Sie die bestehende VR-NetWorld-Card gegen eine neue
MehrKostenstellen verwalten. Tipps & Tricks
Tipps & Tricks INHALT SEITE 1.1 Kostenstellen erstellen 3 13 1.3 Zugriffsberechtigungen überprüfen 30 2 1.1 Kostenstellen erstellen Mein Profil 3 1.1 Kostenstellen erstellen Kostenstelle(n) verwalten 4
MehrGrundlagen der Inferenzstatistik
Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,
MehrInxmail Professional 4.4
E-Mail-Marketing Hw-t Inxmail Prfessinal 4.4 Neue Funktinen Im ersten Quartal 2014 wird Inxmail Prfessinal 4.4 veröffentlicht. In dieser Versin steht der Split-Test in völlig überarbeiteter Frm innerhalb
MehrAgentur für Werbung & Internet. Schritt für Schritt: Newsletter mit WebEdition versenden
Agentur für Werbung & Internet Schritt für Schritt: Newsletter mit WebEdition versenden E-Mail-Adresse im Control Panel einrichten Inhalt Vorwort 3 Einstellungen im Reiter «Eigenschaften» 4 Einstellungen
MehrDokumentation zum Spielserver der Software Challenge
Dokumentation zum Spielserver der Software Challenge 10.08.2011 Inhaltsverzeichnis: Programmoberfläche... 2 Ein neues Spiel erstellen... 2 Spielfeldoberfläche... 4 Spielwiederholung laden... 5 Testdurchläufe...
MehrBilanz Basis. Funktionsdetails
Bilanz Basis Die nun flgenden Funktinsdetails zeigen Ihnen, welche Möglichkeiten Ihnen die BMD-NTCS-Bilanzierung bietet und welche Stärken diese Sftware für Sie bereithält. Funktinsdetails Erstellung vn
MehrTevalo Handbuch v 1.1 vom 10.11.2011
Tevalo Handbuch v 1.1 vom 10.11.2011 Inhalt Registrierung... 3 Kennwort vergessen... 3 Startseite nach dem Login... 4 Umfrage erstellen... 4 Fragebogen Vorschau... 7 Umfrage fertigstellen... 7 Öffentliche
MehrUnterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Das komplette Material finden Sie hier: Download bei School-Scout.de
MehrVon Übersicht und Zuversicht in komplexen Projekten: GUI-Redesign einer CRM-Lösung
Vn Übersicht und Zuversicht in kmplexen Prjekten: GUI-Redesign einer CRM-Lösung Referent: Christian Wlf CRM Gipfeltur Kundenname Vrstellung Vn Übersicht und Zuversicht in kmplexen Prjekten: GUI-Redesign
MehrSeite 1 von 14. Cookie-Einstellungen verschiedener Browser
Seite 1 von 14 Cookie-Einstellungen verschiedener Browser Cookie-Einstellungen verschiedener Browser, 7. Dezember 2015 Inhaltsverzeichnis 1.Aktivierung von Cookies... 3 2.Cookies... 3 2.1.Wofu r braucht
MehrEr musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt
Inhaltsverzeichnis Aufgabe... 1 Allgemein... 1 Active Directory... 1 Konfiguration... 2 Benutzer erstellen... 3 Eigenes Verzeichnis erstellen... 3 Benutzerkonto erstellen... 3 Profil einrichten... 5 Berechtigungen
MehrA1.7: Entropie natürlicher Texte
A1.7: Entropie natürlicher Texte Anfang der 1950er Jahre hat Claude E. Shannon die Entropie H der englischen Sprache mit einem bit pro Zeichen abgeschätzt. Kurz darauf kam Karl Küpfmüller bei einer empirischen
MehrLabel-Guide Stand: 10 2014
Label-Guide Stand: 10 2014 Der ClimatePartner Label-Guide 2 Über ClimatePartner ClimatePartner ist ein führender Business Slutin Prvider für Klimaschutz und unterstützt Unternehmen aller Branchen dabei,
MehrGimp Kurzanleitung. Offizielle Gimp Seite: http://www.gimp.org/
Gimp Kurzanleitung Offizielle Gimp Seite: http://www.gimp.org/ Inhalt Seite 2 Seite 3-4 Seite 5-6 Seite 7 8 Seite 9 10 Seite 11-12 Ein Bild mit Gimp öffnen. Ein Bild mit Gimp verkleinern. Ein bearbeitetes
Mehrecampus elearning Initiative der HTW Dresden
Anleitung zum Imprt des OPAL-Outputs (Excel-Datei) in SPSS Einleitung (Uwe Altmann, 24.10.2008) Am Ende einer Befragung (Evaluatin) kann der Kursleiter/ die Kursleiterin in OPAL über die Rubrik Datenarchivierung
MehrVorbereitung der Abiturzeugnisse mit CUBE-SVS
Vrbereitung der Abiturzeugnisse mit CUBE-SVS Zur Schreibweise: Menüpunkt im Hauptmenü (waagerecht) Menüpunkt im Untermenü (klappt senkrecht herunter) Bearbeitungsvrgang / ntwendige Einstellungen Die ntwendigen
MehrDie integrierte Zeiterfassung. Das innovative Softwarekonzept
Die integrierte Zeiterfassung Das innovative Softwarekonzept projekt - ein komplexes Programm mit Zusatzmodulen, die einzeln oder in ihrer individuellen Zusammenstellung, die gesamte Abwicklung in Ihrem
MehrKESB-Kennzahlen Kanton Zürich. Bericht 2015. Verabschiedet am 21. April 2016
KPV KESB-Präsidienvereinigung Kantn Zürich c/ KESB Bezirk Pfäffikn ZH Schmittestrasse 10 Pstfach 68 8308 Illnau Tel 052 355 27 77 Fax 052 355 27 89 Web: www.kesb-zh.ch KESB-Kennzahlen Kantn Zürich Bericht
MehrErfahrungen mit Hartz IV- Empfängern
Erfahrungen mit Hartz IV- Empfängern Ausgewählte Ergebnisse einer Befragung von Unternehmen aus den Branchen Gastronomie, Pflege und Handwerk Pressegespräch der Bundesagentur für Arbeit am 12. November
MehrIst Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers
Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers Ist Excel das richtige Tool für FMEA? Einleitung Wenn in einem Unternehmen FMEA eingeführt wird, fangen die meisten sofort damit an,
MehrAnweisungen für die automatische Installation von Microsoft SharePoint
Anweisungen für die autmatische Installatin vn Micrsft SharePint Mindjet Crpratin Service-Htline: +49 (0)6023 9645 0 1160 Battery Street East San Francisc CA 94111 USA Telefn: 415-229-4200 Fax: 415-229-4201
MehrGrundfunktionen und Bedienung
Kapitel 13 Mit der App Health ist eine neue Anwendung in ios 8 enthalten, die von vorangegangenen Betriebssystemen bislang nicht geboten wurde. Health fungiert dabei als Aggregator für die Daten von Fitness-
MehrThe Cable Guy: Dynamische DNS-Aktualisierung in Windows 2000
The Cable Guy: Dynamische DNS-Aktualisierung in Windws 2000 (Engl. Originaltitel: The Cable Guy: DNS Dynamic Update in Windws 2000) DNS (Dmain Name System) unterstützt einen Mechanismus zum Auflösen vn
MehrDieser Ablauf soll eine Hilfe für die tägliche Arbeit mit der SMS Bestätigung im Millennium darstellen.
Millennium SMS Service Schnellübersicht Seite 1 von 6 1. Tägliche Arbeiten mit der SMS Bestätigung Dieser Ablauf soll eine Hilfe für die tägliche Arbeit mit der SMS Bestätigung im Millennium darstellen.
MehrDokumentation Typo3. tt - news - Nachrichtenmodul
Dokumentation Typo3 tt - news - Nachrichtenmodul 2 Inhaltsverzeichnis 1.1 Erstellen neuer News Beiträge... 3 1.2 Bearbeiten des Textes... 4 1.3 Einstellen Datum, Archivdatum, Sprache... 5 1.4 Einfügen
MehrSo importieren Sie einen KPI mithilfe des Assistenten zum Erstellen einer Scorecard
1 von 6 102013 18:09 SharePoint 2013 Veröffentlicht: 16.07.2012 Zusammenfassung: Hier erfahren Sie, wie Sie einen KPI (Key Performance Indicator) mithilfe des PerformancePoint Dashboard Designer in SharePoint
MehrAccess [basics] Rechnen in Berichten. Beispieldatenbank. Datensatzweise berechnen. Berechnung im Textfeld. Reporting in Berichten Rechnen in Berichten
Berichte bieten die gleichen Möglichkeit zur Berechnung von Werten wie Formulare und noch einige mehr. Im Gegensatz zu Formularen bieten Berichte die Möglichkeit, eine laufende Summe zu bilden oder Berechnungen
MehrDokumentation von Ük Modul 302
Dokumentation von Ük Modul 302 Von Nicolas Kull Seite 1/ Inhaltsverzeichnis Dokumentation von Ük Modul 302... 1 Inhaltsverzeichnis... 2 Abbildungsverzeichnis... 3 Typographie (Layout)... 4 Schrift... 4
Mehrecaros2 - Accountmanager
ecaros2 - Accountmanager procar informatik AG 1 Stand: FS 09/2012 Inhaltsverzeichnis 1 Aufruf des ecaros2-accountmanager...3 2 Bedienung Accountmanager...4 procar informatik AG 2 Stand: FS 09/2012 1 Aufruf
MehrSehr geehrte Fortbildungsteilnehmende!
Sehr geehrte Fortbildungsteilnehmende! Ab sofort ist die Anmeldung zu den Veranstaltungen des Kinderbildungs- und betreuungsreferates der A6 ausschließlich online durchführbar. Dazu ist ein eigenes Seminarverwaltungsprogramm
MehrFunktionsbeschreibung. Lieferantenbewertung. von IT Consulting Kauka GmbH
Funktionsbeschreibung Lieferantenbewertung von IT Consulting Kauka GmbH Stand 16.02.2010 odul LBW Das Modul LBW... 3 1. Konfiguration... 4 1.1 ppm... 4 1.2 Zertifikate... 5 1.3 Reklamationsverhalten...
MehrIn diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.
Tutorial: Wie erfasse ich einen Termin? In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können. Neben den allgemeinen Angaben zu einem
MehrNein. Wir garantieren Ihnen einen freien Parkplatz innerhalb des Parkplatzes. Sie können jeden freien Platz nutzen.
Online-Parkplatzreservierung Häufig gestellte Fragen Kurzanleitung zur Online-Parkplatzreservierung: 1. Besuchen Sie uns auf der Internetseite www.cruisegate-hamburg.de und flgen drt den Hinweisen. Bis
MehrISA Server 2004 Protokollierung - Von Marc Grote. Die Informationen in diesem Artikel beziehen sich auf:
ISA Server 2004 Protokollierung - Von Marc Grote Die Informationen in diesem Artikel beziehen sich auf:? Microsoft ISA Server 2004 Im Artikel Übersicht Monitoring wurde eine Zusammenfassung aller Überwachungsfunktionen
MehrDurchführung der Datenübernahme nach Reisekosten 2011
Durchführung der Datenübernahme nach Reisekosten 2011 1. Starten Sie QuickSteuer Deluxe 2010. Rufen Sie anschließend über den Menüpunkt /Extras/Reisekosten Rechner den QuickSteuer Deluxe 2010 Reisekosten-Rechner,
MehrOptimieren Sie Ihre n2n Webseite
N2N Autor: Bert Hofmänner 5.10.2011 Optimieren Sie Ihre n2n Webseite Einer der wichtigsten Faktoren für den Erfolg Ihrer Webseite in Suchmaschinen sind deren Inhalte. Diese können Sie mit einem Content
MehrAnwendungshinweise zur Anwendung der Soziometrie
Anwendungshinweise zur Anwendung der Soziometrie Einführung Die Soziometrie ist ein Verfahren, welches sich besonders gut dafür eignet, Beziehungen zwischen Mitgliedern einer Gruppe darzustellen. Das Verfahren
MehrLeitfaden trixikfz Online
Leitfaden trixikfz Online Inhalt Eine neue Berechnung durchführen... 2 Angebote erstellen, Leistungsdetails zum Tarif, Deckungsauftrag erstellen... 6 Angebot erstellen... 7 Leistungsdetails zum Tarif...
MehrYouTube: Video-Untertitel übersetzen
Der Easytrans24.com-Ratgeber YouTube: Video-Untertitel übersetzen Wie Sie mit Hilfe von Easytrans24.com in wenigen Schritten Untertitel für Ihre YouTube- Videos in mehrere Sprachen übersetzen lassen können.
Mehr