Nachrichtenklassifikation als Komponente in WEBIS
|
|
- Käthe Siegel
- vor 6 Jahren
- Abrufe
Transkript
1 Verteidigung der Diplomarbeit Nachrichtenklassifikation als Komponente in WEBIS Björn Krellner Fakultät für Informatik Professur Informationssysteme und Softwaretechnologie
2 Inhalt 1 Voraussetzungen/Zielstellung 2 WEBIS 3 Entwickelte Software 4 Klassifikationsergebnisse
3 Informationsverarbeitung Daten Informationen Daten: Angaben über verschiedenste Fakten oder Zusammenhänge Objektiv wahrnehmbar und potentiell verwertbar Informationen: Erkennbare Semantik Beseitigung einer Ungewissheit Finanzwelt: Einzelner Aktienkurswert: Datum Kurswert einer Firma zu mehreren Zeitpunkten: Information bei entsprechender Fachkenntnis
4 Informationsverarbeitung Daten Informationen Daten: Angaben über verschiedenste Fakten oder Zusammenhänge Objektiv wahrnehmbar und potentiell verwertbar Informationen: Erkennbare Semantik Beseitigung einer Ungewissheit Finanzwelt: Einzelner Aktienkurswert: Datum Kurswert einer Firma zu mehreren Zeitpunkten: Information bei entsprechender Fachkenntnis
5 Informationsverarbeitung Daten Informationen Daten: Angaben über verschiedenste Fakten oder Zusammenhänge Objektiv wahrnehmbar und potentiell verwertbar Informationen: Erkennbare Semantik Beseitigung einer Ungewissheit Finanzwelt: Einzelner Aktienkurswert: Datum Kurswert einer Firma zu mehreren Zeitpunkten: Information bei entsprechender Fachkenntnis
6 Informationsverarbeitung Daten Informationen Daten: Angaben über verschiedenste Fakten oder Zusammenhänge Objektiv wahrnehmbar und potentiell verwertbar Informationen: Erkennbare Semantik Beseitigung einer Ungewissheit Finanzwelt: Einzelner Aktienkurswert: Datum Kurswert einer Firma zu mehreren Zeitpunkten: Information bei entsprechender Fachkenntnis
7 Textanalyse im Börsenumfeld Nachrichten aus dem Umfeld von Wirtschaft und Börse Meldungen zu bestimmten Firmen oder speziellen Wirtschaftsbereichen Neuigkeiten, die die gesamte Wirtschaft und die Finanzstabilität im Land betreffen Einfache und schnelle Verfügbarkeit über das Internet Menge der digital zur Verfügung stehenden Nachrichten macht es Aktionären/Börsenmaklern nahezu unmöglich, diese manuell zu analysieren und damit zeitnah und angemessen reagieren zu können Auswertung mit Hilfe von Computersystemen gewünscht
8 Textanalyse im Börsenumfeld Nachrichten aus dem Umfeld von Wirtschaft und Börse Meldungen zu bestimmten Firmen oder speziellen Wirtschaftsbereichen Neuigkeiten, die die gesamte Wirtschaft und die Finanzstabilität im Land betreffen Einfache und schnelle Verfügbarkeit über das Internet Menge der digital zur Verfügung stehenden Nachrichten macht es Aktionären/Börsenmaklern nahezu unmöglich, diese manuell zu analysieren und damit zeitnah und angemessen reagieren zu können Auswertung mit Hilfe von Computersystemen gewünscht
9 Textanalyse im Börsenumfeld Nachrichten aus dem Umfeld von Wirtschaft und Börse Meldungen zu bestimmten Firmen oder speziellen Wirtschaftsbereichen Neuigkeiten, die die gesamte Wirtschaft und die Finanzstabilität im Land betreffen Einfache und schnelle Verfügbarkeit über das Internet Menge der digital zur Verfügung stehenden Nachrichten macht es Aktionären/Börsenmaklern nahezu unmöglich, diese manuell zu analysieren und damit zeitnah und angemessen reagieren zu können Auswertung mit Hilfe von Computersystemen gewünscht
10 Textanalyse im Börsenumfeld Nachrichten aus dem Umfeld von Wirtschaft und Börse Meldungen zu bestimmten Firmen oder speziellen Wirtschaftsbereichen Neuigkeiten, die die gesamte Wirtschaft und die Finanzstabilität im Land betreffen Einfache und schnelle Verfügbarkeit über das Internet Menge der digital zur Verfügung stehenden Nachrichten macht es Aktionären/Börsenmaklern nahezu unmöglich, diese manuell zu analysieren und damit zeitnah und angemessen reagieren zu können Auswertung mit Hilfe von Computersystemen gewünscht
11 Bestehende Software und Erweiterungswünsche In Studienarbeit Nachrichtenklassikation unter Nutzung regulärer Ausdrücke Prototyp entstanden Umfangreiche Vorverarbeitung von deutschsprachigen Börsennachrichten und Naive-Bayes-Klassifikation prozentuelle Vorhersage UP/DOWN Nutzung einer Java-Statistikbibliothek, einzelne Bearbeitungsschritte mit bash-skripten implementiert Klassifizierungsmöglichkeit neuer unbekannter Texte mit bereits erlernten Klassifikatoren und benutzerfreundliche grafische Oberfläche gewünscht Integration dieser Software in bestehendes Informationssystem WEBIS gewünscht
12 Bestehende Software und Erweiterungswünsche In Studienarbeit Nachrichtenklassikation unter Nutzung regulärer Ausdrücke Prototyp entstanden Umfangreiche Vorverarbeitung von deutschsprachigen Börsennachrichten und Naive-Bayes-Klassifikation prozentuelle Vorhersage UP/DOWN Nutzung einer Java-Statistikbibliothek, einzelne Bearbeitungsschritte mit bash-skripten implementiert Klassifizierungsmöglichkeit neuer unbekannter Texte mit bereits erlernten Klassifikatoren und benutzerfreundliche grafische Oberfläche gewünscht Integration dieser Software in bestehendes Informationssystem WEBIS gewünscht
13 Bestehende Software und Erweiterungswünsche In Studienarbeit Nachrichtenklassikation unter Nutzung regulärer Ausdrücke Prototyp entstanden Umfangreiche Vorverarbeitung von deutschsprachigen Börsennachrichten und Naive-Bayes-Klassifikation prozentuelle Vorhersage UP/DOWN Nutzung einer Java-Statistikbibliothek, einzelne Bearbeitungsschritte mit bash-skripten implementiert Klassifizierungsmöglichkeit neuer unbekannter Texte mit bereits erlernten Klassifikatoren und benutzerfreundliche grafische Oberfläche gewünscht Integration dieser Software in bestehendes Informationssystem WEBIS gewünscht
14 Bestehende Software und Erweiterungswünsche In Studienarbeit Nachrichtenklassikation unter Nutzung regulärer Ausdrücke Prototyp entstanden Umfangreiche Vorverarbeitung von deutschsprachigen Börsennachrichten und Naive-Bayes-Klassifikation prozentuelle Vorhersage UP/DOWN Nutzung einer Java-Statistikbibliothek, einzelne Bearbeitungsschritte mit bash-skripten implementiert Klassifizierungsmöglichkeit neuer unbekannter Texte mit bereits erlernten Klassifikatoren und benutzerfreundliche grafische Oberfläche gewünscht Integration dieser Software in bestehendes Informationssystem WEBIS gewünscht
15 Bestehende Software und Erweiterungswünsche In Studienarbeit Nachrichtenklassikation unter Nutzung regulärer Ausdrücke Prototyp entstanden Umfangreiche Vorverarbeitung von deutschsprachigen Börsennachrichten und Naive-Bayes-Klassifikation prozentuelle Vorhersage UP/DOWN Nutzung einer Java-Statistikbibliothek, einzelne Bearbeitungsschritte mit bash-skripten implementiert Klassifizierungsmöglichkeit neuer unbekannter Texte mit bereits erlernten Klassifikatoren und benutzerfreundliche grafische Oberfläche gewünscht Integration dieser Software in bestehendes Informationssystem WEBIS gewünscht
16 WEBIS-Historie 2001 Web-orientiertes Informationssystem entwickelt Java-GUI mit Wrapper-Generator und XML-Repository Datenspeicherung in XML Funktionalität wird mit Namen ausgedrückt Name = Projekt, Programm und Funktion Anfänglich keine Spezialisierung auf Themengebiet, später wegen umfangreicher Datenverfügbarkeit Börsenmarkt ausgewählt Diverse Architekturveränderungen: Client/Server Plug-in-Prinzip
17 WEBIS-Historie 2001 Web-orientiertes Informationssystem entwickelt Java-GUI mit Wrapper-Generator und XML-Repository Datenspeicherung in XML Funktionalität wird mit Namen ausgedrückt Name = Projekt, Programm und Funktion Anfänglich keine Spezialisierung auf Themengebiet, später wegen umfangreicher Datenverfügbarkeit Börsenmarkt ausgewählt Diverse Architekturveränderungen: Client/Server Plug-in-Prinzip
18 WEBIS-Historie 2001 Web-orientiertes Informationssystem entwickelt Java-GUI mit Wrapper-Generator und XML-Repository Datenspeicherung in XML Funktionalität wird mit Namen ausgedrückt Name = Projekt, Programm und Funktion Anfänglich keine Spezialisierung auf Themengebiet, später wegen umfangreicher Datenverfügbarkeit Börsenmarkt ausgewählt Diverse Architekturveränderungen: Client/Server Plug-in-Prinzip
19 WEBIS-Historie 2001 Web-orientiertes Informationssystem entwickelt Java-GUI mit Wrapper-Generator und XML-Repository Datenspeicherung in XML Funktionalität wird mit Namen ausgedrückt Name = Projekt, Programm und Funktion Anfänglich keine Spezialisierung auf Themengebiet, später wegen umfangreicher Datenverfügbarkeit Börsenmarkt ausgewählt Diverse Architekturveränderungen: Client/Server Plug-in-Prinzip
20 WEBIS-Historie 2001 Web-orientiertes Informationssystem entwickelt Java-GUI mit Wrapper-Generator und XML-Repository Datenspeicherung in XML Funktionalität wird mit Namen ausgedrückt Name = Projekt, Programm und Funktion Anfänglich keine Spezialisierung auf Themengebiet, später wegen umfangreicher Datenverfügbarkeit Börsenmarkt ausgewählt Diverse Architekturveränderungen: Client/Server Plug-in-Prinzip
21 WEBIS-Client/Server-Architektur WEBIS-Server WEBIS-Client - WEBIS Program Logic - Data Processing - Data Storage Communication via Java RMI WEBIS-Client WEBIS GUI for User B WEBIS GUI for User A Quelle: Diplomarbeit Frank Ahnert 2005 Clients dienen fast ausschließlich als Benutzerschnittstelle Plug-in-Anbindung an Client und Server
22 WEBIS-Client/Server-Architektur WEBIS-Server WEBIS-Client - WEBIS Program Logic - Data Processing - Data Storage Communication via Java RMI WEBIS-Client WEBIS GUI for User B WEBIS GUI for User A Quelle: Diplomarbeit Frank Ahnert 2005 Clients dienen fast ausschließlich als Benutzerschnittstelle Plug-in-Anbindung an Client und Server
23 WEBIS-Client/Server-Architektur WEBIS-Server WEBIS-Client - WEBIS Program Logic - Data Processing - Data Storage Communication via Java RMI WEBIS-Client WEBIS GUI for User B WEBIS GUI for User A Quelle: Diplomarbeit Frank Ahnert 2005 Clients dienen fast ausschließlich als Benutzerschnittstelle Plug-in-Anbindung an Client und Server
24 Übersicht der entwickelten Software WEBIS Client de.tu_chemnitz.webis.trendforecast Server User Interface Classifier Server Separate Program Non Client/Server
25 2006-KW27/ _16-57_0000.txt Börsengangs der russischen Ölgesellschaft OAO Rosneft unverbindlich Aktien gezeichnet. Der britische Ölkonzern "hat informellen geordert. Er könnte immer noch aussteigen", sagte am Mittwoch eine Person, die mit der Transaktion zu tun hat. DJG/flf/nas :57 ALLGEMEINES MARKT/Euro Stoxx 50 nahe 200 Tage Linie Dow Jones Euro STOXX 50 Index MARKT/Euro Stoxx 50 nahe 200 Tage Linie Auf ein erneutes Unterschreiten der 200 Tage Linie im Euro Stoxx 50 stellen sich Marktteilnehmer ein. Sie liege bei Punkten. Im DAX verlaufe die 38 Tage Linie bei und die 200 Tage Linie bei Punkten. Euro Stoxx 50 minus 1,6% auf Punkte. DJG/hru/raz :54 UNTERNEHMEN INLAND MARKT/"Fat finger" in Siemens
26 2006-KW27/ _16-57_0000.txt Börsengangs der russischen Ölgesellschaft OAO Rosneft unverbindlich Aktien gezeichnet. Der britische Ölkonzern "hat informellen geordert. Er könnte immer noch aussteigen", sagte am Mittwoch eine Person, die mit der Transaktion zu tun hat. DJG/flf/nas :57 ALLGEMEINES MARKT/Euro Stoxx 50 nahe 200 Tage Linie Dow Jones Euro STOXX 50 Index MARKT/Euro Stoxx 50 nahe 200 Tage Linie Auf ein erneutes Unterschreiten der 200 Tage Linie im Euro Stoxx 50 stellen sich Marktteilnehmer ein. Sie liege bei Punkten. Im DAX verlaufe die 38 Tage Linie bei und die 200 Tage Linie bei Punkten. Euro Stoxx 50 minus 1,6% auf Punkte. DJG/hru/raz :54 UNTERNEHMEN INLAND MARKT/"Fat finger" in Siemens
27 2006-KW27/ _16-54_0000.txt Siemens NA MARKT/"Fat finger" in Siemens Ein "fat finger" hat Siemens nach unten gedrückt, seitdem erholt sich der Kurs nach Vola Interruption. Derzeit steht der Kurs 2,1% im Minus bei 67,13 EUR nach einem Tief von 66,40 EUR. DJG/hru/raz :53 ALLGEMEINES MARKT/DAX fällt weiter JPM nimmt Arbei DAX MARKT/DAX fällt weiter JPM nimmt Arbeitsmarktprognose hoch Der DAX fällt auf neue Tagestiefs und steht nur noch knapp über Punkten. J.P. Morgan habe nach dem ADP Bericht nun die Prognose für den Arbeitsmarktbericht am Freitag nach oben genommen, das Haus erwarte nun neue Stellen auÿerhalb der Landwirtschaft nach
28 2006-KW27/ _16-54_0000.txt Siemens NA MARKT/"Fat finger" in Siemens Ein "fat finger" hat Siemens nach unten gedrückt, seitdem erholt sich der Kurs nach Vola Interruption. Derzeit steht der Kurs 2,1% im Minus bei 67,13 EUR nach einem Tief von 66,40 EUR. DJG/hru/raz :53 ALLGEMEINES MARKT/DAX fällt weiter JPM nimmt Arbei DAX MARKT/DAX fällt weiter JPM nimmt Arbeitsmarktprognose hoch Der DAX fällt auf neue Tagestiefs und steht nur noch knapp über Punkten. J.P. Morgan habe nach dem ADP Bericht nun die Prognose für den Arbeitsmarktbericht am Freitag nach oben genommen, das Haus erwarte nun neue Stellen auÿerhalb der Landwirtschaft nach
29 Prinzipieller Bearbeitungsablauf I Stock Market News Message Collection Separate out the News Messages Remove English Messages Move Messages to Subdirectories (Isolate by Calender Week) Remove Duplicate Messages Stock Market News Week Directories with separate Message Files Define the Message Classes
30 Prinzipieller Bearbeitungsablauf II Remove Duplicate Messages Stock Market News Week Directories with separate Message Files Define the Message Classes Load or create Feature Vectors (Case Load: only TEST Class used afterwards) Naive Bayes Classification Maximum Entropy Classification Decision Tree Classification Balanced Winnow Classification Bemerkung Klassifikation mit 4 von der Charakteristik her gesehen recht unterschiedlichen Classifiern möglich
31 Naive Bayes Abgeleitet aus Satz von Bayes Thomas Bayes Satz zur Rechnung mit bedingten P(B A) P(A) Wahrscheinlichkeiten: P(A B) = P(B) Gilt für endlich viele Ereignisse A i : P(A i B) = P(B A i) P(A i ) P(B) = P(B A i ) P(A i ) N j=1 P(B A j) P(A j ) Bayes-Klassifikator ordnet zu klassifizierendem Objekt wahrscheinlichste Klasse zu (für die UP/DOWN-Klassifizierung gilt C := {0, 1}): b : R f C Wahrscheinlichkeitsdichte aller i, i C durch p i gegeben Klassenzugehörigkeit definiert durch b := argmax i p i (x)
32 Naive Bayes Abgeleitet aus Satz von Bayes Thomas Bayes Satz zur Rechnung mit bedingten P(B A) P(A) Wahrscheinlichkeiten: P(A B) = P(B) Gilt für endlich viele Ereignisse A i : P(A i B) = P(B A i) P(A i ) P(B) = P(B A i ) P(A i ) N j=1 P(B A j) P(A j ) Bayes-Klassifikator ordnet zu klassifizierendem Objekt wahrscheinlichste Klasse zu (für die UP/DOWN-Klassifizierung gilt C := {0, 1}): b : R f C Wahrscheinlichkeitsdichte aller i, i C durch p i gegeben Klassenzugehörigkeit definiert durch b := argmax i p i (x)
33 Naive Bayes Abgeleitet aus Satz von Bayes Thomas Bayes Satz zur Rechnung mit bedingten P(B A) P(A) Wahrscheinlichkeiten: P(A B) = P(B) Gilt für endlich viele Ereignisse A i : P(A i B) = P(B A i) P(A i ) P(B) = P(B A i ) P(A i ) N j=1 P(B A j) P(A j ) Bayes-Klassifikator ordnet zu klassifizierendem Objekt wahrscheinlichste Klasse zu (für die UP/DOWN-Klassifizierung gilt C := {0, 1}): b : R f C Wahrscheinlichkeitsdichte aller i, i C durch p i gegeben Klassenzugehörigkeit definiert durch b := argmax i p i (x)
34 Naive Bayes Abgeleitet aus Satz von Bayes Thomas Bayes Satz zur Rechnung mit bedingten P(B A) P(A) Wahrscheinlichkeiten: P(A B) = P(B) Gilt für endlich viele Ereignisse A i : P(A i B) = P(B A i) P(A i ) P(B) = P(B A i ) P(A i ) N j=1 P(B A j) P(A j ) Bayes-Klassifikator ordnet zu klassifizierendem Objekt wahrscheinlichste Klasse zu (für die UP/DOWN-Klassifizierung gilt C := {0, 1}): b : R f C Wahrscheinlichkeitsdichte aller i, i C durch p i gegeben Klassenzugehörigkeit definiert durch b := argmax i p i (x)
35 Naive Bayes Abgeleitet aus Satz von Bayes Thomas Bayes Satz zur Rechnung mit bedingten P(B A) P(A) Wahrscheinlichkeiten: P(A B) = P(B) Gilt für endlich viele Ereignisse A i : P(A i B) = P(B A i) P(A i ) P(B) = P(B A i ) P(A i ) N j=1 P(B A j) P(A j ) Bayes-Klassifikator ordnet zu klassifizierendem Objekt wahrscheinlichste Klasse zu (für die UP/DOWN-Klassifizierung gilt C := {0, 1}): b : R f C Wahrscheinlichkeitsdichte aller i, i C durch p i gegeben Klassenzugehörigkeit definiert durch b := argmax i p i (x)
36 Maximum Entropy Verwendung zur optimalen Extraktion von Information aus verrauschten Signalen Prinzip der maximalen Entropie von Edwin Thompson Jaynes 1957 in die statistische Mechanik eingeführt Weiterentwickelte Methode findet Anwendung in Spektralanalyse und in der digitalen Bildverarbeitung Regularisierungs-/Glättungsmethode für die numerische Lösung von Problemen mit verrauschten Daten
37 Maximum Entropy Verwendung zur optimalen Extraktion von Information aus verrauschten Signalen Prinzip der maximalen Entropie von Edwin Thompson Jaynes 1957 in die statistische Mechanik eingeführt Weiterentwickelte Methode findet Anwendung in Spektralanalyse und in der digitalen Bildverarbeitung Regularisierungs-/Glättungsmethode für die numerische Lösung von Problemen mit verrauschten Daten
38 Maximum Entropy Verwendung zur optimalen Extraktion von Information aus verrauschten Signalen Prinzip der maximalen Entropie von Edwin Thompson Jaynes 1957 in die statistische Mechanik eingeführt Weiterentwickelte Methode findet Anwendung in Spektralanalyse und in der digitalen Bildverarbeitung Regularisierungs-/Glättungsmethode für die numerische Lösung von Problemen mit verrauschten Daten
39 Maximum Entropy Verwendung zur optimalen Extraktion von Information aus verrauschten Signalen Prinzip der maximalen Entropie von Edwin Thompson Jaynes 1957 in die statistische Mechanik eingeführt Weiterentwickelte Methode findet Anwendung in Spektralanalyse und in der digitalen Bildverarbeitung Regularisierungs-/Glättungsmethode für die numerische Lösung von Problemen mit verrauschten Daten
40 Balanced Winnow Von Nick Littlestone 1987 entwickeltes statistisches Verfahren Kalkuliert Wertigkeit jeder Klasse statt Wahrscheinlichkeiten direkt zu berechnen Balanced-Winnow-Verfahren verwendet zwei Gewichte für jedes Feature, ω + und ω. Ω = n j=1 (ω + j ω j )s j > θ, initial: ω + = 2θ d und ω = θ d (d: durchschnittliche Anzahl Features pro Dokument, s j : Feature j einer Dokumentinstanz s = (s 1, s 2,..., s n )) Beförderungsfaktor α und Degradierungsfaktor β werden jeweils gleichzeitig angewandt, um Klassifikator zu trainieren
41 Balanced Winnow Von Nick Littlestone 1987 entwickeltes statistisches Verfahren Kalkuliert Wertigkeit jeder Klasse statt Wahrscheinlichkeiten direkt zu berechnen Balanced-Winnow-Verfahren verwendet zwei Gewichte für jedes Feature, ω + und ω. Ω = n j=1 (ω + j ω j )s j > θ, initial: ω + = 2θ d und ω = θ d (d: durchschnittliche Anzahl Features pro Dokument, s j : Feature j einer Dokumentinstanz s = (s 1, s 2,..., s n )) Beförderungsfaktor α und Degradierungsfaktor β werden jeweils gleichzeitig angewandt, um Klassifikator zu trainieren
42 Balanced Winnow Von Nick Littlestone 1987 entwickeltes statistisches Verfahren Kalkuliert Wertigkeit jeder Klasse statt Wahrscheinlichkeiten direkt zu berechnen Balanced-Winnow-Verfahren verwendet zwei Gewichte für jedes Feature, ω + und ω. Ω = n j=1 (ω + j ω j )s j > θ, initial: ω + = 2θ d und ω = θ d (d: durchschnittliche Anzahl Features pro Dokument, s j : Feature j einer Dokumentinstanz s = (s 1, s 2,..., s n )) Beförderungsfaktor α und Degradierungsfaktor β werden jeweils gleichzeitig angewandt, um Klassifikator zu trainieren
43 Balanced Winnow Von Nick Littlestone 1987 entwickeltes statistisches Verfahren Kalkuliert Wertigkeit jeder Klasse statt Wahrscheinlichkeiten direkt zu berechnen Balanced-Winnow-Verfahren verwendet zwei Gewichte für jedes Feature, ω + und ω. Ω = n j=1 (ω + j ω j )s j > θ, initial: ω + = 2θ d und ω = θ d (d: durchschnittliche Anzahl Features pro Dokument, s j : Feature j einer Dokumentinstanz s = (s 1, s 2,..., s n )) Beförderungsfaktor α und Degradierungsfaktor β werden jeweils gleichzeitig angewandt, um Klassifikator zu trainieren
44 Balanced Winnow Von Nick Littlestone 1987 entwickeltes statistisches Verfahren Kalkuliert Wertigkeit jeder Klasse statt Wahrscheinlichkeiten direkt zu berechnen Balanced-Winnow-Verfahren verwendet zwei Gewichte für jedes Feature, ω + und ω. Ω = n j=1 (ω + j ω j )s j > θ, initial: ω + = 2θ d und ω = θ d (d: durchschnittliche Anzahl Features pro Dokument, s j : Feature j einer Dokumentinstanz s = (s 1, s 2,..., s n )) Beförderungsfaktor α und Degradierungsfaktor β werden jeweils gleichzeitig angewandt, um Klassifikator zu trainieren
45 Decision Tree Anschauliche Darstellung aufeinanderfolgender hierarchischer Verzweigungen in Baumform Binärer Fall: Jede Verzweigung eine Ja/Nein-Entscheidung Generierung üblich im Top-Down-Prinzip, in jedem Schritt Suche nach bestem Split (Nutzung der Entropie oder des so genannten Gini-Index) Problem des Overfitting: Klassifikationsgüte nimmt mit zunehmender Baumkomplexität ab
46 Decision Tree Anschauliche Darstellung aufeinanderfolgender hierarchischer Verzweigungen in Baumform Binärer Fall: Jede Verzweigung eine Ja/Nein-Entscheidung Generierung üblich im Top-Down-Prinzip, in jedem Schritt Suche nach bestem Split (Nutzung der Entropie oder des so genannten Gini-Index) Problem des Overfitting: Klassifikationsgüte nimmt mit zunehmender Baumkomplexität ab
47 Decision Tree Anschauliche Darstellung aufeinanderfolgender hierarchischer Verzweigungen in Baumform Binärer Fall: Jede Verzweigung eine Ja/Nein-Entscheidung Generierung üblich im Top-Down-Prinzip, in jedem Schritt Suche nach bestem Split (Nutzung der Entropie oder des so genannten Gini-Index) Problem des Overfitting: Klassifikationsgüte nimmt mit zunehmender Baumkomplexität ab
48 Decision Tree Anschauliche Darstellung aufeinanderfolgender hierarchischer Verzweigungen in Baumform Binärer Fall: Jede Verzweigung eine Ja/Nein-Entscheidung Generierung üblich im Top-Down-Prinzip, in jedem Schritt Suche nach bestem Split (Nutzung der Entropie oder des so genannten Gini-Index) Problem des Overfitting: Klassifikationsgüte nimmt mit zunehmender Baumkomplexität ab
49 Softwaremerkmale Dient der Datenvorverarbeitung, der Klassenerstellung zum Erstellen der Vektorendatei und zum Klassifizieren der Testklassen inklusiver neuer Texte Hauptfunktionalität (außer Visualisierung) auf Server bzw. in monolithischer Einzelanwendung Großer Teil gemeinsamer Code möglich (Einzelanwendung als RMI-Client/Server-Anwendung auszuführen um noch weniger Anpassungen vornehmen zu müssen nicht sinnvoll)
50 Softwaremerkmale Dient der Datenvorverarbeitung, der Klassenerstellung zum Erstellen der Vektorendatei und zum Klassifizieren der Testklassen inklusiver neuer Texte Hauptfunktionalität (außer Visualisierung) auf Server bzw. in monolithischer Einzelanwendung Großer Teil gemeinsamer Code möglich (Einzelanwendung als RMI-Client/Server-Anwendung auszuführen um noch weniger Anpassungen vornehmen zu müssen nicht sinnvoll)
51 Softwaremerkmale Dient der Datenvorverarbeitung, der Klassenerstellung zum Erstellen der Vektorendatei und zum Klassifizieren der Testklassen inklusiver neuer Texte Hauptfunktionalität (außer Visualisierung) auf Server bzw. in monolithischer Einzelanwendung Großer Teil gemeinsamer Code möglich (Einzelanwendung als RMI-Client/Server-Anwendung auszuführen um noch weniger Anpassungen vornehmen zu müssen nicht sinnvoll)
52 Softwaremerkmale Dient der Datenvorverarbeitung, der Klassenerstellung zum Erstellen der Vektorendatei und zum Klassifizieren der Testklassen inklusiver neuer Texte Hauptfunktionalität (außer Visualisierung) auf Server bzw. in monolithischer Einzelanwendung Großer Teil gemeinsamer Code möglich (Einzelanwendung als RMI-Client/Server-Anwendung auszuführen um noch weniger Anpassungen vornehmen zu müssen nicht sinnvoll)
53 Softwaremerkmale Dient der Datenvorverarbeitung, der Klassenerstellung zum Erstellen der Vektorendatei und zum Klassifizieren der Testklassen inklusiver neuer Texte Hauptfunktionalität (außer Visualisierung) auf Server bzw. in monolithischer Einzelanwendung Großer Teil gemeinsamer Code möglich (Einzelanwendung als RMI-Client/Server-Anwendung auszuführen um noch weniger Anpassungen vornehmen zu müssen nicht sinnvoll)
54 Softwaremerkmale Dient der Datenvorverarbeitung, der Klassenerstellung zum Erstellen der Vektorendatei und zum Klassifizieren der Testklassen inklusiver neuer Texte Hauptfunktionalität (außer Visualisierung) auf Server bzw. in monolithischer Einzelanwendung Großer Teil gemeinsamer Code möglich (Einzelanwendung als RMI-Client/Server-Anwendung auszuführen um noch weniger Anpassungen vornehmen zu müssen nicht sinnvoll)
55 plugin_server.xml <?xml version="1.0"? > <plugin name="de.tu_chemnitz.webis.trendforecast" version="1.0"> <bind pluginsocket class="de.tu_chemnitz.webis.trendforecast.classifierserver" name="de.tu_chemnitz.webis.core.remotepluginsocket"/ > <classpath name="commons collections 3.2.jar" / > <classpath name="commons configuration 1.2.jar" / > <classpath name="commons lang 2.1.jar" / > <classpath name="commons logging 1.1.jar" / > <classpath name="mallet deps.jar" / > <classpath name="mallet.jar" / > </plugin>
56 plugin_client.xml <?xml version="1.0"? > <plugin name="de.tu_chemnitz.webis.trendforecast" version="1.0"> <bind pluginsocket class="" name="de.tu_chemnitz.webis.gui. components.navigation.navigationpanelpluginsocket" / > <navigationnode id="user Interface" controlledbyparent="false" path="/trend Forecast" doubleclickaction="de.tu_chemnitz.webis. gui.trendforecast.webismainwindow"/ > <dependency name="de.tu_chemnitz.webis.gui.components.navigation" version="1.0" / > <dependency name="de.tu_chemnitz.webis.trendforecast" version="1.0" type="remote" / > <classpath name="jcommon jar" / > <classpath name="jfreechart jar" / > <classpath name="org jdesktop layout.jar" / > </plugin>
57 Feature Reduction Performance- und Arbeitsspeicherbedarf des Prototyps mit den vollständig erzeugten Feature Vectors recht hoch Klassifizierung einer neuen Trainingseinheit Kalenderwoche auf dem CPU-Server herkules.hrz in etwa 1 Minute, wenn Feature Vectors im Speicher geladen waren Reduktion der Menge an Feature Vectors in das hier entwickelte System integriert Nutzt kalkulierten Informationsgehalt für Rangfolge, aus der die anteilmäßig am schlechtesten bewerteten Vektoren entfernt werden
58 Feature Reduction Performance- und Arbeitsspeicherbedarf des Prototyps mit den vollständig erzeugten Feature Vectors recht hoch Klassifizierung einer neuen Trainingseinheit Kalenderwoche auf dem CPU-Server herkules.hrz in etwa 1 Minute, wenn Feature Vectors im Speicher geladen waren Reduktion der Menge an Feature Vectors in das hier entwickelte System integriert Nutzt kalkulierten Informationsgehalt für Rangfolge, aus der die anteilmäßig am schlechtesten bewerteten Vektoren entfernt werden
59 Feature Reduction Performance- und Arbeitsspeicherbedarf des Prototyps mit den vollständig erzeugten Feature Vectors recht hoch Klassifizierung einer neuen Trainingseinheit Kalenderwoche auf dem CPU-Server herkules.hrz in etwa 1 Minute, wenn Feature Vectors im Speicher geladen waren Reduktion der Menge an Feature Vectors in das hier entwickelte System integriert Nutzt kalkulierten Informationsgehalt für Rangfolge, aus der die anteilmäßig am schlechtesten bewerteten Vektoren entfernt werden
60 Feature Reduction Performance- und Arbeitsspeicherbedarf des Prototyps mit den vollständig erzeugten Feature Vectors recht hoch Klassifizierung einer neuen Trainingseinheit Kalenderwoche auf dem CPU-Server herkules.hrz in etwa 1 Minute, wenn Feature Vectors im Speicher geladen waren Reduktion der Menge an Feature Vectors in das hier entwickelte System integriert Nutzt kalkulierten Informationsgehalt für Rangfolge, aus der die anteilmäßig am schlechtesten bewerteten Vektoren entfernt werden
61 Für Klassifikatortraining definierte Phasen DAX quotation MDAX quotation SDAX quotation TecDAX quotation????? index value ???? 01 Jan Jan Jan Jan Jan Jan Jan 2006 date?
62 Naive-Bayes-Klassifikation, unreduzierte Testvektoren DAX quotation 25% reduced training vectors 50% reduced training vectors 75% reduced training vectors????? index value forecast (positive %) ???? 01 Jan Jan Jan Jan Jan Jan Jan 2006 date? 0
63 Naive-Bayes-Klassifikation, reduzierte Testvektoren DAX quotation 75% reduced test vectors 50% reduced test vectors 25% reduced test vectors????? index value forecast (positive %) ???? 01 Jan Jan Jan Jan Jan Jan Jan 2006 date? 0
64 Klassifikationsergebnisse aller 4 verschiedenen Classifier DAX quotation Naive Bayes classification Maximum Entropy classification Decision Tree classification Balanced Winnow classification????? index value forecast (positive %) ???? 01 Jan Jan Jan Jan Jan Jan Jan 2006 date? 0
65 Testphasenanalyse aller 4 verschiedenen Classifier index value forecast (positive %) DAX quotation Naive Bayes classification Maximum Entropy classification Decision Tree classification Balanced Winnow classification 0 01 Jan Jul Jan Jul Jan Jul Jan Jul 2006 date
66 Vergleich Klassifikation Studienarbeit mit neuen Klassifikat DAX quotation Naive Bayes class. (previous work) Balanced Winnow Naive Bayes (-25%/-25%) index value forecast (positive %) Jan Jan Jan Jan Jan Jan 2005 date 0
67 Vielen Dank für Ihr Interesse!
Splitting. Impurity. c 1. c 2. c 3. c 4
Splitting Impurity Sei D(t) eine Menge von Lernbeispielen, in der X(t) auf die Klassen C = {c 1, c 2, c 3, c 4 } verteilt ist. Illustration von zwei möglichen Splits: c 1 c 2 c 3 c 4 ML: III-29 Decision
MehrProjektgruppe. Thomas Kühne. Komponentenbasiertes Software Engineering mit OSGi
Projektgruppe Thomas Kühne Komponentenbasiertes Software Engineering mit OSGi Anforderungen der PG IDSE an ein Komponenten- Client Nativer Client Web Client Alternativen IDSE Nutzer Szenario Pipe IDSE
MehrVorstellung zu einem Web Desktop: eyeos
Binglin Li Cloud-Computing Seminar Hochschule Mannheim WS0910 1/20 Vorstellung zu einem Web Desktop: eyeos Binglin Li Fakultaet fuer Informatik Hochschule Mannheim 11.12.2009 Binglin Li Cloud-Computing
MehrOracle9i Designer. Rainer Willems. Page 1. Leitender Systemberater Server Technology Competence Center Frankfurt Oracle Deutschland GmbH
Oracle9i Designer Rainer Willems Leitender Systemberater Server Technology Competence Center Frankfurt Oracle Deutschland GmbH Page 1 1 Agenda 9i Designer & 9i SCM in 9i DS Design Server Generierung &
MehrBachelorarbeit Erkennung von Fließtext in PDF-Dokumenten
Bachelorarbeit Erkennung von Fließtext in PDF-Dokumenten 16.08.2016 David Spisla Albert Ludwigs Universität Freiburg Technische Fakultät Institut für Informatik Gliederung Motivation Schwierigkeiten bei
MehrKapitel WT:VI (Fortsetzung)
Kapitel WT:VI (Fortsetzung) VI. Architekturen und Middleware-Technologien Client--Architekturen Ajax REST RPC, XML-RPC, Java RMI, DCOM Web-Services CORBA Message-oriented-Middleware MOM Enterprise Application
MehrIUG DRESDEN ERSTELLUNG VON ROBUSTEN NATURAL SERVICES Software AG. All rights reserved. For internal use only
IUG DRESDEN ERSTELLUNG VON ROBUSTEN NATURAL SERVICES 2016 Software AG. All rights reserved. For internal use only DIGITAL BUSINESS APPLICATIONS DRIVE THE DIGITAL BUSINESS Partner Lieferanten Kunden SaaS
MehrDokument Klassifikation. Thomas Uhrig: Data-Mining SS10
Agenda: 1: Klassifizierung allgemein 2: der naive Bayes-Klassifizierer 3: Beispiel 4: Probleme 5: Fazit 6: Quellen 1: Klassifizierung allgemein: 1: Klassifizierung allgemein: - Einordnung von Objekten
MehrRückblick. Entscheidungsunterstützende Systeme / Kapitel 4: Klassifikation
Rückblick k-nächste Nachbarn als distanzbasiertes Verfahren zur Klassifikation benötigt sinnvolles Distanzmaß und weist vorher unbekanntem Datenpunkt dann die häufigste Klasse seiner k nächsten Nachbarn
Mehr3.3 Nächste-Nachbarn-Klassifikatoren
3.3 Nächste-Nachbarn-Klassifikatoren Schrauben Nägel Klammern Neues Objekt Instanzbasiertes Lernen (instance based learning) Einfachster Nächste-Nachbar-Klassifikator: Zuordnung zu der Klasse des nächsten
MehrBachelorarbeit im Fach Computerlinguistik Centrum für Informations- und Sprachverarbeitung LMU München Betreuerin: Dr.
München, 05.05.2014 Arnold Schlegel Bachelorarbeit im Fach Computerlinguistik Centrum für Informations- und Sprachverarbeitung LMU München Betreuerin: Dr. Desislava Zhekova 1 Inhaltsüberblick Hintergrund
MehrProjektarbeit Java. 4-Gewinnt. Berner Fachhochschule. 2004, Labor für Technische Informatik
Berner Fachhochschule Hochschule für Technik und Informatik, HTI Fachbereich Elektro- und Informatik Labor für technische Informatik Projektarbeit Java 4-Gewinnt 2004, Labor für Technische Informatik Dateiname:
MehrTHEMA: SAS DATA INTEGRATION STUDIO FÜR MEHR TRANSPARENZ IM DATENMANAGEMENT EVA-MARIA KEGELMANN
WEBINAR@LUNCHTIME THEMA: SAS DATA INTEGRATION STUDIO FÜR MEHR TRANSPARENZ IM DATENMANAGEMENT EVA-MARIA KEGELMANN HERZLICH WILLKOMMEN BEI WEBINAR@LUNCHTIME Moderation Anne K. Bogner-Hamleh SAS Institute
MehrTextmining Klassifikation von Texten Teil 1: Naive Bayes
Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive
Mehrfuzzy-entscheidungsbäume
fuzzy-entscheidungsbäume klassische Entscheidungsbaumverfahren fuzzy Entscheidungsbaumverfahren Entscheidungsbäume Was ist ein guter Mietwagen für einen Familienurlaub auf Kreta? 27. März 23 Sebastian
MehrEinführung in Support Vector Machines (SVMs)
Einführung in (SVM) Januar 31, 2011 Einführung in (SVMs) Table of contents Motivation Einführung in (SVMs) Outline Motivation Vektorrepräsentation Klassifikation Motivation Einführung in (SVMs) Vektorrepräsentation
MehrEclipse Test and Performance Tools Platform (TPTP)
Fakultät Informatik - Institut für Angewandte Informatik, Professur Technische Informationssysteme Eclipse Test and Performance Tools Platform (TPTP) Philipp Schneider s1050347@inf.tu-dresden.de Hauptseminar
MehrOracle Data Integrator Ein Überblick
Oracle Data Integrator Ein Überblick Uwe Barz Christoph Jansen Hamburg, 15.04.2008 Basel Baden Bern Lausanne Zürich Düsseldorf Frankfurt/M. Freiburg i. Br. Hamburg München Stuttgart Wien Agenda Überblick
MehrV by WBR1/BFH-TI 2011 by MOU2/BFH-TI
Java-Applets Unterlagen zum Modul OOP mit Java V 3.0 2007 by WBR1/BFH-TI 2011 by MOU2/BFH-TI Java-Applets V3.0 2011 by WBR1&MOU2/BFH- TI Lernziele Die Kursteilnehmer sind in der Lage: Möglichkeiten und
MehrTEXTKLASSIFIKATION. WS 2011/12 Computerlinguistik I Deasy Sukarya & Tania Bellini
TEXTKLASSIFIKATION WS 2011/12 Computerlinguistik I Deasy Sukarya & Tania Bellini GLIEDERUNG 1. Allgemeines Was ist Textklassifikation? 2. Aufbau eines Textklassifikationssystems 3. Arten von Textklassifikationssystemen
MehrEine technische Plattform für Smart-Client-Systeme. Alexander Ziegler
Eine technische Plattform für Smart-Client-Systeme Alexander Ziegler Agenda Ausgangssituation Smart Client Ansatz Technische Kernthemen Erfahrungen 1 Agenda Ausgangssituation Smart Client Ansatz Erfahrungen
MehrClient/Server Applikation mit Android BDA Zwischenpräsentation. Agenda. Einführung. Einführung. Planung & Vorgehen. Systemübersicht.
Client/Server Applikation mit Android BDA Zwischenpräsentation Horw, 11. Mai 2012 Christoph Moser, Thomas Galliker Agenda Einführung Planung & Vorgehen Systemübersicht Evaluation Demonstration Nächste
MehrRemote Eclipse RCP Management
Remote Eclipse RCP Management Diplomarbeit Durchgeführt in Zusammenarbeit mit Deutsches Elektronen-Synchrotron DESY 1. Betreuer: Prof. Dr. Züllighoven 2. Betreuer: Prof. Dr. Lamersdorf Eugen Reiswich 09.12.2008
MehrModernes IT Monitoring/Management
Modernes IT Monitoring/Management Inhalt 3 IT-Monitoring früher? Oder vielleicht auch noch heute? Monitoren - was heisst das? Ganzheitliches Monitoren Herausforderungen, Aufgaben, Funktionen des übergreifenden
Mehr1. Download der benötigten Software Version 2. Speichern Sie das easytouch Update auf einem leeren USB-Sick (FAT) (max 2 GB) P3 / Mini.
easytouch 1.3.0.20 (2.3.0.20): (german) (for English see below please) Für die easytouch Geräteserie ist eine neue Softwareversion 1.3.0.20 & 2.3.0.20 erhältlich und zum Download auf unserer deutschen
MehrEinführung in das Maschinelle Lernen I
Einführung in das Maschinelle Lernen I Vorlesung Computerlinguistische Techniken Alexander Koller 26. Januar 2015 Maschinelles Lernen Maschinelles Lernen (Machine Learning): äußerst aktiver und für CL
MehrAnalyse von Transaktionsdaten im Online-Ticketing mit Data-Mining-Methoden
1 Analyse von Transaktionsdaten im Online-Ticketing mit Data-Mining-Methoden Marten Pfannenschmidt, Freie Universität Berlin Prof. Dr. Jan Fabian Ehmke, Europa-Universität Viadrina Frank Schreier, Berliner
MehrSmartphone Entwicklung mit Android und Java
Smartphone Entwicklung mit Android und Java predic8 GmbH Moltkestr. 40 53173 Bonn Tel: (0228)5552576-0 www.predic8.de info@predic8.de Was ist Android Offene Plattform für mobile Geräte Software Kompletter
MehrKurzanleitung Eclipse
Autor: Prof. Dr. Bernhard Humm, FB Informatik, FH Darmstadt Datum: 30. November 2005 1 Starten Für das Praktikum verwenden wir Eclipse Version 3.1 und JDK 1.5 Starten Eclipse: Doppelklick auf das Icon
MehrEclipse Equinox als Basis für Smart Client Anwendungen. Christian Campo, compeople AG, 5.7.2007 Java Forum Stuttgart 2007
Eclipse Equinox als Basis für Smart Client Anwendungen Christian Campo, compeople AG, 5.7.2007 Java Forum Stuttgart 2007 Übersicht Definition / Architektur Smart Client Smart Client mit RCP / Equinox Gesamtfazit
MehrNeu: Citibank OPEN END Index Zertifikate und Optionsscheine auf drei europäische Aktien
Neu: Citibank OPEN END Index Zertifikate und Optionsscheine auf drei europäische Aktien Open End Index Zertifikate: Typ Ratio Fälligkeit Anfänglicher Verkaufspreis (EUR) WKN Volumen DAX ** (Performance),
MehrSIMATIC PCS 7 V8.2 ES - News. Effizientes Top-Down-Engineering: Logic Matrix, SFC Berechnungen und Bibliothekserweiterungen
SIMATIC PCS 7 V8.2 ES - News Effizientes Top-Down-Engineering: Logic Matrix, SFC Berechnungen und Bibliothekserweiterungen Frei Verwendbar Siemens AG 2016 siemens.com/process-automation SIMATIC PCS 7 V8.2
MehrBest Practices und Tools für Upgrades aus der Sicht der Applikation
Best Practices und Tools für Upgrades aus der Sicht der Applikation Jan-Peter Timmermann Principal Consultant Trivadis GmbH 3. Trivadis Oracle Forms Community 07.07.2011 Zürich Basel Bern Lausanne Zürich
MehrGenerischer Modellvergleich mit EMF Compare
Fakultät Informatik Hauptseminar Technische Informationssysteme SS2010 Generischer Modellvergleich mit EMF Betreuer: Dipl.-Inf. Uwe Ryssel Dresden, 16.07.2010 Gliederung 1. Motivation 2. Eclipse Modeling
MehrTool-Chain. Übung. Eclipse, SVN, Ant, Cobertura, Metrics Labor "Software Engineering Experiment" Sebastian Meyer und Kai Stapel
Tool-Chain Übung Eclipse, SVN, Ant, Cobertura, Metrics Labor "Software Engineering Experiment" 2009 Sebastian Meyer und Kai Stapel 05.05.2009 Überblick SVN Grundlagen SVN in Eclipse Ant in Eclipse Cobertura
MehrProduktinformation DaVinci Developer
Produktinformation DaVinci Developer Inhaltsverzeichnis 1 DaVinci Developer - Entwurf von AUTOSAR Softwarekomponenten... 3 1.1 Die Vorteile von DaVinci Developer im Überblick... 3 1.2 Anwendungsgebiete...
MehrSoftware Engineering. Zur Architektur der Applikation Data Repository. Franz-Josef Elmer, Universität Basel, HS 2015
Software Engineering Zur Architektur der Applikation Data Repository Franz-Josef Elmer, Universität Basel, HS 2015 Software Engineering: Mit acht bewährten Praktiken zu gutem Code 2 Schichtarchitektur
MehrAutomatisierter Java EE Entwicklungs-Lifecycle mit WebLogic Server 12c. Robin Müller-Bady Systemberater, Oracle Deutschland
Automatisierter Java EE Entwicklungs-Lifecycle mit WebLogic Server 12c Robin Müller-Bady Systemberater, Oracle Deutschland The following is intended to outline our general product direction. It is intended
MehrMathematische Grundlagen III
Mathematische Grundlagen III Maschinelles Lernen III: Clustering Vera Demberg Universität des Saarlandes 7. Juli 202 Vera Demberg (UdS) Mathe III 7. Juli 202 / 35 Clustering vs. Klassifikation In den letzten
MehrInformatik Projekt J AIRS. Laborjournal. Julien Studzinski / Stefan Urech / Gilles Zimmermann
Laborjournal Julien Studzinski / Stefan Urech / Gilles Zimmermann 1 Initialisieren des Projekts 11.11.2004 alle Abgeschlossen Ausdrucken der nötigen Unterlagen, erstellen des Webauftritts 2 Einarbeiten
MehrBayes Klassifikatoren M E T H O D E N D E S D A T A M I N I N G F A B I A N G R E U E L
Bayes Klassifikatoren M E T H O D E N D E S D A T A M I N I N G F A B I A N G R E U E L Inhalt Grundlagen aus der Wahrscheinlichkeitsrechnung Hypothesenwahl Optimale Bayes Klassifikator Naiver Bayes Klassifikator
MehrCheckliste für Supportanfragen. Teil I: Kundendaten
d.velop digital solutions GmbH Support E-Mail: dds-support@d-velop.de Erreichbarkeit Kieler Kamp 99 Fon: +49 (0) 431 / 53 55 9-99 Mo. - Fr. 8:00 Uhr - 17:00 Uhr D-24145 Kiel Kundenportal: https://kunden.d-velop-nord.de/users/sign_in
MehrPersönliche Build-Höllen für Jedermann Andreas Hartmann & Dr. Halil-Cem Gürsoy
Über Ant und Maven zu SBT und Gradle Persönliche Build-Höllen für Jedermann Andreas Hartmann & Dr. Halil-Cem Gürsoy 07.04.2011 Speaker Andreas Hartmann [hartmann@adesso.de] Principal Software Engineer
MehrWeka: Software-Suite mit Maschineller Lernsoftware
: Software-Suite mit Maschineller Lernsoftware Computational Linguistics Universität des Saarlandes Sommersemester 2011 21.04.2011 Erste Schritte Waikato Environment for Knowledge Analysis entwickelt von
MehrAnalytics Entscheidungsbäume
Analytics Entscheidungsbäume Professional IT Master Prof. Dr. Ingo Claßen Hochschule für Technik und Wirtschaft Berlin Regression Klassifikation Quellen Regression Beispiel Baseball-Gehälter Gehalt: gering
MehrTechnische Beschreibung: EPOD Server
EPOD Encrypted Private Online Disc Technische Beschreibung: EPOD Server Fördergeber Förderprogramm Fördernehmer Projektleitung Projekt Metadaten Internet Foundation Austria netidee JKU Linz Institut für
MehrMainframe Internet Integration. Prof. Dr. Martin Bogdan Prof. Dr.-Ing. Wilhelm G. Spruth SS2013. WebSphere Application Server Teil 4
UNIVERSITÄT LEIPZIG Mainframe Internet Integration Prof. Dr. Martin Bogdan Prof. Dr.-Ing. Wilhelm G. Spruth SS2013 WebSphere Application Server Teil 4 Leistungsverhalten el0100 copyright W. G. Spruth,
MehrPrädiktion und Klassifikation mit
Prädiktion und Klassifikation mit Random Forest Prof. Dr. T. Nouri Nouri@acm.org Technical University NW-Switzerland /35 Übersicht a. Probleme mit Decision Tree b. Der Random Forests RF c. Implementation
MehrIndustrielle Herausforderungen in Embedded Systems
StreamUnlimited ~ 2005 Spin-off vom Philips Audio/Video Innovation Center Wien Industrielle Herausforderungen in StreamUnlimited Engineering GmbH, CTO ~ Innovative Embedded F&E ~ Elektronik ~ Software
MehrKonzepte von Betriebssystem- Komponenten Middleware. Jini. Vortrag von Philipp Sommer
Konzepte von Betriebssystem- Komponenten Middleware Vortrag von Philipp Sommer 1 Inhalt 1. Einführung Hintergrund Was ist? Ziele von 2. Technology Komponenten Client, Server und Dienste Discovery und Join
MehrDOAG Regionaltreffen. Regionalgruppe Nürnberg. Migration von Forms Client/Server ins Web. Andreas Ströbel OPITZ CONSULTING München
DOAG Regionaltreffen Regionalgruppe Nürnberg Migration von Forms Client/Server ins Web Andreas Ströbel OPITZ CONSULTING München Migration von Forms Client/Server ins Web Seite 1 Agenda Oracle Forms wie
MehrSVG für mobile Anwendungen und Dienste. 42. Sitzung der Arbeitsgruppe Automation in der Kartographie (AgA) am 12. und 13. September 2005 in Wien
für mobile Anwendungen und Dienste Dipl.-Ing. JÖRG BLANKENBACH 42. Sitzung der Arbeitsgruppe in der Kartographie (AgA) am 12. und 13. September 2005 in Wien und Anwendungen - Standortabhängige Dienste
MehrSpezifikationen und Voraussetzung
Projekt IGH DataExpert Paynet Adapter Spezifikationen Voraussetzungen Datum : 21.07.08 Version : 1.0.0.2 21.07.2008 Seite 1 von 7 Inhaltsverzeichnis 1 Einleitung... 3 2 Architektur... 3 2.1 Grundsätze
MehrComputeranwendung in der Chemie Informatik für Chemiker(innen) 3. Software
Computeranwendung in der Chemie Informatik für Chemiker(innen) 3. Software Jens Döbler 2003 "Computer in der Chemie", WS 2003-04, Humboldt-Universität VL3 Folie 1 Grundlagen Software steuert Computersysteme
MehrComputerlinguistische Textanalyse
Computerlinguistische Textanalyse 10. Sitzung 06.01.2014 Einführung in die Textklassifikation Franz Matthies Lehrstuhl für Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller
MehrSpezifikationen und Voraussetzung
Projekt IGH DataExpert Yellowbill Adapter Spezifikationen Voraussetzungen Datum : 22.08.2013 Version : 1.0.0.2 22.08.2013 Seite 1 von 7 Inhaltsverzeichnis 1 Einleitung...3 2 Architektur...3 2.1 Grundsätze
Mehr- dynamisches Laden -
- - Fachbereich Technik Department Elektrotechnik und Informatik 21. Juni 2012 1/23 2/23 s dynamisch Code kann von mehreren Programmen genutzt werden => kleinere Programme einzelne Teile eines Programms
MehrErste Erfahrungen mit NSASJ anhand der OmnivoBase Portierung. September 2013
GTUG Java Arbeitskreis Erste Erfahrungen mit NSASJ anhand der OmnivoBase Portierung September 2013 Jürgen Depping CommitWork GmbH Seite 1 Info@CommitWork.de www.commitwork.de Agenda Was ist OmnivoBase?
MehrSoftwaretechnologie für die Ressourcenlinguistik
Tools und Frameworks FSU Jena Gliederung 1 Pipelines Formate 2 3 Übersicht Details Fazit Pipelines Formate Komponenten bilden eine Pipeline Text Sentence Splitter Tokenizer POS-Tagger Output Texte werden
MehrVerteilte Web-Anwendungen mit Ruby. Ruben Schempp Anwendungen
Verteilte Web-Anwendungen mit Ruby Ruben Schempp Anwendungen 1 Gliederung Motivation Verteilte Web-Anwendungen Definition Beispiele Gemeinsamkeiten Szenario Ausrichtung Anforderungen Abgrenzungen Technologien
MehrDiplom Zwischenverteidigung
Diplom Zwischenverteidigung Entwicklung einer webbasierten Benutzerschnittstelle für des Netplan-Tool Bearbeiter: Betreuer: Verantwortlicher Hochschullehrer: Jens Kempe Dr.-Ing. Jörn Plönnigs Dipl.-Inf
MehrKomponentenorientierte Software-Entwicklung. Seite 1 / 42
Seite 1 / 42 Wiederholung Messaging Java Messaging Service (JMS) Pub/Sub P2P Messaging Middleware XMPP-Protokoll Java API for XML-Processing (JAXP) Java API for XML-Binding Webservices / SOA Simple Object
MehrVorstellung der Diplomarbeit
Vorstellung der Diplomarbeit Integration of a medical documentation and image archiving system in hospital information systems with the utilization of a web-based user interface Holger Schmuhl 12.01.2006
MehrIntegration von Web Services in J EE Anwendungen mit XFire. 1/26 André Janus - Integration von Web Services in J EE Anwendungen mit XFire
Integration von Web Services in J EE Anwendungen mit XFire 1/26 André Janus - Integration von Web Services in J EE Anwendungen mit XFire univativ : = Umsetzung durch Studenten und Young Professionals.
MehrBrowserbasiertes, kollaboratives Whiteboard
WS 2011/12 Bachelorarbeit Browserbasiertes, kollaboratives Whiteboard Sebastian Dorn 1 von 21 Inhalt 1. Motivation 2. Analyse 3. Design 4. Evaluation 5. Fazit Inhalt 2 von 21 Motivation Zusammenarbeit
MehrLeitende Aufgabe Flight Management System Abgabedokumentation Softwareengineering
TITEL Leitende Aufgabe Flight Management System Abgabedokumentation Softwareengineering ERSTELLE Marc Landolt, Pascal Jenni, Romino Florio RDATUM 15. Juni 2008 VERSION 0.0.1 Leitende Aufgabe Flight Management
MehrCANape Option Bypassing
Produktinformation Inhaltsverzeichnis 1 Übersicht... 3 1.1 Einführung... 3 1.2 Die Vorteile im Überblick... 3 1.3 Anwendungsgebiete... 4 1.4 Systemvoraussetzung... 4 1.5 Weiterführende Informationen...
MehrConUti GmbH - Ihr starker Partner www.conuti.de eai@conuti.de l +49 151 40729392. ConUti Ihr starker Partner. B2B Schulungen
ConUti Ihr starker Partner B2B Schulungen C ConUti B2B / Java Schulungen Mit unseren Schulungen sicher im Umgang mit der B2B und Java Monitoring B2B- Einführungs- Schulung Admin B2B Administrator- Schulung
MehrTreemaps. - Visualisierung hierarchischer Strukturen. ditact 2003
Treemaps - Visualisierung hierarchischer Strukturen ditact 2003 Seminar Informationsvisualisierung ao.univ.-prof. Dr. Mag. Silvia Miksch Vertr.Ass. DI Monika Lanzenberger Mag. Jeanna Nikolov??@jeanna.at
MehrVon Keerthikan T. & Siyar Kolusari 10.12.2012
M226 OBJECT ORIENTIERT PROGRAMMIEREN Project Checkers An online multi-player Java Game Von Keerthikan T. & Siyar Kolusari 10.12.2012 Inhaltsverzeichnis 1. Projektbeschreibung 3 1.1. Inhalt 3 2. Ziele
MehrBenchmark: Sicherheitslücken & Compliance-
Peter Werner TITEL bearbeiten Dr. Markus Schumacher Benchmark: Sicherheitslücken & Compliance- Risiken Click to im edit ABAP-Code Master text styles von SAP-Anwendungen 2011 2012 Virtual Forge GmbH www.virtualforge.com
MehrJINI - DER START Kursübersicht Dieses Skript zeigt Schritt für Schritt, wie Sie ein erstes Jini-Beispiel zum Laufen bringen können, hoffentlich!
In diesem Kursteil Kursübersicht Worum geht s Einleitung JiniWorks Die Jini Dienste Jini HelloWorld Jini - Der Start 1.1. Kursübersicht Dieses Skript zeigt Schritt für Schritt, wie Sie ein erstes Jini-Beispiel
MehrSoftware Engineering in der Praxis
Software Engineering in der Praxis Praktische Übungen Dirk Wischermann Marc Spisländer Lehrstuhl für Software Engineering Friedrich-Alexander-Universität Erlangen-Nürnberg 5. Februar 2007 Inhalt Nachlese
Mehr2 R die Basics. Inhalt. 2.1 Ziel. 2.2 R als Taschenrechner. Markus Burkhardt
2 R die Basics Markus Burkhardt (markus.burkhardt@psychologie.tu-chemnitz.de) Inhalt 2.1 Ziel... 1 2.2 R als Taschenrechner... 1 2.3 Umgang mit Vektoren... 2 2.3 Weitere Objektklassen... 3 2.4 Umgang mit
MehrSIMATIC PCS 7 V8.2 SIMIT V9. Clever kombiniert: Testen und Trainieren von Automatisierungsprojekten
SIMATIC PCS 7 V8.2 SIMIT V9 Clever kombiniert: Testen und Trainieren von Automatisierungsprojekten Frei Verwendbar Siemens AG 2016 siemens.com/process-automation Simulation Verwendung Virtuelle Inbetriebnahme:
MehrJavaSpaces. Markus Helbig, Christian Holder, Marco Jilg, Dominik Krautmann, Richard Waschhauser
JavaSpaces Markus Helbig, Christian Holder, Marco Jilg, Dominik Krautmann, Richard Waschhauser Agenda JavaSpaces JINI Dokumentenablage- System Probleme Demo Entstehung von JavaSpaces JavaSpaces entstand
MehrDecision Trees* von Julia Heise, Philipp Thoms, Hans-Martin Wulfmeyer. *Entscheidungsbäume
Decision Trees* von Julia Heise, Philipp Thoms, Hans-Martin Wulfmeyer *Entscheidungsbäume Gliederung 1. Einführung 2. Induktion 3. Beispiel 4. Fazit Einführung 1. Einführung a. Was sind Decision Trees?
MehrMicrosoft.NET Framework & Component Object Model. ein Vortrag von Florian Steuber
Microsoft.NET Framework & Component Object Model ein Vortrag von Florian Steuber Übersicht I..NET Framework 1. Was ist das.net Framework? 2. Das.NET Execution Model 3. Sprachunabhängigkeit, CTS und CLS
MehrBusiness Breakfast im Café Landtmann. 22. November 2016
Business Breakfast im Café Landtmann 22. November 2016 9:00 Uhr: EINLASS 9:30 Uhr: BEGRÜßUNG Wolfgang Kern / Qlik Elfriede Harrer / Harrer & Partner 10:00 Uhr QLIK SENSE // NEUE FEATURES UND MEHR Christof
MehrInformatik in L A TEX (Bäume, Graphen, MSC)
Informatik in L A TEX (Bäume, Graphen, MSC) Katharina Amboß 3. Juli 2005 1 Einführung Es gibt viele Pakete für die Dinge die in der Informatik grafisch gelöst werden. Grafiken bieten oft eine bessere Übersicht
MehrSAP NetWeaver Gateway. Connectivity@SNAP 2013
SAP NetWeaver Gateway Connectivity@SNAP 2013 Neue Wege im Unternehmen Neue Geräte und Usererfahrungen Technische Innovationen in Unternehmen Wachsende Gemeinschaft an Entwicklern Ausdehnung der Geschäftsdaten
MehrJBoss 2.2 Evaluierung
Freie Universität Berlin Autor: Natalie Ardet Datum: 10.4.2001 JBoss 2.2 Evaluierung Projekt: verteilte Informationssysteme JBoss 2.2 Evaluierung Windows NT 4.0 Installation/Konfiguration und Together
MehrA Topical/Local Classifier for Word Sense Idendification (TLC) Anne Schwartz
A Topical/Local Classifier for Word Sense Idendification (TLC) Anne Schwartz anne@coli.uni-sb.de A Topical/Local Classifier for Word Sense Idendification (TLC) entwickelt von: - Martin Chodorow (Dep. of
MehrAutomatische Erkennung und Klassifikation von Körperhaltungen und Aktivitäten
Automatische Erkennung und Klassifikation von Körperhaltungen und Aktivitäten Dipl.-Ing. Daniel Tantinger Fraunhofer Institut für Integrierte Schaltungen IIS, Erlangen, Deutschland Automatische Erkennung
MehrEinsatz von Applikationsservern. Untersucht am Beispiel des Sybase Enterprise Application Server
Einsatz von Applikationsservern Untersucht am Beispiel des Sybase Enterprise Application Server Architektur von Datenbanksystemen Client / Server Modell (2 Schichten Modell) Benutzerschnittstelle Präsentationslogik
MehrNEUIGKEITEN SAS 9.4 ARCHITEKTUR PHILLIP MANSCHEK
NEUIGKEITEN SAS 9.4 ARCHITEKTUR PHILLIP MANSCHEK HÄUFIGE FRAGEN Ist SAS 9.4 ein Update/Upgrade von/für SAS 9.3? Nein. Installation in ein separates SASHOME-Verzeichnis. Lassen sich SAS 9.3 und SAS 9.4
MehrAutomatische Verteilung in Pangaea. André Spiegel Freie Universität Berlin
Automatische Verteilung in Pangaea André Spiegel Freie Universität Berlin Einführung Pangaea ist ein System, das zentralisierte Java-Programme automatisch verteilen kann basierend auf statischer Quelltextanalyse
MehrInfrastructure as a Service (IaaS) Solutions for Online Game Service Provision
Infrastructure as a Service (IaaS) Solutions for Online Game Service Provision Zielsetzung: System Verwendung von Cloud-Systemen für das Hosting von online Spielen (IaaS) Reservieren/Buchen von Resources
MehrEntscheidungsbäume aus großen Datenbanken: SLIQ
Entscheidungsbäume aus großen Datenbanken: SLIQ C4.5 iteriert häufig über die Trainingsmenge Wie häufig? Wenn die Trainingsmenge nicht in den Hauptspeicher passt, wird das Swapping unpraktikabel! SLIQ:
MehrBachelor-Arbeit Techniken für Virtual Reality Spiele mit Ganzkörperbewegungserfassung
Bachelor-Arbeit Techniken für Virtual Reality Spiele mit Ganzkörperbewegungserfassung Inhalt dieses Vortrags Motivation Ansatz Features Aktionsmodell Experimente Fazit Techniken für Virtual Reality Spiele
MehrAlternative Architekturkonzepte
Alternative Architekturkonzepte Motivation: Suche nach einer Gesamtstruktur meistens: dominante nichtfunktionale Eigenschaften legen Architektur fest Antrieb: Architekturziel Ziel: globale Betrachtung
MehrStudienarbeit. Mohammad Athar Januar Verantw. Betreuer : Prof. Dr. Walter F. Tichy Betr. Mitarbeiter : Dipl.-Inform. Marc Schanne
Studienarbeit Bewertung von Programmier- und Entwicklungsassistenten am Beispiel eines Eclipse-Plug-Ins für den Entwurf verteilter Systeme mit der EventChannelNetwork- Kommunikationsinfrastruktur Mohammad
MehrIntegration von XPhone Virtual Directory auf OpenStage 60/80 Telefonen
Integration von XPhone Virtual Directory auf OpenStage 60/80 Telefonen Inhaltsverzeichnis Dokumentenhistorie... 1 Allgemeine Informationen zu XPhone Virtual Directory... 1 XPhone Virtual Directory 2011
MehrFakultät Informatik, Institut für Angewandte Informatik, Professur Technische Informationssysteme. Großer Beleg. über das Thema
Fakultät Informatik, Institut für Angewandte Informatik, Professur Technische Informationssysteme Großer Beleg über das Thema Daniel Lunkwitz Dresden, 12.11.2009 Gliederung Vortrag 1. Aufgabenstellung
MehrIst-Analyse und Vergleich der Informationssystem-Architektur von Forschungsverbünden
Ist-Analyse und Vergleich der Informationssystem-Architektur von Forschungsverbünden Ulrike Weber 08.04.2013 Betreuer: Sebastian Stäubert Institut für Medizinische Informatik, Statistik und Epidemiologie
MehrDineso Software - Technische Daten
Dineso Software - Technische Daten Zahlen, Daten, Fakten zu Software und Anwendung Inhaltsverzeichnis: 1. Allgemeine Informationen zur Dineso Software 2. Technische Voraussetzungen 3. Ablauf eines BI-Projektes
MehrRhapsody in J Modellierung von Echtzeitsystemen
Rhapsody in J Modellierung von Echtzeitsystemen Tobias Schumacher tobe@uni-paderborn.de Rhapsody in J - Modellierung von Echtzeitsystemen p.1/17 Anspruch des Tools Einsatzbereiche/Features Modellierung
MehrNTx e-billing-system DEBS 1.0 - Übersicht
NTx e-billing-system DEBS 1.0 - Übersicht DEBS = ebilling@sharepoint Was ist DEBS? DEBS ist eine integrierte Lösung zur Archivierung, Beschlagwortung und Weiterverarbeitung elektronischer Rechnungen nach
MehrAndreas Mösching Senior IT Architekt Hewlett-Packard (Schweiz) GmbH HP Banking Service Center Bern andreas.moesching@rtc.ch
Eclipse Runtime (OSGi) als Plattform eines Swing Rich Client Andreas Mösching Senior IT Architekt Hewlett-Packard (Schweiz) GmbH HP Banking Service Center Bern andreas.moesching@rtc.ch Zu meiner Person
MehrEntscheidungsbäume. Minh-Khanh Do Erlangen,
Entscheidungsbäume Minh-Khanh Do Erlangen, 11.07.2013 Übersicht Allgemeines Konzept Konstruktion Attributwahl Probleme Random forest E-Mail Filter Erlangen, 11.07.2013 Minh-Khanh Do Entscheidungsbäume
Mehr