Data Mining und Wissensentdeckung in Datenbanken
|
|
- Richard Baumgartner
- vor 8 Jahren
- Abrufe
Transkript
1 Data Mining und Wissensentdeckung in Datenbanken Stefan Wrobel Das Gebiet des Data Mining bzw. der Wissensentdeckung in Datenbanken beschšftigt sich mit der Extraktion von Wissen aus DatenbestŠnden. Dieser Beitrag gibt einen berblick Ÿber die grundlegenden Aufgabenstellungen, Forschungsfragen und Verfahrensklassen dieses Feldes. ber die Definitionen der Begriffe Data Mining und KDD herrscht derzeit weitgehend Einigkeit. Im wissenschaftlichen Bereich wird die folgende Definition des Begriffs KDD oft zitiert (vgl. Fayyad et al., 1996b): ãwissensentdeckung in Datenbanken ist der nichttriviale Proze der Identifikation gÿltiger, neuer, potentiell nÿtzlicher und schlu endlich verstšndlicher Muster in (gro en) DatenbestŠnden.Ò Data Mining wird dabei als Bezeichnung fÿr den eigentlichen Analyseschritt, in dem Hypothesen gesucht und bewertet werden, verwendet, d.h. Data Mining ist ein Teilschritt des KDD-Prozesses. Im kommerziellen Bereich wird diese Unterscheidung oft nicht getroffen, hier wird der Begriff Data Mining in der Regel als Synonym von bzw. anstatt des (vielleicht zu unhandlich langen) Begriffs ãknowledge Discovery in DatabasesÒ verwendet. In obiger Definition wird der Begriff ãmusterò bewu t allgemein und eher im Sinne von ãwissenò aufgefa t, welches sehr unterschiedliche Formen annehmen kann (beispielsweise Regeln, Assoziationen, Objektgruppierungen, EntscheidungsbŠume, lineare oder nichtlineare PrŠdiktoren, s.u.). Das entdeckte Wissen soll gÿltig sein, d.h. die vorliegenden Daten, oder besser noch, die dahinterliegenden PhŠnomene richtig beschreiben. Neuigkeit, NŸtzlichkeit und VerstŠndlichkeit sind ebenso wichtig, jedoch ungleich schwerer formal zu erfassen. Die verlangte NichttrivialitŠt schlie lich betont den Aspekte der automatischen Suche nach gÿltigen Mustern und grenzt KDD so z.b. gegen simple Datenbankabfragen ab, die zwar auch Wissen produzieren, jedoch keine Entdeckungen im eigentlichen Sinne darstellen. Auch das populšre OLAP (Online Analytical Processing), bei dem Abfragen entlang vorbestimmter Aggregationsdimensionen schnell beantwortet werden kšnnen, wird deshalb gemeinhin nicht als KDD angesehen. Die Betonung des Proze aspektes in der Definition verweist auf die umfassende Sichtweise, die KDD auf den Proze der Datenanalyse hat: es werden alle Schritte von der ersten BeschŠftigung mit einer DomŠne bis hin zur Verwendung der Ergebnisse in Reports oder installierten Softwaresystemen betrachtet (Abbildung 1).
2 Analyseverfahren auswšhlen Anwendung verstehen Ziele festlegen Daten aus Quellsystemen beschaffen und integrieren Voranalyse Visualisieren Analysedatensatz erzeugen: Verfahrensparameter festlegen AnalyselŠufe durchfÿhren Ergebnisse bewerten und sšubern Visualisieren Ergebnisse nutzen: Reports, operationale Systeme Sampling Transformation SŠuberung Abbildung 1: Der KDD-Proze Dieser KDD-Proze verlšuft dynamisch und iterativ: abhšngig von den Ergebnissen erster Analysen werden andere Daten beschafft, oder es kommen andere Vorverarbeitungsschritte oder Analyseverfahren bzw. andere Parametrisierungen zum Einsatz. Auch wenn sich die meisten Arbeiten im Bereich des KDD mit einzelnen Schritten, in der Regel mit dem Data Mining/Analyseschritt befassen, ist doch die Proze sicht und deren UnterstŸtzung von entscheidender Wichtigkeit fÿr den Erfolg einer KDD-Anwendung (siehe z.b. den Projektbericht von Engels et al. in diesem Heft Ÿber BenutzerunterstŸtzung beim KDD-Proze ). Der Proze des Extrahierens von Daten aus verschiedenen operationalen Datenbanksystemen (OLTP-Datenbanken, online transaction processing) und das ZusammenfŸhren und geeignete Speichern dieser Daten fÿr Auswertungszwecke wird auch als Data Warehousing bezeichnet; im kommerziellen Bereich existieren dafÿr speziell optimierte Datenbankserver, die allerdings mehr auf OLAP-Anfragen als auf die Anforderungen von KDD-Verfahren abgestimmt sind. KDD und Nachbargebiete Die Elemente der obigen Definition kšnnen auch verwendet werden, um Gemeinsamkeiten und Unterschiede zu anderen Disziplinen herauszuarbeiten, die sich ebenfalls mit der Analyse von Daten beschšftigen. So unterscheidet die starke Betonung der automatischen rechnergestÿtzten Suche nach mšglichen Hypothesen das KDD von weiten Bereichen der Statistik (siehe z.b. Hartung et al., 1995), wo eher die (natÿrlich auch fÿr KDD relevanten) Fragen im Vordergrund stehen, mit welcher Sicherheit eine bestimmte Hypothese bei gegebenen Daten als gÿltig angesehen werden kann bzw. wie die Parameter eines gegebenen Modells so geschštzt werden kšnnen, da eine mšglichst hohe Genauigkeit oder Modellwahrscheinlichkeit erreicht wird. Allerdings liest sich bereits die Aufgabenstellung der explorativen Datenanalyse (EDA, Tukey, 1977) in der Statistik sehr Šhnlich wie die allgemeine KDD-Aufgabe, und neuere Entwicklungen der Statistik betrachten bereits stšrker die Frage der Modellwahl (vgl. Elder und Pregibon, 1996). Schlie lich kommen einige der populšrsten Analysemethoden des KDD aus der Statistik (s.u.). Ein weiterer Unterschied zwischen Statistik und KDD, der auch das Maschinelle Lernen (ML, siehe z.b. Mitchell, 1997) von KDD unterscheidet, liegt in den Anforderungen an die Skalierbarkeit der Verfahren. Hier betont KDD sehr viel stšrker als die Statistik oder das ML die Notwendigkeit, mit ãgro enò Datenmengen umzugehen. Dabei bezieht sich Grš e sowohl auf die Anzahl der Variablen (Spalten der einzelnen Tabellen), wo einige Hundert bis einige Tausend angestrebt werden, als auch auf die Anzahl der Datenpunkte (Zeilen), wo die Ziele im
3 Millionen bis Milliardenbereich liegen. So ist denn auch der Datenbankbereich eine der wichtigsten zu KDD beitragenden Nachbardisziplinen, denn bei Datenmengen, die nicht mehr im Hauptspeicher gehalten werden kšnnen, mÿssen die Verfahren auf die Mšglichkeiten der Datenbankengine abgestimmt werden bzw. die Datenbanken und ihre Abfragealgorithmen so strukturiert werden, da sie KDD-typische Abfragen gut bearbeiten kšnnen. Sowohl in der Forschung als auch in der Praxis werden allerdings im Moment hauptsšchlich noch hauptspeicherorientierte Verfahren betrachtet, falls notwendig auf ausgewšhlten Teilmengen der Daten (ãsamplingò), so da de facto die Grš e der bearbeiteten DatenbestŠnde momentan ein problematisches Abgrenzungskriterium ist (wie auch die BeitrŠge in diesem Heft zeigen). Schlie lich bleibt als zentrales Merkmal von KDD die Betonung des interaktiven und iterativen Prozesses, bei dem Mensch und Data Mining-Verfahren gemeinsam verstšndliches und interessantes Wissen entdecken. Dies unterscheidet KDD von all den Bereichen zum Beispiel des Maschinellen Lernens oder der Mustererkennung, in denen Analyseverfahren ohne Interaktion mit dem Menschen Modelle erzeugen, bei denen im wesentlichen die Vorhersageoder Beschreibungsgenauigkeit zur Bewertung herangezogen wird, oder wo Lernverfahren genutzt werden, um adaptives Verhalten zu erzeugen. Die interaktive Proze sicht betont auch die QuerbezŸge zum Gebiet der Visualisierung (siehe z.b. Keim und Kriegel, 1995), durch die die menschliche WahrnehmungsfŠhigkeit fÿr KDD ausgenutzt werden kann. KDD-Aufgaben und Verfahren Je nachdem, wie in obiger Definition die Begriffe ãmusterò und ãdatenbestandò interpretiert werden, ergeben sich unterschiedliche KDD-Analyseaufgaben. So ist mit ãdatenbestandò in aller Regel eine Datenbanktabelle gemeint, in der jede Zeile ein Objekt, jede Spalte ein Attribut oder eine (numerische oder kategoriale) Variable darstellt. FŸr diesen klassischen Bereich propositionaler Daten existieren die meisten Analyseverfahren, und auch die verfÿgbaren kommerziellen Data Mining Systeme beschršnken sich im wesentlichen auf die UnterstŸtzung solcher Datenformate. Neuere Entwicklungen in der Induktiven Logikprogrammierung (ILP, siehe z.b. Lavrac und Wrobel, 1996) haben jedoch Verfahren hervorgebracht, die direkt auch mit mehreren Relationen (und komplexen Termen) arbeiten kšnnen; diese Techniken finden im Moment Eingang in erste kommerzielle Systeme. Auch der Bereich nicht oder nicht ausschlie lich relationaler Daten findet im KDD immer stšrker Beachtung. Handelt es sich bei den zu analysierenden Daten um Textdokumente, wird oft von ãtext MiningÒ gesprochen; sollen Bilddatenbanken untersucht werden, wird der Begriff ãimage MiningÒ verwendet. FŸr raumbezogene und geographische Daten ist ãspatial Data MiningÒ Ÿblich (siehe den Beitrag von Ester et al. in diesem Heft), fÿr Wissenssuche im World-Wide- Web naheliegenderweise ãweb MiningÒ (zum Text und Web Mining siehe auch den Diskussionbeitrag von Feldman und Klšsgen in diesem Heft). UnabhŠngig von der Art der zur VerfŸgung stehenden Daten lassen sich KDD/Data Mining Verfahren nach der Art des erzeugten Wissens, also nach der gelšsten Analyseaufgabe einteilen. Abweichungsentdeckungsverfahren suchen innerhalb einer vorgegebenen Objektmenge nach Mustern, die verschiedene Arten statistisch auffšlliger Abweichungen von Subgruppen beschreiben, etwa Subgruppen, die mit Bezug auf vorhergehende DatenbestŠnde besonders auffšllig sind (zeitliche VerŠnderung) oder sich besonders stark von der Populationsgesamtheit unterscheiden. AbhŠngigkeitsentdeckungsverfahren suchen nach statistischen AbhŠngigkeiten zwischen den beschreibenden Variablen, nicht notwendigerweise zu Klassifikations- oder Vorhersagezwecken. Dies kšnnen z.b. Assoziationsregeln sein, die AbhŠngigkeiten zwischen binšren Attributen erfassen, oder Wahrscheinlichkeitsnetze, die die probabilistischen ZusammenhŠnge zwischen Variablen erfassen (siehe den Beitrag von Borgelt et al. in diesem Heft). Clusteringverfahren teilen eine Menge von Objekten in neu gebildete Gruppen auf, oft so, da innerhalb einer Gruppe eine verfahrensspezifische oder benutzerdefinierte hnlichkeitsfunktion zwischen Objekten maximiert und zwischen verschiedenen Gruppen minimiert wird (siehe den Beitrag von Ester et al.).
4 Klassifikations- oder Vorhersageverfahren verarbeiten eine Menge von Objekten (ãbeispielenò), bei denen der gewÿnschte Wert einer Zielfunktion vorgegeben ist (z.b. Zuordnung diskreter Klassenwerte oder kontinuierlicher Vorhersagegrš en) und erlernen daraus eine allgemeine Funktionsbeschreibung, die dann bei neuen Objekten zur Vorhersage des Zielfunktionswertes genutzt werden kann (siehe den Beitrag von Paa und Kindermann, in dem ein Bayessches Vorhersageverfahren beschrieben wird). FŸr jede dieser Aufgaben gibt es wiederum unterschiedliche Verfahrensgruppen, die auf unterschiedlichen Techniken basieren. Beispiele populšrer Techniken fÿr Vorhersage und Klassifikation sind: Entscheidungsbaumverfahren. Diese ursprÿnglich aus der Statistik stammende Verfahrensklasse produziert BŠume, mit denen sich kategorische oder numerische Variablen vorhersagen lassen. Die Baumknoten fragen Attribute ab und verzweigen dann je nach vorgefundenem Wert des Attributs in unterschiedliche TeilbŠume, bis ein Blatt erreicht wird, das eine vorhergesagte Klasse angibt (z.b. C4.5, Quinlan, 1993) oder eine Regressionsfunktion fÿr numerische Werte enthšlt (CART, Breiman et.al, 1984). Da auf jeder Ebene nur ein Attribut abgefragt wird, gelten BŠume bei nicht zu gro em Umfang als relativ leicht verstšndlich. Hier gibt es auch schon datenbankoptimierte Verfahren (z.b. SLIQ, Mehta et al., 1996). Regellernverfahren. Eine der klassischen Verfahrensklassen aus dem maschinellen Lernen, bei der propositionale oder relationale Wenn-Dann-Regeln aus Daten erzeugt und zu Vorhersage und Klassifikation genutzt werden (z.b. CN2, Clark und Niblett, 1989). Auch probabilistische und unscharfe Regeln kšnnen von geeigneten Verfahren produziert werden (siehe z.b. Nauck et al., 1996). FŸr das Entscheidungsbaumverfahren C4.5 existiert ein Nachbearbeitungsmodul, das aus einem Entscheidungsbaum Regeln erzeugt (Quinlan, 1993). Regressionsverfahren sind numerische Vorhersageverfahren aus der Statistik, bei denen mittels eines Optimierungsverfahrens die Parameter einer linearen oder nichtlinearen Funktion bestimmt werden. Unter den nichtlinearen Regressionsverfahren sind die Neuronalen Netze (feedforward Netze mit RŸckpropagation, siehe z.b. Nauck et al., 1996) und die adaptiven Regressions-Splines (z.b. MARS, Friedman, 1989) populšr. Bei diesen Verfahren wird jedoch aus KDD-Sicht oft mangelnde VerstŠndlichkeit kritisiert. Bayes-Verfahren nutzen im wesentlichen das Bayes-Theorem: gegeben die Daten, verwende das Modell bzw. sage die Klasse voraus, welche die grš te a posteriori Wahrscheinlichkeit aufweisen. Diese Verfahren kšnnen theoretisch sehr gut begrÿndet werden und erreichen hervorragende Ergebnisse (siehe den Beitrag von Paa und Kindermann in diesem Heft). FŸr Abweichungs- und AbhŠngigkeitsentdeckung sind populšr: Assoziationsregelverfahren. Diese Verfahren sind vor allem aus der Warenkorbanalyse bekannt, wo AbhŠngigkeiten zwischen dem Kauf verschiedener Waren aufgedeckt werden sollen (ã80% aller KŠufer von Bier und Chips kaufen auch SŸ warenò). Diese Verfahren kšnnen fÿr den Ablauf auf Datenbanken optimiert werden und bieten dann quasi-lineare LaufzeitkomplexitŠt, was sie auch fÿr sehr gro e Probleme attraktiv macht (siehe Agrawal et al., 1996). Subgruppenverfahren. Bei diesen Verfahren gibt der Benutzer ein Abweichungsmuster an, das fÿr die zu betrachtende Population von Interesse, und erhšlt vom Verfahren alle oder ausgewšhlte Subgruppen, bei denen sich das Abweichungsmuster signifikant verifizieren lš t. Bei kategorialen Variablen wird z.b. nach auffšlligen Werteverteilungen gesucht, bei numerischen Attributen werden Durchschnittswerte oder ãmarktanteileò zum Vergleich herangezogen (z.b. EXPLORA, Klšsgen, 1996 und die relationale Variante MIDOS, Wrobel, 1997). Probabilistische Netze modellieren die AbhŠngigkeit zwischen Variablen explizit durch Kanten, die zwei Variablen durch einen Einflu bestimmter StŠrke miteinander verbinden. Dies kann auch zu Vorhersagezwecken genutzt werden (siehe den Beitrag von Borgelt et al. in diesem Heft). KDD-Anwendungen
5 Die klassischen KDD-Anwendungen liegen im geschšftlich-kommerziellen Bereich. Sowohl beim Database Marketing, also der Marketingsteuerung mit Datenbankinformationen, als auch bei der Sortimentsoptimierng und KreditwŸrdigkeitsprŸfung finden sich Anwendungen, zum Beispiel: Kundensegmentierung (Clusterung), um Profile von typischen Kundengruppen zu erhalten, die dann jeweils gemeinsam behandelt werden kšnnen. Antwortvorhersage/Mail scoring. Hier geht es um die Auswahl von Kunden fÿr die direkte Ansprache, z.b. per Brief. Bei begrenztem Budget sollten zunšchst die Kunden angeschrieben werden, bei denen eine positive Antwort am wahrscheinlichsten ist. KŸndigungsanalyse. Ebenfalls ein Vorhersageproblem, bei dem mšgliche KŸndigungsabsichten vorhergesagt werden sollen, um ggf. mit geeigneten Ma nahmen gegensteuern zu kšnnen. KreditwŸrdigkeitsentscheidungen. Soll einem Kunden ein (weiterer) Kredit eingeršumt werden? Warenkorbanalyse. Die klassische Anwendung der Assoziationsregeln. Welche Waren werden zusammen oder nacheinander gekauft? Solche Waren kšnnen geeignet plaziert oder durch Paketangebote verbunden werden. Auch wenn dies die bekanntesten Anwendungen sind, so liegt doch ein ebenso gro es Potential fÿr KDD-Methoden in technisch-wissenschaftlichen Fragestellungen, beispielsweise Proze optimierung (welche ZustŠnde eines technischen Prozesses fÿhren zu besserer, welche zu schlechterer ProduktqualitŠt?) oder chemisch/biologische Klassifikation (wie kann ich aktive von inaktiven MolekŸlen unterscheiden?). Die KDD-Konferenzen der vergangenen Jahre (siehe Serviceteil) enthalten vielfšltige Beschreibungen weiterer Anwendungen in diesen Bereichen. (Siehe auch den Beitrag von Burgard et al. in diesem Heft). KDD-Systeme Der Markt fÿr KDD-Systeme ist Šu erst dynamisch und bietet zahlreiche Alternativen (siehe Serviceteil). Nachdem in der KDD-FrŸhphase vor allem Systeme mit einem einzigen Analyseverfahren verfÿgbar waren, die zudem ausschlie lich den Analyseschritt unterstÿtzten, bietet die heutige Systemgeneration UnterstŸtzung fÿr den gesamten KDD-Proze von der Datenbeschaffung bis zur Nutzung der Ergebnisse. Aktuelle Systeme enthalten auch alternative Analysemethoden aus den oben beschriebenen Verfahrensklassen oder sind sogar vom Benutzer erweiterbar. Entscheidungsbaumverfahren sind dabei in nahezu jedem System verfÿgbar. Im Bereich der Datenbankanbindung und Skalierbarkeit ist zwar der Importzugriff auf Datenbanken Standard, nur wenige Systeme kšnnen jedoch direkt mit den Daten in der Datenbank arbeiten oder vorverarbeitete Daten und Analyseergebnisse dort ablegen. Von Skalierbarkeit in den Terabyte-Bereich kann generell im Moment nicht ausgegangen werden. Ebenso fehlt generell noch die BenutzerunterstŸtzung bei der Auswahl geeigneter KDD-Schritte (siehe den Beitrag von Engels et al. in diesem Heft). KDD-Forschungsfragen Die Forschungsfragen, die zur Zeit das Gebiet des KDD/Data Mining bestimmen, sind zum Teil identisch mit den Fragen, die in den benachbarten Gebieten Statistik und Maschinelles Lernen gestellt werden: Vorhersagegenauigkeit. Wie kšnnen Verfahren entwickelt werden, die auf den in der Praxis auftretenden DatenbestŠnden eine noch hšhere Vorhersagegenauigkeit erreichen? Verrauschte und fehlerhafte Daten. Wie kšnnen Analyseverfahren besser damit umgehen, da ein gewisser Teil der zur VerfŸgung stehenden Daten systematische oder zufšllige Fehler aufweist? VerŠnderliche Daten. Wie kšnnen Analyseverfahren erkennen, da sich der einer Datensammlung zugrundeliegende Proze gešndert hat, und da es daher nicht sinnvoll ist, alle Daten mit gemeinsamen Mustern oder Vorhersagefunktionen zu beschreiben? VerlŠ lichkeit und Signifikanz. Wie kann verhindert werden, da Klassifikatoren nur auf den zu ihrer Erzeugung benutzten Daten genau sind, weil sie z.b. diese Daten viel zu genau
6 abbilden (overfitting)? Wie kann verhindert werden, da zufšllige Fluktuationen als Entdeckungen berichtet werden? (J. Buhmann Šu ert sich dazu in einem Diskussionbeitrag in diesem Heft.) Andere Forschungsfragen dagegen kennzeichnen das Gebiet KDD, und werden in Nachbardisziplinen hšufig nicht betrachtet: Skalierbarkeit. Wie kann im KDD-Proze mit DatenbestŠnden im Gigabyte- bzw. Terabyte- Bereich umgegangen werden, wie mit DatenbestŠnden mit hunderten oder Tausenden von Attributen, wie mit multirelationalen Daten? Wie mu DatenbankunterstŸtzung aussehen? (Ester et al. diskutieren das in diesem Heft fÿr ršumliche Datenbanken.) Interessantheit/VerstŠndlichkeit. Wie kann der Rechner den Interessantheitsbegriffs des Benutzers erfassen und zur Steuerung der Suche nutzen? Welche Art von Ergebnissen ist fÿr den Benutzer verstšndlich? Benutzerinteraktion und -unterstÿtzung. Wie lš t sich anderes Benutzerwissen sinnvoll in die Suche der Verfahren einbinden? Wie kšnnen weniger erfahrene Benutzer bei der DurchfŸhrung des KDD-Prozesses unterstÿtzt werden? Welche Interaktionsformen und Visualisierungen sind angemessen? (siehe den Beitrag von Engels et al. in diesem Heft). Systeme und Integration. Wie integriert sich KDD in die existierende Infrastruktur eines Unternehmens? Welche Architektur sollten KDD-Systeme aufweisen? Wie kšnnen Data Mining Ergebnisse unternehmensweit genutzt werden? Besonders interessant und aktuell relevant sind schlie lich die Fragen, die sich aus der Betrachtung nichtstrukturierter DatenbestŠnde im KDD ergeben: Text- und Web Mining. Wie kšnnen die grš tenteils textuellen Ressourcen im World-Wide- Web sinnvoll zur Extraktion von Wissen genutzt werden? (siehe den Beitrag von Feldman und Klšsgen in diesem Heft) Multimediale Daten. Wie kšnnen Bild- und Tondaten einer Analyse zugšnglich gemacht werden? Raumbezug. Viele Daten haben Raumbezug und sind in Geographischen Informationssystemen (GIS) bzw. spatial data bases abgelegt. Wie mÿssen Analyseverfahren gešndert werden, um den besonderen Gegebenheiten ršumlicher Daten (Nachbarschaft) Rechnung zu tragen? (siehe den Beitrag von Ester et al. in diesem Heft) KDD in diesem KI-Themenheft Das vorliegende Themenheft Data Mining der KI spiegelt aktuelle Trends und Forschungsfragen des KDD wider. Die drei FachbeitrŠge befassen sich mit dem Teil von KDD, auf den sich immer noch die meisten Forschungsarbeiten konzentrieren Ð neue und bessere Verfahren fÿr den eigentlichen Analyseschritt. Der Beitrag von Borgelt, Kruse und Lindner befa t sich mit den oben erwšhnten probabilistischen und possibilistischen Netzen, beschreibt deren Grundlagen und eine Anwendung in der Automobilindustrie. Der Beitrag von Paa und Kindermann betrachtet ebenfalls probabilistische AnsŠtze (Bayes), konzentriert sich dabei aber auf die aktuelle Frage,wie mehrere Klassifikatoren (Modelle) so kombiniert werden kšnnen, da die Gesamtvorhersagegenauigkeit verbessert wird. WŠhrend diese beiden Arbeiten mit klassischen strukturierten Tabellendaten arbeiten und Vorhersageprobleme betrachten, behandelt der Beitrag von Ester, Kriegel, Sander und Xu den neuen Bereich des Spatial Data Mining und dabei speziell die Frage der Bildung von Clustern in ršumlichen Datenbanken. Hier geht es, im Gegensatz zu den ersten beiden BeitrŠgen, um die Analyse von DatenbestŠnden, die nicht in den Hauptspeicher passen, also um eines der KDDspezifischen Probleme.
7 Einem anderen KDD-spezifischen Problem, der BenutzerunterstŸtzung im KDD-Proze, widmet sich ein Projektbeitrag von Engels, Lindner und Studer. Die Autoren zeigen, wie Modellierungskonzepte aus dem Bereich wiederverwendbaren Problemlšsungswissens abgewandelt und fÿr die KDD-UnterstŸtzung eingesetzt werden kšnnen. Anwendungen sind auf den ersten Blick in diesem Heft nur in einem Beitrag vertreten, bei dem sich W. Burgard et al. mit der BrandfrŸherkennung im Bergbau beschšftigen. Ein interessanter Beitrag aus zwei GrŸnden: zum einen wird das erstellte System tatsšchlich in der Praxis genutzt, zum anderen zeigt der Beitrag, da keineswegs notwendigerweise hochkomplexe Techniken eingesetzt werden mÿssen, um erfolgreich zu sein. Hier konnten einfache statistische Modellierungen zusammen mit einem regelbasierten System erfolgreich genutzt werden. Weitere Anwendungen verstecken sich aber auch in anderen BeitrŠgen: eine Anwendung im Automobilbau bei Borgelt et al. und eine Bankanwendung bei Paa und Kindermann. Abgerundet wird das Heft schlie lich durch DiskussionsbeitrŠge, Rezensionen, Tagungsberichte und einen Serviceteil. Die Diskussionen befassen sich mit aktuellen Forschungs- und Praxisfragen des KDD. Der Beitrag von J. Buhmann stellt die Frage nach der VerlŠ lichkeit von Data Mining-Ergebnissen, Feldman und Klšsgen diskutieren auf der Basis einer entsprechenden Diskussion auf der KDD-97 Aspekte des Web- und Text Mining, und J. Feist stellt Forderungen an das Data Mining aus praktischer Sicht. Weitergehende Informationen Vertiefende Informationen zu den hier angesprochenen Themen bieten sowohl die KonferenzbŠnde der jšhrlichen KDD-Tagungen als auch eine Vielzahl von BŸchern zum Thema Data Mining. Insbesondere der auch hier zitierte Sammelband (Fayyad et al. 96a) ist eine populšre Anlaufstation, aber auch erste zusammenhšngende LehrbŸcher zum Thema sind erschienen (siehe Rezensionen). ber Software, Anbieter, Web-Seiten usw. informiert schlie lich die Knowledge Discovery Mine im WWW. (Genaue Titel und Adressen siehe Serviceteil). Dank FŸr hilfreiche Kommentare danke ich meinem Kollegen Willi Klšsgen. Literaturhinweise (Agrawal et al., 1996) Association rules. Agrawal, R., Mannila, H., Srikant, R., Toivonen H. und Verkamo, I., Fast Discovery of Association Rules, in (Fayyad et al., 1996a), Kapitel 12, S (Breiman et.al, 1984) Breiman, L. and Friedman, J.H. and Olshen, R.A. and Stone, C.J., Classification and regression trees, Belmont, Wadsworth. (Clark und Niblett, 1989) Clark, P. und Niblett, T., The CN2 Induction Algorithm, Machine Learning, 3:4, S (Elder und Pregibon, 1996) Elder, J.F. und Pregibon, D., A Statistical Perspective on Knowledge Discovery in Databases, in (Fayyad et al., 1996a), Kapitel 4, S (Fayyad et al., 1996a) Fayyad, U., Piatetsky-Shapiro, G., Smyth, P. und Uthurusamy, R., Advances in Knowledge Discovery and Data Mining, AAAI/MIT Press, Cambridge. (Fayyad et al., 1996b) Fayyad, U., Piatetsky-Shapiro, G. und Smyth, P., From Data Mining to Knowledge Discovery: An Overview, in (Fayyad et al., 1996a), Kapitel 1, S (Friedman, 1989) Friedman, J.H., Multivariate Adaptive Regression Splines, Annals of Statistics, 19:
8 (Hartung et al., 1995) Hartung, J., Elpelt, B. und Klšsener, K.-H., Lehr- und Handbuch der angewandten Statistik, 10. Auflage, Oldenbourg, MŸnchen. (Keim und Kriegel, 1995) Keim D. A. und Kriegel H.-P., Visualisierungstechniken zur Exploration und Analyse sehr gro er Datenbanken, in Proc. Datenbanksysteme in BŸro, Technik und Wissenschaft (BTW), Dresden, 1995, Springer Verlag. (Klšsgen, 1996) Klšsgen, W., Explora: A Multipattern and Multistrategy Discovery Assistant, in (Fayyad et al., 1996a), Kapitel 10, S (Lavrac und Wrobel, 1996) Lavrac, N. und Wrobel, S. Induktive Logikprogrammierung - Grundlagen und Techniken, KI - KŸnstliche Intelligenz, 10:3, S , (Mehta et al., 1996) Mehta, M., Agrawal R. und Rissanen, J., SLIQ: A Fast Scalable Classifier for Data Mining, in Proc. of the Fifth Int. Conference on Extending Database Technology, Avignon, France. (Mitchell, 1997) Mitchell, T., Machine Learning, McGraw-Hill, New York. (Nauck et al., 1996) Nauck, D., Klawonn, F. und Kruse, R., Neuronale Netze und Fuzzy- Systeme, 2. Auflage, Vieweg Verlag, Wiesbaden. (Quinlan, 1993) Quinlan, J.R., C4.5 Ð Programs for Machine Learning. Morgan Kaufman, Palo Alto. (Tukey, 1977) Tukey, J.W., Exploratory Data Analysis, Addison-Wesley, Reading/London. (Wrobel, 1997) An Algorithm for Multirelational Discovery of Subgroups, in Proc. First Europ. Symp. on Principles of Data Mining and Knowledge Discovery, Komorowski, J. und Zytkow, J. (Hrsg.), S , Springer Verlag.
Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery
Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?
MehrProfessionelle Seminare im Bereich MS-Office
Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion
MehrAGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom 21.10.2013b
AGROPLUS Buchhaltung Daten-Server und Sicherheitskopie Version vom 21.10.2013b 3a) Der Daten-Server Modus und der Tresor Der Daten-Server ist eine Betriebsart welche dem Nutzer eine grosse Flexibilität
Mehr1 Mathematische Grundlagen
Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.
MehrKapitel 4 Die Datenbank Kuchenbestellung Seite 1
Kapitel 4 Die Datenbank Kuchenbestellung Seite 1 4 Die Datenbank Kuchenbestellung In diesem Kapitel werde ich die Theorie aus Kapitel 2 Die Datenbank Buchausleihe an Hand einer weiteren Datenbank Kuchenbestellung
Mehr2.1 Präsentieren wozu eigentlich?
2.1 Präsentieren wozu eigentlich? Gute Ideen verkaufen sich in den seltensten Fällen von allein. Es ist heute mehr denn je notwendig, sich und seine Leistungen, Produkte etc. gut zu präsentieren, d. h.
MehrNeue Medien in der Erwachsenenbildung
Stang, Richard Neue Medien in der Erwachsenenbildung Statement zum DIE-Forum Weiterbildung 2000 "Zukunftsfelder der Erwachsenenbildung" Deutsches Institut für Erwachsenenbildung Online im Internet: URL:
Mehr1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung
1 Einleitung 1.1 Motivation und Zielsetzung der Untersuchung Obgleich Tourenplanungsprobleme zu den am häufigsten untersuchten Problemstellungen des Operations Research zählen, konzentriert sich der Großteil
MehrPrimzahlen und RSA-Verschlüsselung
Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also
MehrMORE Profile. Pass- und Lizenzverwaltungssystem. Stand: 19.02.2014 MORE Projects GmbH
MORE Profile Pass- und Lizenzverwaltungssystem erstellt von: Thorsten Schumann erreichbar unter: thorsten.schumann@more-projects.de Stand: MORE Projects GmbH Einführung Die in More Profile integrierte
MehrVorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke
Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,
MehrKonzepte der Informatik
Konzepte der Informatik Vorkurs Informatik zum WS 2011/2012 26.09. - 30.09.2011 17.10. - 21.10.2011 Dr. Werner Struckmann / Christoph Peltz Stark angelehnt an Kapitel 1 aus "Abenteuer Informatik" von Jens
MehrData Mining: Einige Grundlagen aus der Stochastik
Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener
MehrZahlen auf einen Blick
Zahlen auf einen Blick Nicht ohne Grund heißt es: Ein Bild sagt mehr als 1000 Worte. Die meisten Menschen nehmen Informationen schneller auf und behalten diese eher, wenn sie als Schaubild dargeboten werden.
MehrLineargleichungssysteme: Additions-/ Subtraktionsverfahren
Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als
MehrAllgemeines zu Datenbanken
Allgemeines zu Datenbanken Was ist eine Datenbank? Datensatz Zusammenfassung von Datenelementen mit fester Struktur Z.B.: Kunde Alois Müller, Hegenheimerstr. 28, Basel Datenbank Sammlung von strukturierten,
Mehrmysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank
mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank In den ersten beiden Abschnitten (rbanken1.pdf und rbanken2.pdf) haben wir uns mit am Ende mysql beschäftigt und kennengelernt, wie man
MehrDaten sammeln, darstellen, auswerten
Vertiefen 1 Daten sammeln, darstellen, auswerten zu Aufgabe 1 Schulbuch, Seite 22 1 Haustiere zählen In der Tabelle rechts stehen die Haustiere der Kinder aus der Klasse 5b. a) Wie oft wurden die Haustiere
MehrBewertung des Blattes
Bewertung des Blattes Es besteht immer die Schwierigkeit, sein Blatt richtig einzuschätzen. Im folgenden werden einige Anhaltspunkte gegeben. Man unterscheidet: Figurenpunkte Verteilungspunkte Längenpunkte
MehrAnleitung über den Umgang mit Schildern
Anleitung über den Umgang mit Schildern -Vorwort -Wo bekommt man Schilder? -Wo und wie speichert man die Schilder? -Wie füge ich die Schilder in meinen Track ein? -Welche Bauteile kann man noch für Schilder
MehrBuchhaltung mit WISO EÜR & Kasse 2011
Vorbemerkung... 1 1. Erste Schritte...Fehler! Textmarke nicht definiert.3 2. Einrichten des Programms... 5 3. Buchungen... 22 1. Anfangsbestand buchen... 22 2. Privateinlage in die Kasse... 26 4. Buchungen
MehrPersönlichkeit und Persönlichkeitsunterschiede
9 Persönlichkeit und Persönlichkeitsunterschiede 1 Inhalt Die Beschäftigung mit der menschlichen Persönlichkeit spielt in unserem Alltag eine zentrale Rolle. Wir greifen auf das globale Konzept Persönlichkeit
MehrNicht kopieren. Der neue Report von: Stefan Ploberger. 1. Ausgabe 2003
Nicht kopieren Der neue Report von: Stefan Ploberger 1. Ausgabe 2003 Herausgeber: Verlag Ploberger & Partner 2003 by: Stefan Ploberger Verlag Ploberger & Partner, Postfach 11 46, D-82065 Baierbrunn Tel.
MehrStatistische Auswertung:
Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.
MehrOutlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang
sysplus.ch outlook - mail-grundlagen Seite 1/8 Outlook Mail-Grundlagen Posteingang Es gibt verschiedene Möglichkeiten, um zum Posteingang zu gelangen. Man kann links im Outlook-Fenster auf die Schaltfläche
MehrData Mining als Arbeitsprozess
Data Mining als Arbeitsprozess Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 31. Dezember 2015 In Unternehmen werden umfangreichere Aktivitäten oder Projekte im Bereich des Data Mining
MehrFestigkeit von FDM-3D-Druckteilen
Festigkeit von FDM-3D-Druckteilen Häufig werden bei 3D-Druck-Filamenten die Kunststoff-Festigkeit und physikalischen Eigenschaften diskutiert ohne die Einflüsse der Geometrie und der Verschweißung der
MehrViele Bilder auf der FA-Homepage
Viele Bilder auf der FA-Homepage Standardmäßig lassen sich auf einer FA-Homepage nur 2 Bilder mit zugehörigem Text unterbringen. Sollen es mehr Bilder sein, muss man diese als von einer im Internet
MehrEnergetische Klassen von Gebäuden
Energetische Klassen von Gebäuden Grundsätzlich gibt es Neubauten und Bestandsgebäude. Diese Definition ist immer aktuell. Aber auch ein heutiger Neubau ist in drei (oder vielleicht erst zehn?) Jahren
MehrInsiderwissen 2013. Hintergrund
Insiderwissen 213 XING EVENTS mit der Eventmanagement-Software für Online Eventregistrierung &Ticketing amiando, hat es sich erneut zur Aufgabe gemacht zu analysieren, wie Eventveranstalter ihre Veranstaltungen
MehrTipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".
Mathematik- Unterrichts- Einheiten- Datei e. V. Klasse 9 12 04/2015 Diabetes-Test Infos: www.mued.de Blutspenden werden auf Diabetes untersucht, das mit 8 % in der Bevölkerung verbreitet ist. Dabei werden
MehrLeseprobe. Bruno Augustoni. Professionell präsentieren. ISBN (Buch): 978-3-446-44285-6. ISBN (E-Book): 978-3-446-44335-8
Leseprobe Bruno Augustoni Professionell präsentieren ISBN (Buch): 978-3-446-44285-6 ISBN (E-Book): 978-3-446-44335-8 Weitere Informationen oder Bestellungen unter http://wwwhanser-fachbuchde/978-3-446-44285-6
Mehr4. BEZIEHUNGEN ZWISCHEN TABELLEN
4. BEZIEHUNGEN ZWISCHEN TABELLEN Zwischen Tabellen können in MS Access Beziehungen bestehen. Durch das Verwenden von Tabellen, die zueinander in Beziehung stehen, können Sie Folgendes erreichen: Die Größe
MehrIn diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.
In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access Die Grundlagen der Datenbanken kurspc15 Inhaltsverzeichnis Access... Fehler! Textmarke nicht
MehrWürfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.
040304 Übung 9a Analysis, Abschnitt 4, Folie 8 Die Wahrscheinlichkeit, dass bei n - maliger Durchführung eines Zufallexperiments ein Ereignis A ( mit Wahrscheinlichkeit p p ( A ) ) für eine beliebige Anzahl
MehrData Mining-Modelle und -Algorithmen
Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,
MehrMobile Intranet in Unternehmen
Mobile Intranet in Unternehmen Ergebnisse einer Umfrage unter Intranet Verantwortlichen aexea GmbH - communication. content. consulting Augustenstraße 15 70178 Stuttgart Tel: 0711 87035490 Mobile Intranet
MehrLernmaterial für die Fernuni Hagen effizient und prüfungsnah
Lernmaterial für die Fernuni Hagen effizient und prüfungsnah www.schema-f-hagen.de Sie erhalten hier einen Einblick in die Dokumente Aufgaben und Lösungen sowie Erläuterungen Beim Kauf erhalten Sie zudem
MehrStellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster
Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.
Mehr2. Psychologische Fragen. Nicht genannt.
Checkliste für die Beurteilung psychologischer Gutachten durch Fachfremde Gliederung eines Gutachtens 1. Nennung des Auftraggebers und Fragestellung des Auftraggebers. 2. Psychologische Fragen. Nicht genannt.
MehrEinführung in die Fuzzy Logic
Einführung in die Fuzzy Logic Entwickelt von L. Zadeh in den 60er Jahren Benutzt unscharfe (fuzzy) Begriffe und linguistische Variablen Im Gegensatz zur Booleschen Logik {0,} wird das ganze Intervall [0,]
MehrEin Vorwort, das Sie lesen müssen!
Ein Vorwort, das Sie lesen müssen! Sehr geehrte Teilnehmerin, sehr geehrter Teilnehmer am Selbststudium, herzlichen Glückwunsch, Sie haben sich für ein ausgezeichnetes Stenografiesystem entschieden. Sie
MehrAlle gehören dazu. Vorwort
Alle gehören dazu Alle sollen zusammen Sport machen können. In diesem Text steht: Wie wir dafür sorgen wollen. Wir sind: Der Deutsche Olympische Sport-Bund und die Deutsche Sport-Jugend. Zu uns gehören
MehrL10N-Manager 3. Netzwerktreffen der Hochschulübersetzer/i nnen Mannheim 10. Mai 2016
L10N-Manager 3. Netzwerktreffen der Hochschulübersetzer/i nnen Mannheim 10. Mai 2016 Referentin: Dr. Kelly Neudorfer Universität Hohenheim Was wir jetzt besprechen werden ist eine Frage, mit denen viele
MehrInstitut für Computational Engineering ICE. N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t. w w w. n t b.
Institut für Computational Engineering ICE N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t w w w. n t b. c h Rechnen Sie mit uns Foto: ESA Das Institut für Computational Engineering
MehrHandbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: 24.09.2014)
Handbuch NAFI Online-Spezial 1. Auflage (Stand: 24.09.2014) Copyright 2016 by NAFI GmbH Unerlaubte Vervielfältigungen sind untersagt! Inhaltsangabe Einleitung... 3 Kundenauswahl... 3 Kunde hinzufügen...
MehrProjektmanagement in der Spieleentwicklung
Projektmanagement in der Spieleentwicklung Inhalt 1. Warum brauche ich ein Projekt-Management? 2. Die Charaktere des Projektmanagement - Mastermind - Producer - Projektleiter 3. Schnittstellen definieren
MehrIst Fernsehen schädlich für die eigene Meinung oder fördert es unabhängig zu denken?
UErörterung zu dem Thema Ist Fernsehen schädlich für die eigene Meinung oder fördert es unabhängig zu denken? 2000 by christoph hoffmann Seite I Gliederung 1. In zu großen Mengen ist alles schädlich. 2.
MehrGeld Verdienen im Internet leicht gemacht
Geld Verdienen im Internet leicht gemacht Hallo, Sie haben sich dieses E-book wahrscheinlich herunter geladen, weil Sie gerne lernen würden wie sie im Internet Geld verdienen können, oder? Denn genau das
MehrHandbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken
Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen
MehrSpeicher in der Cloud
Speicher in der Cloud Kostenbremse, Sicherheitsrisiko oder Basis für die unternehmensweite Kollaboration? von Cornelius Höchel-Winter 2013 ComConsult Research GmbH, Aachen 3 SYNCHRONISATION TEUFELSZEUG
Mehr«Eine Person ist funktional gesund, wenn sie möglichst kompetent mit einem möglichst gesunden Körper an möglichst normalisierten Lebensbereichen
18 «Eine Person ist funktional gesund, wenn sie möglichst kompetent mit einem möglichst gesunden Körper an möglichst normalisierten Lebensbereichen teilnimmt und teilhat.» 3Das Konzept der Funktionalen
MehrUmgang mit Schaubildern am Beispiel Deutschland surft
-1- Umgang mit Schaubildern am Beispiel Deutschland surft Im Folgenden wird am Beispiel des Schaubildes Deutschland surft eine Lesestrategie vorgestellt. Die Checkliste zur Vorgehensweise kann im Unterricht
Mehr50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte
50. Mathematik-Olympiade. Stufe (Regionalrunde) Klasse 3 Lösungen c 00 Aufgabenausschuss des Mathematik-Olympiaden e.v. www.mathematik-olympiaden.de. Alle Rechte vorbehalten. 503 Lösung 0 Punkte Es seien
MehrÜbungsaufgaben Tilgungsrechnung
1 Zusatzmaterialien zu Finanz- und Wirtschaftsmathematik im Unterricht, Band 1 Übungsaufgaben Tilgungsrechnung Überarbeitungsstand: 1.März 2016 Die grundlegenden Ideen der folgenden Aufgaben beruhen auf
MehrNutzung von GiS BasePac 8 im Netzwerk
Allgemeines Grundsätzlich kann das GiS BasePac Programm in allen Netzwerken eingesetzt werden, die Verbindungen als Laufwerk zu lassen (alle WINDOWS Versionen). Die GiS Software unterstützt nur den Zugriff
MehrData Mining-Projekte
Data Mining-Projekte Data Mining-Projekte Data Mining stellt normalerweise kein ei nmaliges Projekt dar, welches Erkenntnisse liefert, die dann nur einmal verwendet werden, sondern es soll gewöhnlich ein
MehrBinäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen
Binäre Bäume 1. Allgemeines Binäre Bäume werden grundsätzlich verwendet, um Zahlen der Größe nach, oder Wörter dem Alphabet nach zu sortieren. Dem einfacheren Verständnis zu Liebe werde ich mich hier besonders
Mehr6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)
6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden
Mehr1. Was sind Aufgaben?... 1 2. Aufgaben einrichten... 2 3. Ansicht für die Teilnehmer/innen... 3
AG elearning Service und Beratung für E-Learning und Mediendidaktik ZEIK Zentrale Einrichtung für Informationsverarbeitung und Kommunikation Moodle an der Universität-Potsdam How-To: Aufgaben Inhalt: 1.
MehrHandbuch Fischertechnik-Einzelteiltabelle V3.7.3
Handbuch Fischertechnik-Einzelteiltabelle V3.7.3 von Markus Mack Stand: Samstag, 17. April 2004 Inhaltsverzeichnis 1. Systemvorraussetzungen...3 2. Installation und Start...3 3. Anpassen der Tabelle...3
MehrWAS finde ich WO im Beipackzettel
WAS finde ich WO im Beipackzettel Sie haben eine Frage zu Ihrem? Meist finden Sie die Antwort im Beipackzettel (offiziell "Gebrauchsinformation" genannt). Der Aufbau der Beipackzettel ist von den Behörden
MehrPädagogik. Melanie Schewtschenko. Eingewöhnung und Übergang in die Kinderkrippe. Warum ist die Beteiligung der Eltern so wichtig?
Pädagogik Melanie Schewtschenko Eingewöhnung und Übergang in die Kinderkrippe Warum ist die Beteiligung der Eltern so wichtig? Studienarbeit Inhaltsverzeichnis 1. Einleitung.2 2. Warum ist Eingewöhnung
MehrDie Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.
Lineare Gleichungen mit einer Unbekannten Die Grundform der linearen Gleichung mit einer Unbekannten x lautet A x = a Dabei sind A, a reelle Zahlen. Die Gleichung lösen heißt, alle reellen Zahlen anzugeben,
MehrDAVID: und David vom Deutschlandlabor. Wir beantworten Fragen zu Deutschland und den Deutschen.
Manuskript Die Deutschen sind bekannt dafür, dass sie ihre Autos lieben. Doch wie sehr lieben sie ihre Autos wirklich, und hat wirklich jeder in Deutschland ein eigenes Auto? David und Nina fragen nach.
MehrQualität und Verlässlichkeit Das verstehen die Deutschen unter Geschäftsmoral!
Beitrag: 1:43 Minuten Anmoderationsvorschlag: Unseriöse Internetanbieter, falsch deklarierte Lebensmittel oder die jüngsten ADAC-Skandale. Solche Fälle mit einer doch eher fragwürdigen Geschäftsmoral gibt
MehrErstellen von x-y-diagrammen in OpenOffice.calc
Erstellen von x-y-diagrammen in OpenOffice.calc In dieser kleinen Anleitung geht es nur darum, aus einer bestehenden Tabelle ein x-y-diagramm zu erzeugen. D.h. es müssen in der Tabelle mindestens zwei
MehrBENUTZERHANDBUCH für. www.tennis69.at. Inhaltsverzeichnis. 1. Anmeldung. 2. Rangliste ansehen. 3. Platzreservierung. 4. Forderungen anzeigen
BENUTZERHANDBUCH für www.tennis69.at Inhaltsverzeichnis Einleitung 1. Anmeldung 2. Rangliste ansehen 3. Platzreservierung 4. Forderungen anzeigen 5. Forderung eintragen 6. Mitgliederliste 7. Meine Nachrichten
MehrFlowFact Alle Versionen
Training FlowFact Alle Versionen Stand: 29.09.2005 Rechnung schreiben Einführung Wie Sie inzwischen wissen, können die unterschiedlichsten Daten über verknüpfte Fenster miteinander verbunden werden. Für
MehrKünstliche Intelligenz Maschinelles Lernen
Künstliche Intelligenz Maschinelles Lernen Stephan Schwiebert Sommersemester 2009 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Maschinelles Lernen Überwachtes Lernen
Mehr1 topologisches Sortieren
Wolfgang Hönig / Andreas Ecke WS 09/0 topologisches Sortieren. Überblick. Solange noch Knoten vorhanden: a) Suche Knoten v, zu dem keine Kante führt (Falls nicht vorhanden keine topologische Sortierung
MehrUnterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Das komplette Material finden Sie hier: Download bei School-Scout.de
MehrRMeasy das SAP IS U Add On für Versorgungsunternehmen. Optimieren Sie Ihre Prozesse in Kundengewinnung und Kundenbindung.
Beschreibung Wenn Sie: mit ECC 6.0 und IS-U auf die integrierte Systemlösung der SAP setzen und zur Gewinnung neuer und Bindung vorhandener Kunden eine gleichfalls integrierte Lösung suchen und eine Produkt
MehrIm Original veränderbare Word-Dateien
Objekte einer Datenbank Microsoft Access Begriffe Wegen seines Bekanntheitsgrades und der großen Verbreitung auch in Schulen wird im Folgenden eingehend auf das Programm Access von Microsoft Bezug genommen.
MehrSemestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7.
Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. 2004 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....
MehrDer Tag hat 24 Stunden. Bitte schreibt in die linke Spalte alles auf, was ihr gestern getan habt und euch noch einfällt: War es ein stressiger
Workshop pädagogische Tage JCBS in Sechselberg 2011 Zeitmanagement in der Schule I. Zeit- wo gehst du hin? Der Tag hat 24 Stunden. Bitte schreibt in die linke Spalte alles auf, was ihr gestern getan habt
MehrAuktionen erstellen und verwalten mit dem GV Büro System und der Justiz Auktion
Auktionen erstellen und verwalten mit dem GV Büro System und der Justiz Auktion Workshop Software GmbH Siemensstr. 21 47533 Kleve 02821 / 731 20 02821 / 731 299 www.workshop-software.de Verfasser: SK info@workshop-software.de
MehrInfo zum Zusammenhang von Auflösung und Genauigkeit
Da es oft Nachfragen und Verständnisprobleme mit den oben genannten Begriffen gibt, möchten wir hier versuchen etwas Licht ins Dunkel zu bringen. Nehmen wir mal an, Sie haben ein Stück Wasserrohr mit der
MehrSonderrundschreiben. Arbeitshilfe zu den Pflichtangaben in Immobilienanzeigen bei alten Energieausweisen
Sonderrundschreiben Arbeitshilfe zu den Pflichtangaben in Immobilienanzeigen bei alten Energieausweisen Sonnenstraße 11-80331 München Telefon 089 / 5404133-0 - Fax 089 / 5404133-55 info@haus-und-grund-bayern.de
MehrDas Persönliche Budget in verständlicher Sprache
Das Persönliche Budget in verständlicher Sprache Das Persönliche Budget mehr Selbstbestimmung, mehr Selbstständigkeit, mehr Selbstbewusstsein! Dieser Text soll den behinderten Menschen in Westfalen-Lippe,
Mehr2.5.2 Primärschlüssel
Relationale Datenbanken 0110 01101110 01110 0110 0110 0110 01101 011 01110 0110 010 011011011 0110 01111010 01101 011011 0110 01 01110 011011101 01101 0110 010 010 0110 011011101 0101 0110 010 010 01 01101110
Mehr(C)opyright 2009 by Jochen Vajda
(C)opyright 2009 by Jochen Vajda Inhalt Einführung Darstellung des Verzeichnisbaums Statusleiste Überschreibenvon Dateien Ordnereinstellungen Suche Einleitung Der folgende Artikel vergleicht den Windows
MehrDIE ANWENDUNG VON KENNZAHLEN IN DER PRAXIS: WEBMARK SEILBAHNEN IM EINSATZ
Kurzfassung DIE ANWENDUNG VON KENNZAHLEN IN DER PRAXIS: WEBMARK SEILBAHNEN IM EINSATZ Mag. Klaus Grabler 9. Oktober 2002 OITAF Seminar 2002 Kongresshaus Innsbruck K ennzahlen sind ein wesentliches Instrument
MehrDAS TEAM MANAGEMENT PROFIL IM ÜBERBLICK. Sie arbeiten im Team und wollen besser werden. Das erreichen Sie nur gemeinsam.
Sie arbeiten im Team und wollen besser werden. Das erreichen Sie nur gemeinsam. Das Team Management Profil: Was haben Sie davon? In Unternehmen, die mit dem Team Management Profil arbeiten, entsteht ein
MehrWLAN Konfiguration. Michael Bukreus 2014. Seite 1
WLAN Konfiguration Michael Bukreus 2014 Seite 1 Inhalt Begriffe...3 Was braucht man für PureContest...4 Netzwerkkonfiguration...5 Sicherheit...6 Beispielkonfiguration...7 Screenshots Master Accesspoint...8
MehrPsychologie im Arbeitsschutz
Fachvortrag zur Arbeitsschutztagung 2014 zum Thema: Psychologie im Arbeitsschutz von Dipl. Ing. Mirco Pretzel 23. Januar 2014 Quelle: Dt. Kaltwalzmuseum Hagen-Hohenlimburg 1. Einleitung Was hat mit moderner
MehrKreatives Gestalten mit Flash 5.0
Kreatives Gestalten mit Flash 5.0 Animationen, Effekte und Anwendungen für das WWW Bearbeitet von Isolde Kommer 1. Auflage 2000. Buch. 444 S. Hardcover ISBN 978 3 446 21463 7 Format (B x L): 20,1 x 23,6
MehrBarrierefreie Webseiten erstellen mit TYPO3
Barrierefreie Webseiten erstellen mit TYPO3 Alternativtexte Für jedes Nicht-Text-Element ist ein äquivalenter Text bereitzustellen. Dies gilt insbesondere für Bilder. In der Liste der HTML 4-Attribute
MehrPersönliche Zukunftsplanung mit Menschen, denen nicht zugetraut wird, dass sie für sich selbst sprechen können Von Susanne Göbel und Josef Ströbl
Persönliche Zukunftsplanung mit Menschen, denen nicht zugetraut Von Susanne Göbel und Josef Ströbl Die Ideen der Persönlichen Zukunftsplanung stammen aus Nordamerika. Dort werden Zukunftsplanungen schon
MehrWas meinen die Leute eigentlich mit: Grexit?
Was meinen die Leute eigentlich mit: Grexit? Grexit sind eigentlich 2 Wörter. 1. Griechenland 2. Exit Exit ist ein englisches Wort. Es bedeutet: Ausgang. Aber was haben diese 2 Sachen mit-einander zu tun?
MehrReizdarmsyndrom lindern
MARIA HOLL Reizdarmsyndrom lindern Mit der Maria-Holl-Methode (MHM) Der ganzheitliche Ansatz 18 Wie Sie mit diesem Buch Ihr Ziel erreichen Schritt 1: Formulieren Sie Ihr Ziel Als Erstes notieren Sie Ihr
MehrZeit lässt sich nicht wie Geld für schlechte Zeiten zur Seite legen. Die Zeit vergeht egal, ob genutzt oder ungenutzt.
Zeitmanagement Allgemeine Einleitung Wie oft haben Sie schon gehört Ich habe leider keine Zeit? Und wie oft haben Sie diesen Satz schon selbst gesagt? Wahrscheinlich nahezu jeden Tag. Dabei stimmt der
MehrAdobe Photoshop. Lightroom 5 für Einsteiger Bilder verwalten und entwickeln. Sam Jost
Adobe Photoshop Lightroom 5 für Einsteiger Bilder verwalten und entwickeln Sam Jost Kapitel 2 Der erste Start 2.1 Mitmachen beim Lesen....................... 22 2.2 Für Apple-Anwender.........................
MehrCatherina Lange, Heimbeiräte und Werkstatträte-Tagung, November 2013 1
Catherina Lange, Heimbeiräte und Werkstatträte-Tagung, November 2013 1 Darum geht es heute: Was ist das Persönliche Geld? Was kann man damit alles machen? Wie hoch ist es? Wo kann man das Persönliche Geld
MehrVersetzungsgefahr als ultimative Chance. ein vortrag für versetzungsgefährdete
Versetzungsgefahr als ultimative Chance ein vortrag für versetzungsgefährdete Versetzungsgefährdete haben zum Großteil einige Fallen, die ihnen das normale Lernen schwer machen und mit der Zeit ins Hintertreffen
MehrWir machen uns stark! Parlament der Ausgegrenzten 20.-22.9.2013
Wir machen uns stark! Parlament der Ausgegrenzten 20.-22.9.2013 Die Armutskonferenz Einladung zum Parlament der Ausgegrenzten 20.-22. September 2013 Was ist das Parlament der Ausgegrenzten? Das Parlament
MehrHilfedatei der Oden$-Börse Stand Juni 2014
Hilfedatei der Oden$-Börse Stand Juni 2014 Inhalt 1. Einleitung... 2 2. Die Anmeldung... 2 2.1 Die Erstregistrierung... 3 2.2 Die Mitgliedsnummer anfordern... 4 3. Die Funktionen für Nutzer... 5 3.1 Arbeiten
MehrMaschinenrichtlinie 2006/42/EG 150 Fragen und Antworten zum Selbststudium
QUALITY-APPS Applikationen für das Qualitätsmanagement Maschinenrichtlinie 2006/42/EG 150 Fragen und Antworten zum Selbststudium Autor: Prof. Dr. Jürgen P. Bläsing Die Maschinenrichtlinie 2006/42/EG ist
MehrDie Post hat eine Umfrage gemacht
Die Post hat eine Umfrage gemacht Bei der Umfrage ging es um das Thema: Inklusion Die Post hat Menschen mit Behinderung und Menschen ohne Behinderung gefragt: Wie zufrieden sie in dieser Gesellschaft sind.
MehrWhitepaper. Produkt: combit Relationship Manager 7. combit Relationship Manager email-rückläufer Script. combit GmbH Untere Laube 30 78462 Konstanz
combit GmbH Untere Laube 30 78462 Konstanz Whitepaper Produkt: combit Relationship Manager 7 combit Relationship Manager email-rückläufer Script Inhalt Einleitung 3 Notwendige Anpassungen 3 crm Solution
Mehr