Mathematische Grundlagen der Computerlinguistik I. Mengen und Mengenoperationen (Teil 2)

Mathematische Grundlagen der Computerlinguistik I Mengen und Mengenoperationen (Teil 2) Exzerpt aus dem Skript von Prof. Dr. Klaus U. Schulz Michaela Geierhos M.A. Centrum für Informations- und Sprachverarbeitung Ludwig-Maximilians-Universität München 22.10.2008

Mengen und Mengenoperationen (Teil 2) 29 Gliederung Operationen für Mengenfamilien Partition und Potenzmenge Beweisprinzip der vollständigen Induktion Gesetze für Operationen zwischen Mengenfamilien Multimengen Fundierte und nichtfundierte Mengen

Mengen und Mengenoperationen (Teil 2) 30 Operationen für Mengenfamilien (1) Eine Menge, deren sämtliche Elemente selbst wiederum Mengen sind, werden wir als Mengenfamilie bezeichnen. In diesem Abschnitt gehen wir auf Operationen ein, wo die Eingabe oder das Resultat eine Mengenfamilie darstellt. Häufig treten Mengenfamilien in der Form auf, dass die Elemente in geeigneter Weise mit den Elementen eines Indexbereichs I durchnummeriert sind. Als Indexbereich I werden in der Praxis meist Anfangsabschnitte von IN oder IN selbst, aber auch andere Mengen wie {a, b, c} verwendet. Die Mengenfamilie kann dann in der Form {A i i I} dargestellt werden. Es wird dabei nicht immer vorausgesetzt, dass je zwei Mengen mit unterschiedlichem Index verschieden sind.

Mengen und Mengenoperationen (Teil 2) 31 Operationen für Mengenfamilien (2) Beispiel Es sei A 1 := {4}, A 2 := {2, 5} und A 3 := {8, 9}. Dann ist {{4}, {2, 5}, {8, 9}} eine Mengenfamilie mit den Elementen A 1, A 2 und A 3. Sie kann in der Form {A i i {1, 2, 3}} dargestellt werden. Beispiel Für jedes n IN sei A n := {k IN k < n}. Dann ist {A n n IN} eine Mengenfamilie. Sie enthält alle Anfangsabschnitte, {0}, {0, 1}, {0, 1, 2},... als Elemente. Die ersten der nun zu besprechenden Mengenoperationen verallgemeinern die Vereinigung und Durchschnittsbildung von je zwei Mengen in der Weise, dass nun alle Mengen einer vorgegebenen Mengenfamilie vereinigt beziehungsweise geschnitten werden. Zur Definition dieser Operationen werden die Quantoren,, und,, verwendet. Dementsprechend werden sich nachfolgende Umformungs- und Rechenregeln nicht mehr ausschließlich auf aussagenlogische Tautologien zurückführen lassen.

Mengen und Mengenoperationen (Teil 2) 32 Operationen für Mengenfamilien (3) Definition Sei A eine Mengenfamilie. Die Menge A := {x B A: x B} heißt die Vereinigung von A. Hat A die Form A = {A i i I}, so wird A auch in der Form i I A i notiert. Es sei nun A. Die Menge A := {x B A: x B} heißt der Durchschnitt von A. Hat A die Form A = {A i i I}, so wird A auch in der Form i I A i notiert.

Mengen und Mengenoperationen (Teil 2) 33 Operationen für Mengenfamilien (4) Es enthält also A (resp. A) genau diejenigen Elemente x, die in irgendeinem Element (resp. in allen Elementen) von A als Element auftreten. Wenn wir im nachfolgenden eine Menge der Form A verwenden, so sei stets vorausgesetzt, dass A nichtleer ist. In A liegen im allgemeinen keine Elemente von A, sondern Elemente von Elementen aus A. Entsprechendes gilt für den Durchschnitt. Hier sind einige Beispiele: Sei A = {A 1, A 2 } wo A 1 = {1, 3, 4}, A 2 = {1, 2, 4, 9}. Dann ist A = {1, 2, 3, 4, 9} und A = {1, 4}. Im,,Schachtelbild erhalten wir also die Vereinigung einer Mengenfamilie A dadurch, dass wir die Inhalte aller obersten Schachteln in A in einer gemeinsamen Schachtel zusammenführen. Doppelte Vorkommen werden wie immer eliminiert.

Mengen und Mengenoperationen (Teil 2) 34 Operationen für Mengenfamilien (5) {{{ }}} = {{ }}. {, { }} = { }. Für n IN sei A n = {0, 1, n}. Dann ist n IN A n = IN und n IN A n = {0, 1}. Die Beispiele machen deutlich, dass im Fall einer endlichen Mengenfamilie A = {A 1,..., A n } die Vereinigung A identisch zur Vereinigung der Elemente A 1... A n ist, dasselbe gilt für den Durchschnitt. Wir hätten für diesen Fall keinen neuen Begriff einzuführen brauchen. Die Bedeutung von Definition beruht vor allem darauf, dass diese auch eine Vereinigung beziehungsweise Durchschnittsbildung über unendlich viele Mengen möglich macht und erklärt.

Mengen und Mengenoperationen (Teil 2) 35 Operationen für Mengenfamilien (6) Wir führen nun noch die Begriffe der,,partition und der,,potenzmenge einer gegebenen Menge ein. Partitionierung und Potenzmengenbildung führen ausgehend von einer beliebigen Menge jeweils zu einer eng verwandten Mengenfamilie. Definition Sei M eine Menge. Die Mengenfamilie P heißt eine Partition oder Zerlegung von M genau dann, wenn gilt: 1. jedes Element von P ist eine nicht-leere Teilmenge von M, 2. P = M, 3. je zwei verschiedene Elemente von P sind disjunkt.

Mengen und Mengenoperationen (Teil 2) 36 Operationen für Mengenfamilien (7) Für jede nichtleere Menge M sind beispielweise {M} und {{m} m M} stets Partitionen von M. Beispiel Es ist {{1, 3, 4}, {2, 6}, {5}} eine Partition von {1, 2, 3, 4, 5, 6}. Beispiel Für jedes n IN bezeichne A n die Menge {n, n + 1}. Dann ist Q := {A n n IN} keine Zerlegung von IN. Zwar gelten die Bedingungen 1 und 2 aus Definition, aber Bedingung 3 ist verletzt. Hingegen ist P := {A 2n n IN} eine Zerlegung von IN.

Mengen und Mengenoperationen (Teil 2) 37 Operationen für Mengenfamilien (8) Definition Die Menge P(A) := {M M A} heißt die Potenzmenge von A. In der Potenzmenge einer Menge A liegen also alle Teilmengen von A. Beim letzten Beispiel der nachfolgenden Liste sieht man, dass nicht auszuschließen ist, dass P(A) auch Elemente von A enthält wenn A Elemente enthält, die gleichzeitig Teilmenge sind. P( ) = { }, P({1}) = {, {1}}, P({1, 2}) = {, {1}, {2}, {1, 2}}, P({1, 2, 3}) = {, {1}, {2}, {1, 2}, {3}, {1, 3}, {2, 3}, {1, 2, 3}}, P({ }) = {, { }}.

Mengen und Mengenoperationen (Teil 2) 38 Operationen für Mengenfamilien (9) Für die Potenzmenge einer Menge A wird oft auch das Symbol 2 A verwendet. Lemma Es sei A eine endliche Menge mit n Elementen. Dann hat P(A) genau 2 n Elemente. Beweis Induktionsanfang: n = 0. In diesem Fall gilt A = und es folgt P(A) = { }. Wie behauptet hat also P(A) genau 1 = 2 0 = 2 n Elemente. Induktionshypothese: Die Behauptung sei richtig für jede Menge A mit k Elementen, wo k 0.

Mengen und Mengenoperationen (Teil 2) 39 Operationen für Mengenfamilien (10) Induktionsschritt: Es sei nun A eine Menge mit k + 1 1 Elementen. Zu zeigen ist, dass P(A) genau 2 k+1 Elemente hat. Da k + 1 1 können wir ein Element a aus A herausnehmen, die Menge A 0 := A {a} hat dann k Elemente. Wir zerlegen nun P(A) in die folgenden zwei Teile: P 1 = {M A a M} P 2 = {M A a M}. Offenkundig sind diese beiden Mengen disjunkt und es gilt P(A) = P 1 P 2, daher ist die Anzahl der Elemente von P(A) genau die Summe der Anzahl der Elemente von P 1 respektive P 2. Man sieht leicht, dass P 1 und P 2 dieselbe Anzahl von Elementen haben: in der Tat entspricht jedem Element M von P 1 genau ein Element der Form M {a} von P 2 und umgekehrt. Nun gilt aber P 1 = P(A 0 ), nach Induktionsvoraussetzung hat also P 1 genau 2 k Elemente. Daraus ergibt sich, dass P(A) genau 2 k + 2 k = 2 2 k = 2 k+1 Elemente hat.

Mengen und Mengenoperationen (Teil 2) 40 Vollständige Induktion (1) Das Beweisprinzip der vollständigen Induktion. Es ist sicher angebracht zu erklären, warum die obige Argumentation einen Beweis darstellt. Wenn wir von der konkreten Aussage etwas abstrahieren, dann besagt das Lemma, dass eine bestimmte Eigenschaft ϕ für jede beliebige Zahl n IN gilt. Um dies zu beweisen, reicht es, zwei Aussagen zu verifizieren: 1. Die Eigenschaft ϕ trifft auf die Zahl 0 zu. 2. Falls die Eigenschaft ϕ auf eine beliebige natürliche Zahl k 0 zutrifft, so auch auf k + 1.

Mengen und Mengenoperationen (Teil 2) 41 Vollständige Induktion (2) Warum können wir aus 1 und 2 schließen, dass alle natürlichen Zahlen die Eigenschaft ϕ haben? Wir wissen, dass wir jede natürliche Zahl n ausgehend von der Null durch eine endliche Folge von Nachfolgerschritten 0 1, 1 2,..., n 1 n erreichen können. Indem wir die Regel 2 auf k = 0 anwenden, können wir mit Hilfe der wahren Aussage 1 zunächst schließen, dass die Eigenschaft ϕ auch auf die Zahl 1 zutrifft. Daraus folgt durch eine erneute Anwendung der Schlussregel 2, dass ϕ auch auf die Zahl 2 zutrifft. In dieser Weise fortfahrend erreichen wir schließlich nach endlich vielen Schritten die Zahl n und sehen somit, dass ϕ auch auf die Zahl n zutrifft. Dieses explizite,,hochhangeln zu immer größeren Zahlen k bis hin zu n ist jedoch offenkundig völlig überflüssig, da wir in Form von Aussage 2 ja ein für alle mal eingesehen haben, dass es prinzipiell immer klappt. Daher ist die Eigenschaft ϕ tatsächlich für jedes n IN bewiesen.

Mengen und Mengenoperationen (Teil 2) 42 Vollständige Induktion (3) Beim eigentlichen Beweis der Schlussregel 2 verfahren wir wieder nach bekanntem Rezept. Wir nehmen an, dass die Prämisse gilt, wobei wir dies explizit als Induktionshypothese formulieren, und zeigen im Induktionsschritt, dass unter dieser Voraussetzung auch die Konklusion gilt. Manchmal wird die Idee des Induktionsbeweises auch als,,leiterprinzip veranschaulicht: wenn man die unterste Stufe einer Leiter erreichen kann, und der Sprossenabstand so eingerichtet ist, dass man von einer beliebigen Sprosse stets die nächsthöhere erreichen kann, so ist klar, dass man jede Sprosse erreichen kann. Entscheidend hierbei ist freilich die Voraussetzung, dass man vom Boden jede einzelne Sprosse in endlich vielen Schritten erreichen kann.

Mengen und Mengenoperationen (Teil 2) 43 Gesetze für Operationen zwischen Mengenfamilien (1) Die nachfolgenden mengentheoretischen Identitäten für Operationen zwischen Mengenfamilien sind nur der Vollständigkeit halber angeführt, um sie bei Bedarf nachschlagen zu können. Wie auch bislang setzen wir nachfolgend stets voraus, dass für alle Ausdrücke der Form i I B i stets I nichtleer ist. Lemma Für beliebige Mengen gelten die folgenden Identitäten: 1. A i I B i = i I (A B i), 2. A i I B i = i I (A B i), 3. ( i I A i) ( j J B j) = i I ( j J (A i B j )) = j J ( i I (A i B j )), 4. ( i I A i) ( j J B j) = i I ( j J (A i B j )) = j J ( i I (A i B j )).

Mengen und Mengenoperationen (Teil 2) 44 Gesetze für Operationen zwischen Mengenfamilien (2) Beweis Wir zeigen Teil 1, die weiteren Identitäten folgen ähnlich. x A B i i I x A ( i I: x B i ) i I: (x A x B i ) i I: x A B i x i I(A B i ).

Mengen und Mengenoperationen (Teil 2) 45 Gesetze für Operationen zwischen Mengenfamilien (3) Lemma Für beliebige Mengen gelten die folgenden Identitäten: 1. ( i I A i) ( j J B j) = i I ( j J (A i B j )), 2. ( i I A i) ( j J B j) = i I ( j J (A i B j )) = j J ( i I (A i B j )).

Mengen und Mengenoperationen (Teil 2) 46 Gesetze für Operationen zwischen Mengenfamilien (4) Beweis Wir zeigen Teil 2, Teil 1 folgt ähnlich. Setze A = S i I A i, B = T j J B j. Mit Lemma, Teil 1, folgt A B = ( [ i I A i ) B = [ i I(A i B ) = [ i I ( \ j J(A i B j )). A B = A ( \ j J B j ) = \ j J(A B j ) = \ j J ( [ i I(A i B j )).

Mengen und Mengenoperationen (Teil 2) 47 Gesetze für Operationen zwischen Mengenfamilien (5) Lemma (De Morgansche Regeln, allgemeine Form) Es sei A i B für alle i I. Es bezeichne,, die Komplementbildung in B. Dann gilt ( i I A i ) = i I A i, ( i I A i ) = i I A i.

Mengen und Mengenoperationen (Teil 2) 48 Gesetze für Operationen zwischen Mengenfamilien (6) Beweis Für den Beweis der ersten Identität betrachten wir folgende Äquivalenzen: x ( i I A i ) x B x / i I A i x B ( j I: x / A j ) j I: (x B x / A j ) j I: x A j x A i. i I Der Beweis der zweiten Identität ist ähnlich.

Mengen und Mengenoperationen (Teil 2) 49 Multimengen (1) Während wir bei einer Menge nur danach fragen, ob ein gegebenes Elemente dazugehört oder nicht, sind auch Verallgemeinerungen dieses Konzepts interessant, wo jedes Element endlich oft auftreten kann, und wo wir Mengen nach der Vielfachheit des Auftretens eines gegebenen Elements unterscheiden können. Diese Mengen sind unter dem Begriff Multimengen bekannt. Wir verwenden für die Darstellung von Multimengen die Klammern,,[ und,,]. Beispielsweise ist [a, a, b, e, e, g, m, m, O, r, r, u] die Multimenge der Buchstaben des Wortes,,Oberammergau, und [2, 2, 3, 3, 5, 11] ist die Multimenge der Primfaktoren der Zahl 1980.

Mengen und Mengenoperationen (Teil 2) 50 Multimengen (2) Definition Zwei Multimengen sind gleich genau dann, wenn sie dieselben Elemente in der selben Vielfachheit enthalten. Eine Multimenge A ist Teilmultimenge einer Multimenge B, A m B, wenn jedes Element von A auch in B mit zumindest gleich großer Vielfachheit auftritt. Definition Die Vereinigung zweier Multimengen A und B ist diejenige Multimenge A m B, die genau diejenigen Elemente umfasst, die in A oder B vorkommen, und wo ein Element x mit der Vielfachheit max{n, m} in A m B auftritt, wo n 0 (m 0) die Vielfachheit von x in A (resp. B) angibt. Der Durchschnitt A m B zweier Multimengen lässt sich analog definieren, wenn wir max{n, m} durch min{n, m} ersetzen. Bei der Summe A + B zweier Multimengen ersetzen wir max{n, m} durch n + m. Weiter erhalten wir A \ m B dadurch, dass wir aus A die Elemente von B entsprechend ihrer Vielfachheit in B herausnehmen. Sobald wir hierbei die Vielfachheit 0 erreichen, tritt das Element natürlich in der Differenz nicht mehr auf.

Mengen und Mengenoperationen (Teil 2) 51 Multimengen (3) Es gilt also zum Beispiel [1, 1, 2, 2, 2, 5] m [1, 3, 3, 3, 5, 5] = [1, 1, 2, 2, 2, 3, 3, 3, 5, 5], [1, 1, 2, 2, 2, 5] m [1, 3, 3, 3, 5, 5] = [1, 5], [1, 1, 2, 2, 2, 5] + [1, 3, 3, 3, 5, 5] = [1, 1, 1, 2, 2, 2, 3, 3, 3, 5, 5, 5]. Ist A (B) die Multimenge der Primfaktoren der Zahl m (n), so ergibt A m B (resp. A m B) gerade die Multimenge der Primfaktoren des kleinsten gemeinsamen Vielfachen (des größten gemeinsamen Teilers) von m und n, und A + B ergibt die Multimenge der Primfaktoren von m n.

Mengen und Mengenoperationen (Teil 2) 52 Fundierte und nichtfundierte Mengen (1) Bei einer genaueren Formalisierung des Mengenkonzepts wird in aller Regel das folgende Prinzip der Wohlfundiertheit gefordert: Jede nichtleere Menge M enthält ein Element A, so dass M A = gilt. Falls A M und M A = gilt, so wird A auch ein -minimales Element von M genannt. Das Prinzip der Wohlfundiertheit fordert also, dass jede nichtleere Menge ein -minimales Element enthält. Das Prinzip hat zur Folge, dass es keine unendlich absteigenden Ketten von Mengen gibt, die in einer Elementschaftsbeziehung M i+1 M i M 2 M 1 M 0 stehen. Allerdings wurde in jüngerer Zeit von verschiedener Seite bemerkt, dass es für die Modellierung gewisser Probleme in der Informatik und Linguistik angebrachter ist, auf das oben genannte Prinzip zu verzichten und auch nichtfundierte Mengen zuzulassen.

Mengen und Mengenoperationen (Teil 2) 53 Fundierte und nichtfundierte Mengen (2) Nichtfundierte Menge können hilfreich sein für die Formalisierung zyklischer Datenstrukturen, oder auch in der Linguistik, etwa für die logische Modellierung von Situationen, bei denen Phänomene der Selbstreflexion relevant sind. Die im nachfolgenden zu besprechenden Eigenschaften von Mengen und den daraus abgeleiteten Konzepten bleiben von der Frage der Fundiertheit der Mengen allerdings unbetroffen, wir werden darum nicht näher auf nichtfundierte Mengen eingehen.