Entwicklung einer Methode zum Lösen und Bewerten von Sudoku-Rätseln und Implementation derselben als Java-Applet. Diplomarbeit

Entwicklung einer Methode zum Lösen und Bewerten von Sudoku-Rätseln und Implementation derselben als Java-Applet Diplomarbeit Fachhochschule Merseburg Fachbereich Informatik und Angewandte Naturwissenschaften Studiengang: Informatik eingereicht von Henrik Schleider Erstprüfer: Prof. Dr. rer. nat. Axel Kilian Zweitprüfer: Prof. Dr. habil. Michael Schenke Merseburg, den 31. 3. 2006

Abstract Sudoku das beliebte Zahlenrätsel fasziniert immer mehr Menschen. Es eignet sich aufgrund seines strukturierten Aufbaus und seiner logischen Lösungsmethoden hervorragend für Untersuchung mittels Computer. In der vorliegenden Arbeit wurden verschiedene von Menschen verwendete Techniken zum Lösen von Sudokus analysiert und verglichen. Diese Techniken sind in Gruppen zusammengefasst und verallgemeinert worden um Lösungsalgorithmen für Computer daraus zu erstellen. Mit Hilfe dieser Algorithmen und einem zusätzlich entwickelten Backtracking-Verfahren ist die (rechnergestützte) Auffindung sämtlicher Lösungen eines jeden Sudokus möglich. Ein weiterer Schwerpunkt der Arbeit ist die Bewertung des Schwierigkeitsgrades eines Sudokus. Hierzu wird eine Bewertungsfunktion vorgestellt, die Sudokus in mehr als die sonst üblichen drei bis vier Schwierigkeitsstufen einteilt. Die Funktion klassifiziert die Rätsel anhand von Ergebnissen, die aus einer Umfrage gewonnen wurden und orientiert sich somit an menschlichen Sudoku-Spielern.

Inhaltsverzeichnis Inhaltsverzeichnis 1 Einleitung... 1 2 Einführung in Sudoku... 4 2.1 Die Geschichte... 4 2.2 Das Spiel... 5 2.3 Die Begriffe... 6 3 Strategien... 8 3.1 Lösungstechniken für Sudoku-Spieler... 9 3.2 Umsetzung der Lösungstechniken für Computer... 20 3.3 Der Schwierigkeitsgrad... 34 3.4 Mehrfachlösungen... 35 4 Das Programm... 38 4.1 Die Hauptklasssen... 38 4.1.1 Die Appletklasse... 38 4.1.2 Die Sudokuklasse... 40 4.1.3 Die Lösungsklasse... 40 4.2 Spezielle Klassen... 42 4.2.1 Die Algorithmusklassen... 42 4.2.2 Das Backtracking... 45 4.2.3 Die Spielfeldklassen... 49 4.2.4 Die Logklasse... 49 4.2.5 Hilfsklassen... 50 5 Die Benutzeroberfläche... 52 5.1 Der Aufbau... 52 5.2 Das Spielfeld... 55

Inhaltsverzeichnis 5.3 Die Schaltflächen... 56 5.4 Der Standardablauf... 57 6 Bestimmung des Schwierigkeitsgrades... 59 6.1 Die Umfrage... 61 6.1.1 Die Erstellung... 62 6.1.2 Das Ergebnis... 66 6.1.3 Die Auswertung... 69 6.2 Die Bewertungsfunktion... 72 7 Zusammenfassung... 75 Quellenverzeichnis... 78 Anhang A: Anhang B: Kurzanleitung des Sudoku-Applets Umfrage

Einleitung 1 Einleitung Sudoku ein aktuelles Zahlenrätsel hat inzwischen viele Menschen auf der ganzen Welt in seinen Bann gezogen. Die Popularität dieses Rätsels steigt von Tag zu Tag. In fast jeder Zeitung findet man dieses Zahlenrätsel, im Internet gibt es unzählige Seiten, auf denen Sudokus zum Ausdrucken oder online Spielen angeboten werden, und es ist natürlich als Handyspiel erschienen. Vielleicht ist das schlichte Spielprinzip der Grund für die hohe Beliebtheit: es gibt nur eine Vorschrift und obwohl Zahlen eingetragen werden müssen, sind keine Rechnungen vonnöten. Durch reines logisches Überlegen ist ein Sudoku zu lösen. Auf Grund der trivialen Möglichkeit zur Abstraktion und der einfachen bis hin zu komplexen logischen Lösungstechniken bietet sich Sudoku geradezu für eine programmtechnische Untersuchung und Umsetzung an. Ein Schwerpunkt wurde dabei in der vorliegenden Diplomarbeit auf den Vergleich der Lösungsstrategien von Mensch und Maschine gelegt. Des weiteren wurde das Problem der Bewertung des Schwierigkeitsgrades von Sudokus untersucht. Das im Rahmen dieser Diplomarbeit entstandene Programm bietet neben der Lösung von Sudokus die Möglichkeit, dass ein Anwender selbst Rätsel lösen kann. Dabei wurde Wert auf Benutzerfreundlichkeit und Unterstützung des Spielers gelegt. In Kapitel 2 wird eine kurze Einführung in die Geschichte und den prinzipiellen Aufbau eines Sudoku-Zahlenrätsels gegeben. Außerdem werden hier die Begriffe eingeführt und erläutert, die im weiteren Verlauf der Arbeit verwendet werden. - 1 -

Einleitung Versierte Spieler verwenden unterschiedliche Techniken um ein Sudoku zu lösen. Die wichtigsten davon werden in Kapitel 3 vorgestellt. Zu Beginn wird ein Überblick über mögliche Lösungsansätze für Sudoku-Spieler gegeben. Danach werden diese Ansätze zusammengefasst und für den Einsatz auf Computern optimiert. Für Sudoku Zahlenrätsel wird üblicherweise ein Schwierigkeitsgrad angegeben, der dem Spieler bei der Einschätzung eines ungelösten Rätsels helfen soll. Das Problem der Bewertung der Schwierigkeit von Sudoku- Rätseln wird in Kapitel 3 ebenfalls erörtert. Im letzten Teil wird auf die Anzahl der möglichen Lösungen eines Sudokus eingegangen. Für die Lösung und Bewertung von Sudokus wurde ein Programm in Form eines Java-Applets erstellt. Auf Grund der Objektorientierung ist die Programmiersprache Java als Basis für die Erstellung der Anwendung sehr geeignet. In Kapitel 4 wird näher auf die Implementierung des Programms sowie die verwendeten Klassen eingegangen. Weiterhin wird ein Backtracking-Algorithmus vorgestellt. Letzterer wird für die Lösung benutzt, wenn keine andere Regel mehr anwendbar ist. Für die Interaktion zwischen Spieler und Programm wurde eine grafische Oberfläche entwickelt, welche die Hauptfunktionen des Programms verfügbar macht. Die für die Umsetzung gewählte Programmiersprache Java ist plattformunabhängig. Diese Wahl wurde getroffen, um einen möglichst großen Nutzerkreis zu erreichen. Kapitel 5 erläutert die grafische Oberfläche des Programms und gibt Hinweise zur Bedienung. Die Bewertung der Schwierigkeit eines Sudokus hängt sehr stark von der subjektiven Empfindung und der Erfahrung des Spielers ab. Um die vorgestellten und im Programm verwendeten Lösungsstrategien bewerten zu - 2 -

Einleitung können, wurde eine Umfrage unter Nutzern von Sudokus im Internet durchgeführt. Anhand der Ergebnisse konnte eine Bewertung der verwendeten Lösungsalgorithmen in Bezug auf Schwierigkeit und Priorität erstellt werden. Die Einschätzung des Schwierigkeitsgrades eines Sudokus erfolgte nun anhand der für die Lösung verwendeten Strategien. Die erzielten Ergebnisse werden in Kapitel 7 abschließend zusammengefasst und bewertet. Darüber hinaus wird ein Ausblick auf mögliche Erweiterungen gegeben. - 3 -

Einführung in Sudoku 2 Einführung in Sudoku 2.1 Die Geschichte Sudoku hat als Grundlage vermutlich das carré latin (Lateinisches Quadrat). Dies ist durch den Schweizer Mathematiker Leonhard Euler (1707-1783) bekannt geworden. Das Lateinische Quadrat ist ein n x n Feld, in dem n verschiedene Symbole so eingetragen werden, dass in jeder Spalte und jeder Zeile jedes Symbol nur einmal vorkommt. a b c d b d a c d c b a c a d b Abbildung 1: Lateinisches Quadrat Das heutige Sudoku in Blockform wurde 1979 in der Zeitschrift Math Puzzels & Logic Problems in den USA erstmals publiziert. Seinen Durchbruch erlangte das Sudoku jedoch erst um etwa 1984, als die japanische Zeitschrift Nikoli diese zunächst unter dem Namen Sūji wa dokushin ni kagiru regelmäßig abdruckte. Hieraus entwickelte sich schließlich der Begriff Sudoku. Der Neuseeländer Wayne Gould hat Sudoku auf einer Japanreise kennen gelernt. Sechs Jahre brauchte er, um eine Software zu entwickeln, die neue Sudokus per Knopfdruck entwickeln kann. Anschließend bot er seine Rätsel der Times in London an. Die Tageszeitung druckte die ersten Sudoku-Rätsel und trat auf diese Weise eine Sudoku-Lawine in der westlichen Welt los. [WI05] Auch in Deutschland ist seit Ende des Jahres 2005 kaum eine Rätsel- oder Tageszeitung mehr ohne mindestens ein Sudoku zu finden. Es wurden - 4 -

Einführung in Sudoku inzwischen ganze Bücher veröffentlicht, die nur diese Zahlenrätsel enthalten. Selbst als Brettspiel kann man es mittlerweile kaufen. Ein Paradies für Sudoku-Spieler ist auch das Internet. Dort kann man Unmengen von diesen Rätsel finden, zum online Spielen (siehe [SS06], [WS06]) oder Ausdrucken (siehe [SA06], [DS06]). Es existieren viele Internetseiten, die sich nur mit dem Thema Sudoku beschäftigen. Auf diesen Seiten werden Regeln zum Lösen erklärt und diskutiert (siehe [PS06], [SF06]). Weiterhin werden auch eine Vielzahl von Programmen angeboten (siehe [JO05], [SM06]). Diese Programme sollen Sudokus erstellen oder lösen können, manche helfen auch nur beim Lösen. 2.2 Das Spiel 1 7 8 7 6 7 4 2 9 8 2 4 9 5 5 8 8 1 4 2 2 5 7 4 9 6 7 5 2 1 Abbildung 2: ein ungelöstes Sudoku Das Spielfeld eines Sudokus ist ein Quadrat mit 9 9 Feldern. Es wird zusätzlich noch in neun 3 3 Unterquadrate eingeteilt, deren Ränder für eine bessere Übersicht hervorgehoben sind. In das Spielfeld sind bereits mehrere Zahlen eingetragen. Diese werden Vorgaben genannt und haben jeweils einen Wert zwischen 1 und 9. Die Anzahl der Vorgaben liegt üblicherweise zwischen 22 und 36. - 5 -

Einführung in Sudoku Es kann auch mehr oder weniger Vorgaben geben, allerdings wird dadurch das Spiel sehr vereinfacht oder erschwert. Die Aufgabe des Spielers besteht nun darin, alle leeren Felder mit Zahlen von 1 bis 9 aufzufüllen, so dass in jeder Zeile, Spalte und jedem Unterquadrat jede Zahl genau einmal vorkommt. Ein gültiges Sudoku hat nur eine eindeutige Lösung. Es gibt inzwischen auch viele Sonderformen des Spiels (siehe [SD06]). Eine einfachere 9 3 1 7 8 6 5 2 4 8 4 2 3 5 1 9 7 6 Version für Kinder besteht aus 7 6 5 4 2 9 3 8 1 einem 4 4 Quadrat und 2 1 4 8 9 7 6 5 3 anstelle der Zahlen werden 5 9 6 2 4 3 7 1 8 Bilder verwendet. Weitaus 3 8 7 6 1 5 4 9 2 komplexer sind Spielfelder mit einer Kantenlänge von 16 oder gar 25, bei denen dann die Zahlen 1 bis 16 oder 1 bis 25 1 6 4 2 7 5 3 9 8 5 1 9 7 3 6 4 8 2 8 2 1 6 4 3 9 5 7 eingetragen werden müssen. Abbildung 3: ein gelöstes Sudoku Weiterhin gibt es auch Sudokus, bei denen nicht mehr das Quadrat die Grundform bildet. Der Menge der Variationen sind so gut wie keine Grenzen gesetzt es werden täglich mehr. - 6 -

Einführung in Sudoku 2.3 Die Begriffe Das Rätsel Sudoku ist international sehr beliebt und es haben sich einige spezielle Begriffe herausgebildet, die häufig in englischer Sprache sind meist weil es keine adäquate Übersetzung ins Deutsche gibt. Hier werden nun einige Grundbegriffe eingeführt, die in den folgenden Kapitel häufig benutzt werden. Das komplette Sudoku-Quadrat wird Gitter (grid) oder Spielfeld genannt, es besteht aus 9 Zeilen (rows), 9 Spalten (columns), 9 Blöcken (blocks) beziehungsweise 81 Feldern (cells). Ein Block ist eines der 9 Unterquadrate mit der Größe 3 3. Eine Zeile, eine Spalte oder ein Block wird als Einheit (unit) bezeichnet, ein Sudoku-Gitter besteht also aus 27 Einheiten. Ein Kandidat ist in eine in einem Feld noch mögliche Zahl, alle möglichen Kandidaten in einem Feld werden in einer Kandidatenliste zusammengefasst. Die One-Rule ist die Hauptregel von Sudoku. Sie besagt, dass in jeder Einheit, also in jeder Zeile, in jeder Spalte und in jedem Block die Zahlen von 1 bis 9 nur genau einmal vorkommen dürfen und müssen. Vorgaben sind die zu Beginn in das Sudoku schon eingetragenen Zahlen. Ein Kandidat heißt naked single, wenn nur er in einem Feld noch möglich ist. Naked könnte man in diesem Fall am besten mit blank oder sichtbar übersetzen. Der Kandidat heißt hidden single, wenn er in der Einheit nur an einer Stelle vorkommen kann. Hier passt die Übersetzung versteckt, da in dem Feld, wo dieser Kandidat vorkommt, noch andere Kandidaten stehen können. Weitere Beschreibungen dazu folgen im nächsten Kapitel. Die Bezeichnungen n-clique, Locked Candidates und n-fish stehen für Techniken zum Lösen von Sudokus und werden ebenfalls im kommenden Kapitel näher erläutert. - 7 -

Strategien 3 Strategien Die Lösung eines Sudokus ist eine Aufgabe, die ohne den Einsatz verschiedener Lösungsstrategien kaum zu bewältigen ist. Dabei gibt es für Menschen und Computer unterschiedliche Herangehensweisen. Ein Mensch, der ein Sudoku lösen will, geht primär visuell an das Problem heran. Er erkennt zum Beispiel mit einem Blick, ob eine bestimmte Zahl in einem Block vorhanden ist oder fehlt. Zu Beginn wird er nur die One-Rule benutzen, die besagt, dass in jeder Zeile, jeder Spalte und jedem Block die Zahlen von 1 bis 9 nur jeweils einmal vorkommen dürfen. Die einfachste und direkteste Anwendung der One-Rule ist das Eintragen der fehlenden Zahl in Einheiten (Zeile, Spalte oder Block), in denen schon acht Zahlen vorgegeben sind. Damit kommt der Sudoku-Spieler aber nicht sehr weit und er wird beginnen Strategien zu entwickeln, wie er weitere Zahlen finden kann. Einige dieser Techniken werden im ersten Teil des Kapitels vorgestellt. Der Computer hat aufgrund seiner Geschwindigkeit einen Vorteil gegenüber dem Menschen. Er kann viel schneller überprüfen, welche Zahlen noch fehlen. Aber auch er braucht Algorithmen, nach denen er vorgehen kann. Aufgrund seiner enormen Rechenleistung könnte er die Lösung durch reines Ausprobieren finden. Die Dauer dafür würde bei der aktuellen Ausstattung der Rechner und einem geeigneten Algorithmus nur Minuten oder Sekunden betragen, während Menschen dafür Stunden bis Tage benötigen würden. Jedoch kann der Computer auch die Techniken, die der Mensch verwendet, nutzen. Dadurch wird seine Lösungsgeschwindigkeit noch erhöht, da er nicht mehr alle Möglichkeiten durchtesten muss, sondern einige davon frühzeitig - 8 -

Strategien ausschließen kann. Die Anwendung dieser Techniken wird im zweiten Teil des Kapitels beschrieben. Zu den meisten Sudokus wird ein Schwierigkeitsgrad angegeben. Dieser variiert zwischen leicht (easy), mittel (medium) und schwer (hard), man findet auch Rätsel, die als sehr schwer eingestuft sind, im Englischen werden diese zum Beispiel als evil (bösartig) oder atrocious (grauenhaft) bezeichnet. Darüber, wie die Anbieter dieser Sudokus ihre Kategorisierung vornehmen, ist jedoch meistenteils nichts zu erfahren. Zudem stellen Sudoku-Spieler auch häufig fest, dass ein schweres Rätsel ihnen sehr leicht lösbar erscheint, während sie im Gegenzug für ein leichtes sehr viel Zeit und komplexe Regeln benötigen. Mit dem Schwierigkeitsgrad von Sudokus beschäftigt sich der dritte Teil des Kapitels. Eine Eigenschaft des Sudokus ist die eindeutige Lösung. Um das zu überprüfen muss das Rätsel jedoch erst einmal gelöst werden. Diesen Aufwand betreiben nicht alle Anbieter, so kann es passieren, dass man auf ein Sudoku mit mehreren verschiedenen Lösungen trifft. Im letzten Teil des Kapitels wird das Problem Mehrfachlösungen besprochen. 3.1 Lösungstechniken für Sudoku-Spieler Die wohl simpelste Methode ist, eine Zeile, eine Spalte oder einen Block zu suchen, wo nur noch eine Zahl fehlt, also schon acht vorgegeben sind. An dieser Stelle wird dann die noch fehlende Zahl eingetragen, diese nennt man auch naked single. Im Block im Beispiel 1 fehlt in der Mitte noch die 5. Diese Methode kann man dann auch mit sich selbst kombinieren, indem man - 9 -

Strategien mehrere Einheiten betrachtet. Dazu sucht man sich wieder ein freies Feld und vergleicht die jeweilige Zeile mit der dazugehörigen Spalte und überprüft, ob nur noch eine Zahl in diesem Feld möglich ist. Man kann nun die Zeile mit dem Block vergleichen, die Spalte mit dem Block oder alle drei Einheiten zusammen. Je mehr Einheiten man miteinander vergleichen muss, desto komplexer wird diese Strategie. 1 2 3 4 6 7 8 9 Beispiel 1: naked single Sehr häufig wird die folgende Technik benutzt, da sie relativ einfach anzuwenden ist. Man sucht sich in einem Block eine Zahl aus, die nicht vorgegeben ist und betrachtet die den Block schneidenden 3 Zeilen und 3 Spalten. In den Zeilen und Spalten, in denen die gesuchte Zahl schon eingetragen ist, kann sie im Bereich des betrachteten Blockes nicht mehr vorkommen. Im Idealfall bleibt nur noch eine Möglichkeit offen, so dass man die Zahl eintragen kann. Die mit dieser Lösungsstrategie gefundenen Zahlen werden auch als hidden single bezeichnet. Im Beispiel 2 kann man mit dieser Taktik Positionen finden, an denen eine 8 eingetragen werden muss. Betrachtet man den Block links oben, so stellt man fest, dass in den Zeilen 1 und 2 sowie in Spalte 2 jeweils schon eine 8 steht und somit die fehlende 8 im Block links oben nur im rechten unteren Feld möglich ist. Im Block im Zentrum des Sudokus muss die 8 im rechten - 10 -

Strategien 1 2 3 4 5 6 7 8 9 oberen Feld stehen, da sich in Spalte 4, Spalte 5 und Zeile 5 schon Zahlen mit dem Wert 8 1 3 8 7 9 befinden. 2 7 9 5 8 3 9 8 3 2 7 Als nächstes kommt meist die 4 9 8 4 Taktik der festgesetzten 5 6 9 4 8 1 Kandidaten ( locked candidate ) 6 1 3 9 zur Anwendung. Dabei betrachtet 7 1 6 8 9 2 man die Schnittpunkte von Blöcken 8 8 3 6 9 5 9 7 2 9 8 mit Zeilen oder Spalten. Wenn in einem Block eine bestimmte Zahl Beispiel 2: locked candidate nur noch in einer Zeile oder einer Spalte möglich ist, so sind das Locked Candidates für diese Zeile oder Spalte diese Zahl muss in einem Feld dieses Schnittpunktes stehen und kann somit in der betreffenden Zeile oder Spalte nicht mehr vorkommen. Ebenfalls ein Locked Candidate liegt vor, wenn in einer Zeile oder einer Spalte eine Zahl nur noch in einem Block vorkommen kann. Dann besteht für diese Zahl in dem betreffenden Block in keiner anderen Zeile oder Spalte mehr eine Möglichkeit. Im Beispiel 2 sind die beiden Neunen im rechten unteren Block Locked Candidates. Da sie in diesem Block nur in der linken Spalte vorkommen, kann man sagen, dass die 9 in der 7. Spalte im untersten Block stehen muss und nicht im mittleren oder oberen. Durch Kombination mit der hidden single -Regel kann man nun im rechten mittleren Block die 9 rechts unten eintragen. - 11 -

Strategien Mit diesen ersten 3 Lösungsmethoden kann man schon fast alle der als leicht eingestuften Sudokus lösen, auch einige der mittelschweren sind damit lösbar. Durch geeignete Kombination der Methoden sollte man sogar den Großteil der mittleren sowie einige schwere Rätsel fertigstellen können. Um weitere Techniken nutzen zu können, werden so genannte Kandidatenlisten aufgestellt. Diese kann man im Kopf erstellen, jedoch ist es einfacher sie in das Rätselfeld zu schreiben. Man trägt in die leeren Felder alle noch möglichen Zahlen ein alle Zahlen, die in der Zeile, Spalte oder dem jeweiligen Block nicht vorkommen. Eine Kandidatenliste ist die Menge der noch vorhandenen Möglichkeiten für ein Feld, nachfolgend in geschweiften Klammern dargestellt (zum Beispiel ist {1, 2, 3} eine Kandidatenliste, die besagt, dass in einem Feld nur noch die Zahlen 1, 2 und 3 möglich sind). Das Erstellen solcher Listen gilt gleichzeitig als Überprüfung, ob man die erste und zweite Technik richtig angewendet hat. Wenn in einem Feld nur noch eine Zahl möglich, also nur ein Kandidat eingetragen ist, dann entspricht dies dem Ergebnis der ersten Technik. Daher kommt auch die Bezeichnung naked (blank, bloß, offen) es ist eindeutig sichtbar, dass es nur noch eine Möglichkeit gibt. Wenn in einer Zeile, einer Spalte oder einem Block eine Zahl nur in einer einzigen Kandidatenliste auftaucht, so kann man sie an dieser Stelle eintragen. Das entspricht Technik Zwei hidden bedeutet in diesem Fall, dass die Lösung für das entsprechende Feld in einer Kandidatenliste versteckt ist. - 12 -

Strategien 3 6 7 8 2 7 1 2 7 4 2 7 9 5 1 2 5 8 Beispiel 3: sichtbare 2- Clique Eine Erweiterung der ersten Technik, bei der nach naked singles gesucht wird, findet Anwendung, wenn es genau 2 Kandidatenlisten in einer Einheit (Zeile, Spalte oder Block) gibt, die aus den gleichen Zahlen ( naked pairs, sichtbare Paare) bestehen. Dann muss in dem einen Feld die eine und in dem anderen Feld die andere Zahl stehen. Somit kann man diese Werte aus allen anderen Kandidatenlisten in dieser Einheit streichen. Diese Technik kann man auch für größere Gruppen von Kandidatenlisten in einer Einheit verwenden. Man sucht dann nach naked triplets (sichtbare 3er-Gruppen), naked quad (sichtbare 4er-Gruppen) und so weiter. Für eine sichtbare 3er-Gruppe braucht man 3 Kandidatenlisten, die jeweils aus den 3 gleichen Zahlen bestehen. Eine solche Gruppe besagt, dass in den dazugehörigen 3 Feldern diese 3 Zahlen stehen müssen, sie können somit in der betrachteten Einheit an keiner anderen Stelle vorkommen. Diese 3 Zahlen können nun aus allen anderen Kandidatenlisten der Einheit gestrichen werden. Sichtbare 4er-Gruppen bestehen aus 4 Kandidatenlisten mit jeweils 4 gleichen Zahlen. Befinden sich in 5 Listen nur die gleichen 5 Zahlen, so hat man eine sichtbare 5er Gruppe gefunden und man kann diese 5 Zahlen aus den restlichen Kandidatenlisten der Einheit entfernen. Es sind auch Gruppen von 6, 7, 8 oder 9 Zahlen möglich, die jedoch praktisch keine - 13 -

Strategien große Bedeutung haben, da sie sehr schwer zu erkennen sind oder keinen Effekt (es können keine Kandidaten gestrichen werden) zur Folge haben. 5 2 3 8 1 6 7 8 1 2 3 7 3 8 2 3 8 4 9 2 3 6 7 Beispiel 4: sichtbare 3- Clique Eine sichtbare Gruppe der Anzahl n wird von jetzt an als sichtbare n-clique bezeichnet. Ein naked single ist also eine sichtbare 1-Clique, ein naked pair wird sichtbare 2-Clique genannt und so weiter. In einer sichtbaren n-clique müssen nicht zwingend alle Kandidatenlisten aus n Zahlen bestehen. So müssen bei einer 3-Clique nicht in allen drei Listen alle drei Zahlen vorkommen. Nicht nur {{a, b, c}, {a, b, c}, {a, b, c}}, sondern auch {{a, b}, {a, b, c}, {a, b, c}} {{a, b, c}, {b, c}, {a, c}} und sogar {{a, b}, {b, c}, {a, c}} sind sichtbare 3-Cliquen für die Zahlen a, b und c. 2 3 5 6 9 1 5 6 9 7 4 1 5 6 9 2 3 6 7 9 8 1 5 6 1 5 9 Beispiel 5: versteckte 2- Clique Auch die 2. Technik kann mit Hilfe der Kandidatenlisten erweitert werden. Dabei wird nach hidden pairs, hidden triplets, hidden quads, also nach - 14 -

Strategien versteckten Gruppen von Zahlen in einer Einheit gesucht. Für ein verstecktes Paar sucht man 2 Kandidatenlisten, in denen jeweils 2 Zahlen vorkommen, die in den anderen Kandidatenlisten dieser Einheit nicht vorhanden sind. Falls es ein solches Paar gibt, dann muss die eine Zahl in dem einen Feld und die andere in dem anderen Feld stehen. Somit kann man aus den Kandidatenlisten in diesen beiden Feldern alle anderen Kandidaten streichen. 1 2 4 6 9 5 3 6 8 9 3 6 9 3 8 9 1 2 4 6 7 3 6 8 9 1 4 8 9 Beispiel 6: versteckte 3- Clique Für eine versteckte 3er-Clique dürfen 3 Zahlen nur in 3 Listen vorkommen, beispielsweise kommen bei {{1, 2, 3, 4, 5}, {1, 2, 5, 6}, {1, 2, 3, 5, 7}, {4, 5, 7}, {4, 5, 6}, {5, 6}, {5, 6, 7}} die Zahlen 1, 2 und 3 nur in den ersten drei Kandidatenlisten vor (wobei in der 2. Liste keine 3 enthalten ist), somit können in diesen Listen die anderen Kandidaten gestrichen werden 1. Auch diese Technik lässt sich auf vier und mehr Zahlen erweitern, allerdings sind diese versteckten Cliquen sehr schwer zu entdecken. Bei den versteckten n-cliquen gilt ebenfalls, dass nicht in jeder Kandidatenliste der Clique alle n Zahlen vorkommen müssen. 1 Bemerkung: Die letzten vier Kandidatenlisten entsprechen einer sichtbaren 4-Clique für die Zahlen 4, 5, 6 und 7 und somit können diese Werte aus den ersten drei Listen gestrichen werden. Die Ergebnisse sind identisch. - 15 -

Strategien Die Regel Locked Candidate ist mit eingetragenen Kandidatenlisten einfacher anzuwenden. Dazu betrachtet man wieder die Schnittpunkte von Blöcken mit Zeilen oder Spalten. Hat man eine Zahl gefunden, die in Bezug auf die Zeile oder Spalte nur in den drei Feldern des Schnittpunktes mit dem Block vorkommt, so hat man Locked Candidates und man kann aus allen anderen Kandidatenlisten in diesem Block diese Zahl streichen. Auch wenn eine Zahl in einem Block nur in einer Zeile oder Spalte auftaucht, spricht man von Locked Candidates und kann in der betreffenden Zeile oder Spalte alle anderen Vorkommen dieser Zahl entfernen. Eine anspruchsvollere Technik, auch als x-wing bekannt, bezieht sich auf Pärchen von 1 2 3 4 5 6 7 8 9 gleichen Kandidaten in Zeilen und Spalten. Wenn es eine 1 2 9 9 9 9 9 9 9 Zeile gibt, in der eine Zahl nur an zwei Stellen stehen kann und in einer weiteren Zeile die gleiche Zahl nur an den 3 4 5 6 9 9 9 gleichen beiden Stellen möglich 7 9 9 ist, so kann man in diesen zwei 8 9 9 Spalten diese Zahl aus allen anderen Feldern streichen. Der Grund hierfür ist folgender: 9 9 9 Beispiel 7: x-wing 9 9 Wenn man in der ersten Zeile die Zahl an die erste mögliche Position setzt, kann sie nicht an der zweiten Position stehen und man kann sie außerdem aus allen weiteren Kandidatenlisten in der Spalte, die zur ersten Position - 16 -

Strategien gehört, streichen. Daraufhin kann in der zweiten Zeile die Zahl nur an Position zwei stehen und in der dazugehörigen Spalte kann die Zahl wiederum aus allen Kandidatenlisten entfernt werden. Analog geht man vor, wenn man in der zweiten Zeile die Zahl an Position eins setzt. Diese Strategie kann man auch für Spalten einsetzen, dann sucht man nach zwei Spalten, in denen die gleiche Zahl nur in jeweils zwei gleichen Positionen vorkommen kann und streicht sie aus den Kandidatenlisten in den dazugehörigen zwei Zeilen. Im Beispiel 7 sind nur die Felder ausgefüllt, in denen noch eine 9 möglich ist, also mindestens eine 9 in der Kandidatenliste vorkommt. In Zeile 2 und 8 gibt es jeweils nur zwei Möglichkeiten für die 9 in den gleichen Spalten. Wenn nun in Zeile 2 die 9 in der Spalte 3 steht, so muss in Zeile 8 die 9 in Spalte 7, wenn jedoch die 9 in Zeile 2, Spalte 7 steht so muss in der 8. Zeile die 9 in Spalte 3. In beiden Fällen ist die 9 für Spalte 3 und 7 festgelegt, die anderen Möglichkeiten können also gestrichen werden. Noch schwieriger ist die erweiterte x-wing -Technik, swordfish genannt. In diesem Fall sucht man nach drei Zeilen (Spalten), bei denen ein Kandidat nur an 3 gleichen Stellen vorkommen kann und streicht sie dann aus den restlichen Kandidatenlisten in den jeweiligen Spalten (Zeilen). Im Beispiel 8 sind wieder nur die Felder gefüllt, in denen noch eine 7 in der Kandidatenliste steht. In Zeile 1, 5 und 7 kann die 7 jeweils nur in einer der Spalten 2, 4 oder 6 stehen. Somit können in diesen Spalten die restlichen Möglichkeiten für die 7 gestrichen werden. Auch in den Spalten 3, 5 und 8 findet man einen swordfish - dort kann die 7 jeweils nur in Zeile 2, 3 und 4 stehen. Aus diesen Zeilen kann man ebenfalls die restlichen Möglichkeiten für die 7 streichen. - 17 -

Strategien Auch die swordfish -Technik kann man noch erweitern, sie wird dann jellyfish genannt und funktioniert 1 2 3 4 5 6 7 8 9 genauso, nur dass man in diesem 1 7 7 7 Fall vier gleiche Kandidaten an vier 2 7 7 7 7 gleichen Stellen sucht. 3 7 7 7 7 7 4 7 7 7 7 5 7 7 7 Die Techniken x-wing, swordfish 6 und jellyfish werden zu n-fish 7 7 7 zusammengefasst, wobei n für die 8 Anzahl der gleichen Zahlen und Stellen steht. Einen 1-Fish findet man in Beispiel 8. Wenn man 9 7 7 7 7 Beispiel 8: swordfish sämtliche nicht mehr möglichen Kandidaten entfernt hat, fällt die allein stehende 7 in Zeile 9, Spalte 1 auf. Das ist ein Kandidat, der in einer Zeile nur einmal in einer Spalte auftaucht, es ist ein 1-Fish. Ein n-fish mit n > 4 ist nicht sinnvoll, da die Summe aller n-fish-kombinationen für eine Zahl 9 ergibt, somit hat man mindestens einen 4-Fish übersehen, wenn man einen 5-Fish gefunden hat. Um das zu zeigen, wurde Beispiel 9 konstruiert. Erst wurde das komplette Spielfeld mit dem Kandidaten 2 gefüllt. Dann wurden in Spalte 1, 3, 5, 7 und 8 einige Kandidaten entfernt, so dass ein 5-Fish entsteht. Dafür dürfen nur in 5 Zeilen noch Kandidaten stehen, in diesem Fall in Zeile 3, 4, 6, 8 und 9, alle anderen wurden gelöscht. Der 5-Fish wurde schwarz markiert. Da man in 4 Zeilen jeweils 5 Kandidaten entfernt hat (einen pro Spalte), verbleiben noch 4 Kandidaten in den gleichen 4 Spalten das ist ein 4-Fish. Man kann dann die gleichen Kandidaten streichen, dabei macht es keinen Unterschied, ob - 18 -

Strategien man den 4-Fish oder den 5-Fish als Grundlage nimmt. 1 2 3 4 5 6 7 8 9 1 2 2 2 2 Wenn keine der Techniken mehr 2 2 2 2 2 erfolgreich angewendet werden 3 2 2 2 2 2 2 2 2 2 kann, so muss man probieren. Um 4 2 2 2 2 2 2 2 2 2 dieses Probieren möglichst effizient 5 2 2 2 2 zu gestalten, sollte man 6 2 2 2 2 2 2 2 2 2 systematisch vorgehen. Dieses 7 2 2 2 2 Testen wird auch trial & error 8 2 2 2 2 2 2 2 2 2 (Versuch & Irrtum) genannt oder 9 2 2 2 2 2 2 2 2 2 auch backtracking (Zurückverfolgung, Rekursion). Man Beispiel 9: 5-Fish und 4-Fish sucht sich eine möglichst kurze Kandidatenliste (ein Anfangsfeld), trägt einen der Kandidaten ein und wendet danach alle anderen Techniken erneut an. Dabei sollte darauf geachtet werden, dass alle vom Anfangsfeld an getätigten Änderungen wieder rückgängig gemacht werden können. Kommt man nach einer Anzahl weiterer Schritte zu einem Widerspruch zur One-Rule, das heißt, es gibt in einer Einheit eine Zahl doppelt oder eine Zahl kann in einer Einheit gar nicht mehr vorkommen, dann kann man aus der Kandidatenliste im Anfangsfeld die getestete Zahl streichen und muss alle von da an vorgenommenen Änderungen rückgängig machen. Danach kann man den nächsten verbliebenen Kandidaten in das Anfangsfeld setzen und testen, ob dieser zu einem Widerspruch führt. Ist im Anfangsfeld nur noch ein Kandidat übrig, so ist die Lösung für dieses Feld gefunden. - 19 -

Strategien Wenn man jedoch zu einem Punkt kommt, an dem erneut keine anderen Regeln anwendbar sind und kein Widerspruch aufgetreten ist, sollte man die Änderungen rückgängig machen und sich im Anfangsfeld für einen anderen Kandidaten entscheiden 2. Ist an diesem Punkt das Rätsel bereits komplett ausgefüllt, hat man bei einem korrekten Sudoku die richtige Lösung. Ist dies nicht der Fall, so sollte man den nächsten Kandidaten im Anfangsfeld testen. Führen mehr als ein Kandidat aus dem Anfangsfeld zu keinem Widerspruch, muss man das Testen für jeden der Anfangskandidaten erneut ausführen. Dies ist sehr aufwändig, weil man im ungünstigsten Fall alle verbliebenen Kandidaten testen muss. Durch dieses Probieren kann man mit Glück im ersten Versuch erfolgreich sein oder erst nach vielen kaskadierenden Tests. Diese Methode sollte immer erst zum Schluss angewendet werden, da sie nicht nur sehr aufwändig, sondern auch fehleranfällig ist. Der Sudoku-Spieler muss sich sehr konzentrieren, um keine Fehler zu machen und sich eine Technik überlegen, wie Eintragungen wieder rückgängig gemacht werden können. Es gibt auch noch weitere Methoden, um das Probieren hinauszuzögern. Jedoch finden diese im Programm keine Anwendung und werden deswegen hier nicht vorgestellt. 3.2 Umsetzung der Lösungstechniken für Computer Im Folgenden werden die soeben besprochenen Regeln abstrahiert und für die Verwendung in Computerprogrammen optimiert. 2 Bemerkung: man könnte auch ein anderes Anfangsfeld bestimmen, dies ist aber unsystematisch. - 20 -

Strategien Die praktischste Methode zum Lösen eines Sudokus auf einem Computer ist das Testen aller Möglichkeiten. Die einfachste Art ein solches Probieren zu implementieren wäre eine lineare Funktion. Dabei würde der Rechner erst in alle freien Felder eine 1 eintragen. Dann überprüft er das Spielfeld mit der One-Rule kommt in jeder Einheit jede der Zahlen von 1 bis 9 nur genau einmal vor? Trifft dies nicht zu, so tauscht er die 1 im letzten freien Feld gegen eine 2 aus. Daraufhin prüft er das Spielfeld erneut. Ist es wieder ungültig, setzt er ins letzte freie Feld eine 3 und prüft wieder. Diesen Vorgang wiederholt der Rechner, bis er im letzten Feld alle Zahlen bis hin zur 9 getestet hat. Ist das Sudoku auch dann nicht gelöst, setzt er im vorletzten Feld eine um eins höhere Zahl. Nun muss er wieder für das letzte Feld alle Zahlen von 1 bis 9 durchprobieren. Dieser Vorgang wird so oft wiederholt, bis eine gültige Lösung gefunden wird. Das Programm würde in einem solchen Fall aus mehreren ineinander verschachtelten Schleifen bestehen sowie einer Testfunktion, die überprüft, ob die eingetragenen Werte eine gültige Lösung ergeben. Die Anzahl der Schleifen entspricht der Anzahl der freien Felder, jede Schleife läuft von 1 bis 9 und trägt die jeweilige Zahl in ein freies Feld ein. Wenn es eine gültige Lösung gibt, wird sie durch diesen Algorithmus gefunden. Eine Verbesserung dieser Funktion kann man mit Bildung von Kandidatenlisten erreichen. Dazu erstellt der Rechner vor Beginn der Schleifen für jedes freie Feld ein Liste, in die nur die Zahlen eingetragen - 21 -

Strategien werden, die in diesem Feld noch möglich sind, die also weder in der zugehörigen Zeile, Spalte oder dem jeweiligen Block vorkommen. Die Schleifen laufen dann nur noch über diese Listen, so dass nicht mehr jede Zahl ausprobiert werden muss. Zur weiteren Optimierung könnten diese Kandidatenlisten immer dann aktualisiert werden, sobald eine neue Zahl eingetragen wurde. Dadurch würde folgendes Abbruchkriterium entstehen: sobald eine Kandidatenliste leer ist, gibt es für die eingetragenen Testwerte keine Lösung. Nun kann im letzten getesteten Feld der nächste Kandidat ausprobiert werden. Führen alle Kandidaten aus dem letzten Feld zu ungültigen Spielfeldern, wird auf das vorletzte Feld zurückgegriffen. Dies nennt man Backtracking. In das Programm wurde ein Backtracking-Algorithmus integriert, eine genauere Beschreibung dessen wird in Kapitel 4 Abschnitt 2.2 gegeben. Das Erstellen von Kandidatenlisten ist auch für die folgenden Algorithmen notwendig. Zuerst wird für jedes leere Feld eine Liste, die die Zahlen von 1 bis 9 enthält, gebildet. Danach werden aus jeder Liste diejenigen Zahlen entfernt, die im dazugehörigen freien Feld nicht mehr möglich sind. Diese Zahlen entsprechen den bereits eingetragenen Werten in den drei Einheiten (die Zeile, die Spalte, der Block), zu denen das Feld gehört. Ein Algorithmus, der sich nur auf jeweils eine Einheit bezieht, ist der n-clique-algorithmus. Die n-clique ist eine Gruppe von n Kandidatenlisten, in denen jeweils die gleichen n Kandidaten vorkommen. Es gibt zwei verschiedene Formen von n-cliquen. - 22 -

Strategien Die sichtbare n-clique besteht aus n Kandidatenlisten, in denen nur die gleichen n Kandidaten und keine weiteren Zahlen vorkommen. In den restlichen Listen der Einheit können aber Kandidaten aus der Clique vorkommen. Die versteckte n-clique besteht aus den n Kandidatenlisten, in denen die n Kandidaten vorkommen. Diese n Kandidaten dürfen in keiner anderen Liste der Einheit vorkommen, es können jedoch weitere Zahlen in den zur Clique gehörenden Kandidatenlisten auftreten. Eine n-clique ordnet n Kandidaten n Felder zu. Da in jedem Feld eine Zahl stehen muss, können in diesen n Feldern keine anderen Zahlen stehen und da jede Zahl in der Einheit nur einmal vorkommen darf, können diese n Kandidaten in keinem anderen Feld der Einheit vorkommen. Existiert also eine n-clique, so kann man diese n Kandidaten in den Feldern der Einheit streichen, die nicht zur Clique gehören. Weiterhin kann man auch alle in den Kandidatenlisten der Clique vorkommenden Zahlen streichen, die nicht zur Clique gehören. Es tritt immer nur eine Form der n-clique auf, entweder eine sichtbare oder eine versteckte, somit werden nur Zahlen in der Clique oder außerhalb gestrichen. Die einfachste Form der n-clique ist die 1-Clique {a}, dabei ist in dem einen Feld nur noch die eine Zahl möglich. Bei einer sichtbaren 1-Clique besteht die Kandidatenliste nur noch aus einem Wert. Eine versteckte 1-Clique ist vorhanden, wenn eine Zahl nur noch in einem Feld der Einheit vorkommen kann. In beiden Fällen kann die Zahl, aus der die Clique besteht, sofort in das entsprechende Feld eingetragen werden. - 23 -

Strategien Eine 2-Clique besteht aus 2 Kandidatenlisten, in denen die 2 gleichen Zahlen vorkommen. Eine sichtbare 2-Clique gibt es, wenn es in einer Einheit 2 Listen mit jeweils nur 2 gleichen Zahlen gibt, in der Form {a, b} und {a, b}. Dann können aus allen anderen Listen der Einheit die Zahlen a und b entfernt werden. Versteckte 2-Cliquen sind vorhanden, wenn 2 Zahlen a und b nur in 2 Kandidatenlisten auftauchen. Ein Beispiel hierfür wäre eine Einheit, in der noch folgende Listen stehen: {a, b, c, d, e}, {a, b, c, d, e}, {c, d, e}, {d, e} und {c, d, e}. Die Zahlen a und b kommen nur in den ersten beiden Listen vor. Das heißt, eines der beiden Felder hat a als Lösung und das andere b, somit sind c, d und e dort nicht möglich und können aus den Listen gestrichen werden. Die Listen einer 2-Clique müssen aber nicht unbedingt aus jeweils 2 Zahlen bestehen, sie können auch die Form {a} und {a, b} haben. Bei einer sichtbaren 2-Clique entspräche die erste Liste einer sichtbaren 1-Clique. Ist die 2-Clique versteckt, wäre die zweite Liste eine versteckte 1-Clique. Wenn man nun die 1-Cliquen-Regel anwendet, führt das jeweils dazu, dass zwei 1-Cliquen {a} und {b} entstehen. Eine 2-Clique kann also auch aus zwei 1-Cliquen bestehen. 3-Cliquen umfassen 3 Kandidatenlisten, in denen die gleichen 3 Zahlen stehen. Gibt es in einer Einheit 3 Listen {a, b, c}, {a, b, c} und {a, b, c}, so ist das eine sichtbare 3-Clique und man kann die Zahlen a, b und c aus den anderen Kandidatenlisten löschen. Bei einer versteckten 3-Clique kommen 3 Zahlen nur in den gleichen 3 Listen einer Einheit vor. Ein Beispiel: in einer Einheit sind noch die Kandidatenlisten {a, b, c, d}, {a, b, c, d,}, {a, b, c, d,}, {a, b, c, d}, {a, c, d e,f,g}, {a, e,f,g} und {d, e,f,g} vorhanden. Die Zahlen - 24 -

Strategien e, f und g kommen nur in den letzten 3 Listen vor, das entspricht einer versteckten 3-Clique, daraufhin kann man in den letzten 3 Listen alle Zahlen bis auf e, f und g streichen. Auch bei einer 3-Clique muss nicht jede ihrer Kandidatenlisten aus drei Zahlen bestehen. Sie kann ebenfalls aus kleineren Cliquen zusammengesetzt sein, aus einer 2-Clique und einer 1-Clique oder aus drei 1-Cliquen. Wenn sie nicht zusammengesetzt ist, muss jeder der drei Kandidaten in mindestens in zwei Listen vorhanden sein, das heißt auch {a, b}, {b, c} und {a, c} bilden eine 3-Clique. Einheiten, in denen 4 Kandidatenlisten nur aus den 4 gleichen Zahlen bestehen, enthalten eine sichtbare 4-Clique, eine versteckte 4-Clique existiert, wenn 4 Zahlen nur in 4 Listen der Einheit enthalten sind. Diese 4-Cliquen haben die gleiche Eigenschaften, wie kleinere Cliquen. Bei sichtbaren kann man die 4 Zahlen der Clique aus den anderen Listen streichen und bei versteckten können aus den zur Clique gehörenden Listen die Zahlen, die nicht zur Clique gehören, entfernt werden. Bei 4-Cliquen müssen ebenfalls nicht alle 4 Zahlen in jeder Kandidatenliste vorkommen, außerdem kann die 4-Clique auch aus kleineren Cliquen zusammengesetzt sein. Alle Eigenschaften der n-cliquen mit n 4 gelten auch für die n-cliquen mit 4 < n 9. Eine 9-Clique besteht damit aus 9 Kandidatenlisten, in denen nur 9 Zahlen vorkommen. Da eine Einheit aber nur 9 Listen besitzt und es bei Sudoku nur 9 verschiedene Zahlen gibt, wird mit einer 9-Clique kein Effekt - 25 -

Strategien erzielt, da man keine Zahlen streichen kann. Vielmehr ist jede Einheit eine 9-Clique. Auch die 9-Clique kann zusammengesetzt sein in einer vollständig ausgefüllten (gelösten) Einheit besteht die 9-Clique aus neun 1-Cliquen. Daraus kann man ableiten, dass n-cliquen mit n > 4 redundant sind, da zu jeder n-clique eine (9 - n)-clique existiert. Das heißt, dass es eine 5-Clique nur dann geben kann, wenn es auch eine 4-Clique oder eine zusammengesetzte 4-Clique gibt. Im Beispiel 10 sieht man eine sichtbare 5-Clique in den Feldern 1, 3, 5, 7 und 9, während in den restlichen Feldern eine 4-Clique versteckt ist. 1 3 5 7 9 1 3 5 7 9 2 4 6 8 1 3 5 7 9 1 3 5 7 9 2 4 6 8 1 3 5 7 9 1 3 5 7 9 2 4 6 8 1 3 5 7 9 1 3 5 7 9 2 4 6 8 1 3 5 7 9 Beispiel 10: versteckte 4- Clique und sichtbare 5- Clique Um eine sichtbare n-clique zu finden, muss der Computer alle Kandidatenlisten einer Einheit miteinander vergleichen. Er bildet erst aus der Menge aller möglichen Kandidaten eine Teilmenge mit n Kandidaten und vergleicht diese dann mit allen Listen der Einheit. Vor dem Vergleich setzt er einen Zähler auf Null. Kommen alle Kandidaten einer Liste in der Teilmenge vor, so merkt er sie sich und erhöht den Zähler. Sind alle Listen mit der Teilmenge verglichen worden, und der Zähler ist gleich n, so hat er eine sichtbare n-clique gefunden und kann alle Kandidaten der Teilmenge aus den nicht zur Clique gehörenden Kandidatenlisten entfernen. Ist der Zähler kleiner als n so existiert keine n-clique mit den Kandidaten der Teilmenge. Die Teilmengen werden systematisch erzeugt, so dass jede mögliche Kombination der Kandidaten einmal getestet wird. - 26 -

Strategien Für versteckte Cliquen werden aus den Kandidatenlisten Positionslisten erstellt, das heißt, die 1. Liste enthält alle Positionen des Kandidaten 1 in der Einheit, die 2. alle Positionen des Kandidaten 2 in der Einheit und so weiter. Jetzt wird aus der Menge aller möglichen Positionen (1 bis 9) eine Teilmenge mit n Positionen gebildet, die analog dem Algorithmus zum Finden von sichtbaren Cliquen mit den Positionslisten verglichen wird. Sind n Positionslisten gefunden worden, die innerhalb der Teilmenge liegen, so werden aus den restlichen Listen die Werte der Teilmenge gestrichen. Am Ende werden aus den Positionslisten wieder Kandidatenlisten erstellt. Dazu werden erst alle Kandidatenlisten geleert. Nun werden in die 1. Kandidatenliste alle Nummern der Positionslisten eingetragen, in der eine 1 vorkommt, in die 2. Kandidatenliste alle Nummern der Positionslisten, in der eine 2 vorkommt und so weiter. Um das Finden von n-cliquen zu vereinfachen, kann man sich eine Matrix erstellen, wie in Tabelle 1. Dann trägt man die gegebenen Kandidatenlisten in die Zeilen ein (im Beispiel besteht die 1. Liste nur aus dem Kandidaten 1, die 2. Liste ist {2, 3}, die 3. Liste ist {1, 5} und so weiter). Nun kann man die Untermenge bilden und für die Suche nach sichtbaren n-cliquen mit den Zeilen vergleichen. Will man 1 2 3 4 5 6 7 8 9 1 * 2 * * 3 * * 4 * * 5 * * * 6 * * * * 7 * 8 * * * 9 * * * Tabelle 1: Hilfsmatrix - 27 -

Strategien versteckte n-cliquen entdecken, vergleicht man die Untermenge mit den Spalten, die den Positionslisten entsprechen. Bei einem n-fish werden die Schnittpunkte von zwei Einheitenarten betrachtet. Ein Schnittpunkt von einer Zeile und einer Spalte besteht dabei aus einem Feld, während ein Block und eine Spalte oder ein Block und eine Zeile sich jeweils in 3 Feldern schneiden. Ein n-fish ist eine Menge von n Positionen von Schnittpunkten in n Einheiten einer Art, an denen ein und dieselbe Zahl steht oder möglich ist. Der n-fish findet hauptsächlich Anwendung bei Schnittpunkten von Zeilen und Spalten, deswegen wird die Beschreibung des n-fishs nur für Zeilen und Spalten erfolgen. Die Sonderform Locked Candidate wird separat eingeführt. Auch beim n-fish ist die einfachste Form ein 1-Fish. Dafür wird ein leeres Feld gesucht und aus der Kandidatenliste ein Wert genommen. Nun werden die Zeile und die Spalte betrachtet. Kommt dieser Kandidat in einer dieser Einheiten nur an dieser Stelle vor, so ist dies ein 1-Fish. Wenn die Zahl in der Spalte die einzige Möglichkeit ist, so kann man sie als Lösung an dieser Stelle eintragen (siehe versteckte 1-Clique) und sie somit aus den Kandidatenlisten der Zeile streichen. Ist sie in der Zeile einzig, kann man sie auch eintragen und aus den Kandidatenlisten der Spalte streichen. Eine bereits eingetragene Zahl ist auch ein 1-Fish. Ein 2-Fish, auch "x-wing" genannt, tritt auf, wenn in 2 Zeilen oder 2 Spalten eine Zahl nur an den beiden gleichen Positionen möglich ist. Das heißt, Zahl - 28 -

Strategien 3 a ist in Zeile y 1 und y 2 jeweils nur an den Positionen x 1 und x 2 möglich. Wenn a nun in Zeile y 1 an der Stelle x 1 stehen würde, müsste sie in Zeile y 2 an der Stelle x 2 stehen, wenn sie y\ x 1 2 3 1 1 2 1 1 3 1 1 4 1 5 1 1 6 7 1 8 9 1 1 aber in y 1 an der Stelle x 2 stehen 4 1 1 1 würde, dann bliebe in y 2 nur noch x 1, 5 1 1 1 1 da eine Zahl in einer Zeile nur einmal vorkommen darf. Somit kann 6 7 1 1 die Zahl a in den Spalten x 1 und x 2 nur an den Stellen y 1 und y 2 stehen 8 9 1 1 und aus den restlichen Kandidatenlisten dieser Spalten Beispiel 11: 2-Fish und 1-Fish gelöscht werden. Das gleiche kann man in den Zeilen anwenden, wenn man einen 2-Fish in den Spalten gefunden hat. Im Beispiel 11 sieht man einen 2-Fish in den Spalten 4 und 7, wodurch die restlichen Möglichkeiten für die 1 in den Zeilen 3 und 5 gestrichen werden können. Dadurch entsteht in Spalte 3 ein 1-Fish, der die Entfernung der restlichen Möglichkeiten für den Kandidaten in der zugehörigen Zeile verursacht. Auch beim n-fish muss in der betreffenden Spalte oder Zeile die Zahl nicht zwingend n mal vorkommen, sondern kann weniger als n mal auftreten. Wenn im Fall 2-Fish in einer Spalte oder Zeile eine Zahl nur einmal vorkommt, entspricht dies einem 1-Fish. Dann kann man durch Streichen der Kandidaten den 2-Fish auf zweimal 1-Fish reduzieren. 3 Bemerkung: Im folgenden wird x als Variablen für bestimmte Spalten und y als Variable für Zeilen verwendet. - 29 -

Strategien Der 3-Fish wird auch als swordfish bezeichnet und existiert, falls in 3 Zeilen oder Spalten eine Zahl nur an den 3 gleichen Positionen vorkommen kann. Wenn eine Zahl a in den Zeilen y 1, y 2 und y 3 nur an den Stellen x 1, x 2 und x 3 stehen kann, so sind alle Möglichkeiten für a sowohl in den 3 Zeilen, als auch in den 3 Spalten ausgeschöpft, da jede Zahl in jeder Einheit nur einmal vorkommen darf. Daraufhin kann man in allen Spalten x 1, x 2 und x 3 außer an den Schnittpunkten mit den Zeilen y 1,y 2 und y 3 die Zahl a aus den Kandidatenlisten entfernen. Wenn y\ x 1 2 3 4 5 6 7 8 9 1 man einen 3-Fish in den Spalten 2 4 4 4 findet, so kann man Kandidaten 3 4 4 aus den dazugehörigen Zeilen 4 4 4 entfernen. 5 6 4 4 Der 3-Fish kann auch 7 4 4 4 zusammengesetzt aus einem 2-Fish und einem 1-Fish oder aus 8 9 4 4 dreimal einem 1-Fish sein. Ebenfalls gilt, dass nicht in jeder Beispiel 12: zwei 3- Fish Zeile oder Spalte die Zahl n mal vorkommen muss. In Beispiel 12 findet man zwei mal einen 3-Fish. Einer befindet sich in den Spalten 3, 6 und 9 und der andere ist in den Zeilen 3, 4 und 8. Beide haben zur Folge, dass man die 4 in Zeile 2, Spalte 1 und die in Zeile 7, Spalte 8 streichen kann. Beim jellyfish, dem 4-Fish, wird nach Zeilen (oder Spalten) gesucht, in denen eine Zahl nur in 4 Spalten (Zeilen) vorkommen kann. In diesem Fall - 30 -

Strategien kann diese Zahl aus den anderen Kandidatenlisten der Spalten (Zeilen) gelöscht werden. Auch der 4-Fish kann zusammengesetzt sein, und es muss nicht in jeder Zeile oder Spalte 4 Möglichkeiten für die Zahl geben. Genau wie bei der n-clique ist beim n-fish 9 der Maximal-Wert für das n. Auch ein n-fish kann zusammengesetzt sein. Somit ist auch ein n-fish mit n > 4 redundant, da es für jeden n-fish auch einen (9 - n)-fish gibt, das heißt, wenn es einen 5-Fish gibt, dann gibt es auch einen 4-Fish. Im Beispiel 13 befindet sich in den Spalten 2, 5, 6, 7 und 9 ein 5-Fish, den dazugehörigen (9 - n)-fish (4-Fish) findet man in den Zeilen 1, 5, 6 und 8. y\ x 1 2 3 4 5 6 7 8 9 1 5 5 2 5 5 5 5 5 5 3 5 5 5 5 5 4 5 5 5 5 5 5 5 5 5 5 5 5 6 5 5 5 7 5 5 5 5 5 8 5 5 5 9 5 5 5 5 5 Beispiel 13: ein 4-Fish und ein 5-Fish Um mit einem Computer einen n-fish zu finden, kann man sich der gleichen Matrix bedienen, die bei der Suche nach n-cliquen benutzt wurde (Tabelle 1). Dabei überträgt man die noch möglichen Positionen eines Kandidaten in die Hilfsmatrix. In das Beispiel in Tabelle 2 wurde das Kandidatenfeld aus Beispiel 11 übernommen. Nun kann man wieder eine Untermenge bilden. Diese Menge besteht aus n Zahlen zwischen 1 und 9. Das n entspricht dabei dem aus dem gesuchten n-fish. Dann werden die Spalten mit dieser - 31 -

Strategien 1 2 3 4 5 6 7 8 9 1 * * * 2 * * * 3 * * * * * 4 * * * 5 * * * * 6 * * 7 8 * * 9 Untermenge verglichen, und wenn man n Spalten gefunden hat, die zur Untermenge gehören (die Elemente der Spalte sind in der Menge enthalten), so ist ein n-fish gefunden. Wurde kein n-fish entdeckt, kann man noch die Zeilen mit der Untermenge vergleichen. Locked Candidate ist eine Tabelle 2: Hilfsmatrix Sonderform von n-fish. Dabei geht es nicht um die Schnittpunkte von Zeilen und Spalten, sondern um die Schnittpunkte von Zeilen und Blöcken beziehungsweise Spalten und Blöcken. Jeder Schnittpunkt besteht aus 3 Feldern, wobei es egal ist, ob in diesen die gesuchte Zahl einmal, zweimal oder dreimal vorkommt und an welchen Stellen sie steht. Weiterhin ist 3 die Obergrenze für das n bei Locked Candidate, da maximal 3 Blöcke eine Zeile oder eine Spalte schneiden. Da ein 3-Fish keine Veränderungen hervorrufen würde und ein 2-Fish einen 1-Fish impliziert, muss nur nach einem 1-Fish gesucht werden. Beim Löschen von Kandidaten muss beachtet werden, dass die Zahlen immer in allen 3 Feldern des Schnittpunktes gelöscht werden können. Auch bei den Locked Candidates kann die Hilfsmatrix verwendet werden. In diesem Fall setzt man in der Matrix ein Feld, wenn der Schnittpunkt eines Blockes in mindestens einem Feld denjenigen Kandidaten enthält, für den Locked Candidates angewendet werden soll. Die Matrizen in Tabelle 3 und 4 wurden ebenfalls aus dem Beispiel 11 generiert. In beiden Tabellen - 32 -

Strategien entsprechen die Spaltennummern den Nummern der Blöcke (Block 1 ist links oben, Block 2 ist oben in der Mitte, Block 3 ist rechts oben, Block 4 ist links in der Mitte und so weiter). Tabelle 3 wurde für die Schnittpunkte mit den Zeilen erstellt: wenn also der Schnittpunkt von Zeile 1 mit Block 1 den Kandidaten enthält, wird das Feld (1,1) gesetzt. In Tabelle 4 wird Feld (1,1) nur gesetzt, wenn der Kandidat im Schnittpunkt der 1. Spalte mit dem 1. Block vorkommt. Da im Fall Locked Candidate nur nach 1-Fish gesucht wird, braucht man dann in den Matrizen nur nach Spalten oder Zeilen zu suchen, in denen nur ein Wert gesetzt ist. Führt diese Aktion zu einem Erfolg, so hat man einen Locked Candidate in dem Schnittpunkt, für den das gefundene Feld steht, entdeckt und kann die 1 2 3 4 5 6 7 8 9 1 * * * 2 * * 3 * * 4 * * 5 * * 6 7 * * 8 9 * * 1 2 3 4 5 6 7 8 9 1 * * 2 * * 3 * * * 4 * * * 5 * * * 6 * * 7 8 * 9 Tabelle 3: Hilfsmatrix Kandidaten aus dem Rest des Blockes und der Spalte oder Zeile streichen. Nachdem die Matrizen durchsucht wurden, muss man nur aus den ursprünglichen Kandidatenlisten, die zu dem Schnittpunkt gehören, von dem das Feld in der Matrix gelöscht wurde, den Kandidaten entfernen. Tabelle 4: Hilfsmatrix - 33 -