Universität Hildesheim. Fachbereich III Sprach- und Informationswissenschaften. Institut für Übersetzungswissenschaft und Fachkommunikation



Ähnliche Dokumente
Institut für Computational Engineering ICE. N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t. w w w. n t b.

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt?

Zeichen bei Zahlen entschlüsseln

Informationsblatt Induktionsbeweis

Die Lernumgebung des Projekts Informationskompetenz

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Auswertung qualitativer Interviews

A1.7: Entropie natürlicher Texte

IT-Governance und Social, Mobile und Cloud Computing: Ein Management Framework... Bachelorarbeit

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

1 Mathematische Grundlagen

4. AUSSAGENLOGIK: SYNTAX. Der Unterschied zwischen Objektsprache und Metasprache lässt sich folgendermaßen charakterisieren:

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

.procmailrc HOWTO. zur Mailfilterung und Verteilung. Stand:

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

Grundlagen für den erfolgreichen Einstieg in das Business Process Management SHD Professional Service

Modellierung biologischer. Christian Maidorfer Thomas Zwifl (Seminar aus Informatik)

Primzahlen und RSA-Verschlüsselung

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Technische Dokumentation: wenn Englisch zur Herausforderung wird

Um zusammenfassende Berichte zu erstellen, gehen Sie folgendermaßen vor:

Individuelles Bachelorstudium. Software Engineering for Physics

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus:

Berechnung der Erhöhung der Durchschnittsprämien

Psychologie im Arbeitsschutz

Untersuchung der Auswahl der Hauptfreiheitsgrade zum Import eines Modells von ANSYS nach SIMPACK

Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers

1. Einleitung. 1.1 Hintergrund. 1.2 Motivation. 1.3 Forschungsansatz - These

Die neue Aufgabe von der Monitoring-Stelle. Das ist die Monitoring-Stelle:

OUTSOURCING ADVISOR. Analyse von SW-Anwendungen und IT-Dienstleistungen auf ihre Global Sourcing Eignung. Bewertung von Dienstleistern und Standorten

Welches Übersetzungsbüro passt zu mir?

Internet Kurs. Suchmaschinen

Leseprobe. Thomas Konert, Achim Schmidt. Design for Six Sigma umsetzen ISBN: Weitere Informationen oder Bestellungen unter

Access [basics] Rechnen in Berichten. Beispieldatenbank. Datensatzweise berechnen. Berechnung im Textfeld. Reporting in Berichten Rechnen in Berichten

Beschreibung und Bedienungsanleitung. Inhaltsverzeichnis: Abbildungsverzeichnis: Werkzeug für verschlüsselte bpks. Dipl.-Ing.

Auszug aus der Auswertung der Befragung zur Ermittlung der IT-Basiskompetenz

Festigkeit von FDM-3D-Druckteilen

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Physik & Musik. Stimmgabeln. 1 Auftrag

Jeopardy and andere Quizformate im bilingualen Sachfachunterricht Tipps zur Erstellung mit Powerpoint

C++11 C++14 Kapitel Doppelseite Übungen Musterlösungen Anhang

Fachdidaktik der Informatik Jörg Depner, Kathrin Gaißer

II. Zum Jugendbegleiter-Programm

Lineare Gleichungssysteme

Einführung in. Logische Schaltungen

Additional Cycle Index (ACIX) Thomas Theuerzeit

Barrierefreie Webseiten erstellen mit TYPO3

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.

DER SELBST-CHECK FÜR IHR PROJEKT

Das Projekt wird durchgeführt von den Bezirksregierungen in Nordrhein- Westfalen in ihrer Funktion als Fachstelle für die öffentlichen Bibliotheken

Motivation. Formale Grundlagen der Informatik 1 Kapitel 5 Kontextfreie Sprachen. Informales Beispiel. Informales Beispiel.

Energetische Klassen von Gebäuden

Gästeverwaltung. Gästestammdaten. Gäste verwalten. Hotelsoftware für Klein- und Mittelbetriebe

WAS finde ich WO im Beipackzettel

Grundlagen der Theoretischen Informatik, SoSe 2008

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Information zum wissenschaftlichen Arbeiten

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".

SDD System Design Document

infach Geld FBV Ihr Weg zum finanzellen Erfolg Florian Mock

Speicher in der Cloud

Diplomarbeit. Konzeption und Implementierung einer automatisierten Testumgebung. Thomas Wehrspann. 10. Dezember 2008

Sie werden sehen, dass Sie für uns nur noch den direkten PDF-Export benötigen. Warum?

Was meinen die Leute eigentlich mit: Grexit?

Grundbegriffe der Informatik

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Content Management System mit INTREXX 2002.

Lineare Gleichungssysteme

Elexis-BlueEvidence-Connector

«Eine Person ist funktional gesund, wenn sie möglichst kompetent mit einem möglichst gesunden Körper an möglichst normalisierten Lebensbereichen

Patch-Management. Leibniz-Akademie Hannover Wirtschaftsinformatik B. Sc. Praxisreflexion im Bereich Management im SS 2011

Dok.-Nr.: Seite 1 von 6

Professionelle Seminare im Bereich MS-Office

Mobile Intranet in Unternehmen

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

In 12 Schritten zum mobilen PC mit Paragon Drive Copy 11 und Microsoft Windows Virtual PC

SEPA Lastschriften. Ergänzung zur Dokumentation vom Workshop Software GmbH Siemensstr Kleve / /

W-Rechnung und Statistik für Ingenieure Übung 11

1. LINEARE FUNKTIONEN IN DER WIRTSCHAFT (KOSTEN, ERLÖS, GEWINN)

Lernerfolge sichern - Ein wichtiger Beitrag zu mehr Motivation

Klausur WS 2006/07 Programmiersprache Java Objektorientierte Programmierung II 15. März 2007

Moderne Behandlung des Grauen Stars

Richtlinien der Osteopathie Schule Deutschland zur Abschlussarbeit für die Erlangung der Ausbildungsbezeichnung D.O.OSD.

Lizenzierung von SharePoint Server 2013

Lizenzierung von SharePoint Server 2013

Lösung Fall 8 Anspruch des L auf Lieferung von Panini á 2,-

Umgang mit Schaubildern am Beispiel Deutschland surft

Leitfaden zur Anfertigung von Diplomarbeiten

Approximation durch Taylorpolynome

Zahlen auf einen Blick

Einfache kryptographische Verfahren

Kapiteltests zum Leitprogramm Binäre Suchbäume

Hilfe zur Urlaubsplanung und Zeiterfassung

Anleitung öffentlicher Zugang einrichten

Transkript:

Universität Hildesheim Fachbereich III Sprach- und Informationswissenschaften Institut für Übersetzungswissenschaft und Fachkommunikation Arbeit zur Erlangung des akademischen Grades Master of Arts im Studiengang Internationale Fachkommunikation Sprachen und echnik Korpuslinguistische Analyse der englischen Fachsprache im Bereich numerischer Simulationen Prof. Dr. U. Heid Miriam Woltermann M. Behnke, Dipl.-Fachübers. Im Kreutzhof 22 34123 Kassel Kassel, im Dezember 2009

Inhaltsverzeichnis Kurzzusammenfassung auf Englisch und Deutsch...4 Einleitung...5 I Methodenhintergrund...9 1 Korpuslinguistik...9 2 Numerisches Simulieren...12 3 Fachsprache der numerischen Simulation...17 II Korpusdesign...21 1 Korpuskonstitution...21 1.1 Korpuskriterien...21 1.1.1 Domäne...22 1.1.2 extsorte...23 1.1.3 Register...23 1.1.4 Ausgewogenheit...23 1.1.5 Repräsentativität...24 1.2 extbeschaffung...25 1.2.1 extbeschaffung in der heorie...25 1.2.2 extbeschaffung in der Praxis...26 1.3 extauswahl...29 1.3.1 extauswahl nach inhaltlichen Kriterien...29 1.3.2 extauswahl nach formalen Kriterien...31 2 Metadaten...34 2.1 Corpusencoding Standard ein Standard für Metadaten...35 2.2 Metadaten tabellarisch...35 2.3 Metadaten in Histogrammen...36 2.3.1 Zeitraum...36 2.3.2 Fachzeitschriften...37 2.3.3 Autorenschaft...37 III Computerlinguistische Realisierung: Korpuskodierung...39 1 CWB und CQP...40 2 Vorverarbeitung...42 2.1 Konvertierung...43 2.2 Formelzeichen...44 2.3 Worttrennungen...44 2.4 Segmentierung...45 3 Morphosyntaktische Annotation...47 3.1 Der verwendete agger...48 3.2 Das verwendete agset...49 3.3 Unbekannte Wortformen...49 4 Annotation von Metadaten...53 4.1 Autor...54 4.2 Jahr...55 4.3 Land...55 4.4 Zeitschriftenname...56 4.5 Artikel-Nummer...56 IV Fachsprachenorientierte Untersuchung Fallstudien...58 II

1 Fallstudie 1: Mischung von Wortfeldern...58 2 Fallstudie 2: erminologisierung von Adjektiven...65 3 Fallstudie 3: Fachwortschatz...72 V Schlussteil...82 1 Zusammenfassung...82 2 Ausblick...85 Danksagung...87 Verzeichnisse...88 3 Literaturverzeichnis Sprachwissenschaften...88 4 Literaturverzeichnis Numerische Simulation...93 5 Mündliche und schriftlichen Äußerungen von Fachleuten...94 6 Verzeichnis der CWB Infrastruktur...95 7 Inhaltsverzeichnis der CD-ROM...96 A Korpustexte...98 B abelle Metadaten...105 C abelle Mehrdeutige Wortzusammenfügungen...107 D abelle Penn reebank ag Set...110 E abelle Wortfeldvergleich...111 Eidesstattliche Erklärung...121 3

Kurzzusammenfassung auf Englisch und Deutsch In order to describe the perception of the nature of numerical methods within the context of scientific methods, an ad-hoc corpus is built and analysed; it consists of 44 English language articles specialised in numerical vehicle crashworthiness simulations from scientific journals in a morphosyntactic format of the CWB (IMS, University of Stuttgart). Ein opportunistisches Korpus bestehend aus 44 englischsprachigen, aktualisierendfortschrittsorientierten, faktenorientierten Fachzeitschriftenartikeln im Kontext numerischer Fahrzeugaufprallsimulationen wurde in einem morphosyntaktisch annotierten Format erstellt und mit CWB (IMS) abgefragt. An diesem wurden Untersuchungen durchgeführt, erstens hinsichtlich der Verortung numerischer Methoden zwischen Experiment und mathematisch exaktem Verfahren und zweitens zum Fachwortschatz. 4

Einleitung Der Einzug der Computertechnologie in die Wissenschaft hat eine Reihe neuer Methoden hervorgebracht oder deren Verwendung ermöglicht. In den Ingenieurs- und Naturwissenschaften beispielsweise konnten durch die Verfügbarkeit leistungsfähiger Computer ab der Mitte des zwanzigsten Jahrhunderts zusätzlich zu experimentellen und analytisch exakten Methoden numerische Verfahren entwickelt werden. Mit diesen ist es möglich, die Auswirkungen äußerer Einflüsse auf Systeme, wie zum Beispiel Fahrzeuge, dort zu simulieren, wo eine direkte Messung oder analytische Bestimmung nicht durchführbar bzw. sehr zeit- oder kostenintensiv wäre. Damit man über den Einsatz numerischer Simulationen sprechen kann, sind neue sprachliche Ausdrucksformen nötig, die deren Status zwischen Empirie und heorie beschreiben. In der vorliegende Arbeit soll untersucht werden, inwiefern die Fachsprache im Bereich numerischer Simulationen hinsichtlich dieser Verortung terminologisiert ist. Die Analyse basiert auf einer möglichst statistisch signifikanten extmenge englischer, aktualisierend-fortschrittsorientiert faktenorientierter Fachzeitschriftenartikel. Die Analyse beschränkt sich zunächst auf aktualisierend-fortschrittsorientiert faktenorientierte Fachartikel, da diese einen sehr hohen Grad an Fachsprachlichkeit aufweisen und somit eine sehr reine Form von Fachsprache liefern, verglichen etwa mit publizistischen Artikeln. Um statistisch signifikante Ergebnisse zu erhalten, müssen mindestens etwa 40 solcher Fachartikel vorliegen. Zur Untersuchung einer solchen größeren extmenge empfiehlt es sich, diese in Form eines elektronisch verfügbaren extkorpus aufzubereiten und mit den Methoden der Korpuslinguistik zu untersuchen. Diese stellt verschiedene Werkzeuge zur Analyse bereit, die die Extraktion natürlichsprachlicher Phänomene unterstützen und sich daher gut für die deskriptive Zielsetzung der Arbeit eignen. Um die Fachsprache aller auf diesem Gebiet arbeitenden Fachleute zu repräsentieren, sollten die Veröffentlichungen von einer internationalen Autorenschaft stammen und nicht ausschließlich von solchen, die Englisch als Muttersprache sprechen. Der Einsatz von Computern für wissenschaftliche Zwecke hat neue Disziplinen hervorgebracht, deren Fachsprache noch relativ jung und daher aktuell Gegenstand verschiedener korpuslinguistischer Forschungsarbeiten ist. Eine Arbeitsgruppe der U Darmstadt hat zur Untersuchung der Sprache solcher wissenschaftlicher Mischdomänen ein Korpus aus neun 5

Subkorpora zusammengestellt. Vier der Subkorpora beinhalten exte aus reinen Disziplinen (EICH 08/I: 1) wie der Linguistik, der Biologie oder der Elektrotechnik, vier Subkorpora sind Mischdomänen zwischen Informatik und den reinen Wissenschaften, wie der Bioinformatik, Computerlinguistik oder Mikroelektronik zugeordnet. Eines der Subkorpora beinhaltet exte aus der Informatik (vgl. EICH 08/S). Die Darmstädter Arbeitsgruppe hat gezeigt, dass die Sprache der Mischdomäne eher der Sprache der reinen Disziplin ähnelt und dass sich das Verständnis der Forschungstätigkeit innerhalb der drei Mischdomänen unterscheidet: Während die Informatiker formal über Ergebnisse sprechen [we] prove [show, obtain], spiegeln die ätigkeitswörter der Computerlinguisten deren empirische Vorgehensweise wider: [we] examine, implement, use. Die Linguisten dagegen arbeiten auf einer deutenden Ebene [we] propose, suggest, argue ('semiotic') oder auf einer introspektiven Ebene [we] feel, see ('mental') (EICH 08/I: 11). Im Darmstädter Projekt steht also der Vergleich zwischen den Fachsprachen der Mischdomänen und der Informatik bzw. der reinen Disziplinen im Vordergrund. Im Gegensatz dazu wird in der vorliegenden Arbeit die sprachliche Darstellung der numerischen Arbeitsweisen zwischen Experiment und mathematisch exakten Verfahren untersucht, denn zur Beschreibung des Kontextes numerischer Methoden verwenden die Wissenschaftler Lexeme, die eindeutig die anderen beiden Kontexte kennzeichnen. In zwei Fallstudien soll einerseits die Mischung von Lexemen der drei Arbeitsweisen und andererseits die erminologisierung von für die Arbeitsweisen kennzeichnender Adjektiven untersucht werden. Außerdem wird in einer dritten Fallstudie am Beispiel der Wortart Nomen eine mögliche Auswahl von erminologie für ein Fachwörterbuch vorgestellt, da es sich bei Anwendungsgebieten numerischer Simulationen um multidisziplinäre Fachbereiche handelt, die an die Erstellung von Fachwörterbüchern besondere Anforderungen stellen. Die Einsatzgebiete numerischer Simulationen finden sich in einer Vielzahl von Verzweigungen einer Mutterdisziplin. Wie vielfältig der Einsatz numerischer Simulationen ist, zeigt das Stuttgart Research Centre for Simulation echnology und Exzellenzcluster 'Simulation echnology' (Simech) (UNIVERSIÄ SUGAR 09). Im Simech-Centre beantworten Wissenschaftler aus Fachbereichen wie dem Bauwesen, der Informatik, der Mathematik, der Physik, der Chemie, der Biochemie, der Wasserwirtschaft, der Sportwissenschaft, der Soziologie oder der Philosophie (ebd.: Projekte und Projektnetzwerke (PN)) Fragestellungen mithilfe numerischer Simulationen. Aufgrund der Vielzahl numerischer Methoden in anwendenden Fachgebieten ist es unmöglich, in dem zeitlich begrenzten Rahmen der vorliegenden Abschlussarbeit die Fachsprache aller Anwendungsgebiete umfassend zu untersuchen. Folglich muss der Fachgegenstand auf einen 6

geeigneten Umfang gebracht werden. Da der Schwerpunkt der vorliegenden Abschlussarbeit nicht in der Erstellung von extkorpora liegen soll, sondern in der Untersuchung der oben erwähnten Fragestellungen, ist es nicht sinnvoll, mehr als ein extkorpus zu erstellen. Daher standen zwei prinzipielle Vorgehensweisen zur Auswahl: entweder die Erstellung eines Korpus zu einem Anwendungsgebiet oder aber die Untersuchung eines Mischdomänen-Korpus. Anders als bei dem Darmstädter Mischdomänenprojekt, bei dem wie erwähnt zu jeder Mischdomäne ein eigenes eilkorpus erzeugt wurde, könnte sich ein einziges Mischdomänen- Korpus aus einzelnen Veröffentlichungen verschiedenster Fachbereiche zusammensetzen. Es wird vermutet, dass die Analyse eines solchen Mischdomänen-Korpus den Vorteil einer Verstärkung der Fachsprache numerischer Simulationen und einer Unterdrückung der Fachsprache der einzelnen Fachgebiete böte (verbessertes Signal-Stör-Verhältnis). Für ein solches Mischdomänenkorpus könnten Veröffentlichungen aus dem Stuttgarter Simech-Projekt verwendet werden. Da die vorliegende Arbeit jedoch eine terminologische Arbeit zu experimentellen Aufprallversuchen ergänzen soll, die an der Universität Hildesheim durchgeführt wurde, wird ein Korpus zu einem einzigen Anwendungsgebiet, nämlich zu numerischen Aufprallsimulationen von Fahrzeugen, erstellt. Aufprallsimulationen werden mit dem Ziel durchgeführt, die Energieaufnahmefähigkeit von Fahrzeugen bei einem Unfall zu optimieren und somit mögliche Personenschäden zu minimieren. Simulationen ersetzen hierbei seit einigen Jahren zunehmend experimentell durchgeführte Aufprallversuche. Aufgrund des kommerziellen Interesses weist das Anwendungsgebiet eine rege Veröffentlichungsaktivität auf, so dass die Verfügbarkeit von extmaterial sichergestellt ist. Um die Arbeit auf mehr als ein Anwendungsgebiet zu beziehen, wird zum Vergleich ein weiteres Anwendungsgebiet, die numerische Seismologie, hinzugezogen. Diese hat ebenfalls einen ingenieurswissenschaftlichen Bezug, da Methoden der Seismologie beispielsweise in der Erdölprospektion eingesetzt werden. Während sich jedoch beim Aufprall von Fahrzeugen das äußere Kräftefeld mit der Zeit ändert, wirkt bei der Ausbreitung seismischer Wellen nur zu Beginn der Wellenausbreitung eine äußere Kraft. Dieser prinzipielle Unterschied der äußeren Kraftfelder hat zur Folge, dass sich die in den beiden Anwendungsgebieten verwendeten numerischen Methoden ergänzen. Die in den beiden Anwendungsgebieten verwendeten numerischen Methoden decken einen Großteil des Spektrums numerischer Methoden ab. Die korpuslinguistische Extraktion soll mithilfe des Corpus Query Processors (CQP) durchgeführt werden. CQP ist ein vielseitiges Suchwerkzeug für natürlichsprachliche Phänomene und eil der Corpus Workbench, einer Softwareumgebung für korpuslinguistische Analysen, erstellt am Institut 7

für Maschinelle Sprachverarbeitung (IMS) der Universität Stuttgart. Da die englische Sprache über eine vergleichsweise einfache Satzstellung verfügt, reicht eine morphosyntaktisch flache Annotation mit Wortarten-Merkmalen und Lemmata aus. Das Korpus wird im Format der Corpus Workbench (CWB ) des IMS kodiert. Die Wortarten-Merkmale werden mit dem Penn reebank ag Set der University of Pensylvania (vgl. Santorini 1995) mithilfe des reetaggers von Schmid (94) annotiert. Die Arbeit gliedert sich in drei Hauptteile. Der erste eil befasst sich mit dem korpuslinguistischen Methodenhintergrund, dem Beschreibungsgegenstand der untersuchten Fachsprache und den Grundzügen von Fachsprachen. Der zweite eil beschreibt das Korpusdesign und enthält Angaben zu den Korpuskriterien, der extsuche und -auswahl und den Metadaten des erstellten Korpus. Der dritte eil erläutert die computerlinguistische Realisierung der Kodierung im CWB-Format und der Annotation von Metadaten und enthält die drei Fallstudien. Anschließend folgt die Zusammenfassung und der Ausblick. Im Anhang befinden sich die Literaturhinweise der Korpustexte und ausgewertete Suchergebnisse. Zusätzlich liegt der Arbeit eine CD-ROM mit weiterem Material wie Suchergebnissen, Kopien zitierter Internetseiten und diversen Protokoll bei. 8

I Methodenhintergrund In diesem ersten eil werden alle für das Verständnis der vorliegenden Arbeit nötigen Hintergrundinformationen gegeben. Im ersten Kapitel wird die sprachwissenschaftliche Methode, auf der die Arbeit basiert, die Korpuslinguistik vorgestellt. Das zweite Kapitel führt in den Fachgegenstand des Korpus, die numerische Simulation, ein. Im dritten Kapitel werden die Eigenschaften der Fachsprache der numerischen Simulation erläutert. 1 Korpuslinguistik Die Korpuslinguistik ist eine Methode zur Untersuchung natürlichsprachlicher Äußerungen: [a] corpus [ ] provides evidence of what speakers believe to be acceptable utterance in their language, typically free of the overt judgement of others (MCENERY E AL. 06/L: 6). Weiter heißt es ebenda: he corpus-based approach [...] draws upon authentic or real texts, though authenticity itself may be cause of dispute. In erster Linie gilt es, Sprache in ihrer tatsächlichen Verwendung und nicht deren regelgemäßen Befolgung von Syntax oder Lexik zu untersuchen. Allerdings sind Belege aus einem Korpus mit Vorsicht zu behandeln, da diese Flüchtigkeitsfehler wie ippfehler oder grammatische Inkonsistenzen enthalten können, oder etwa der Sender die Sprache nicht auf muttersprachlichem Niveau beherrscht. Die Untersuchung natürlichsprachlicher Äußerungen der "neueren Korpuslinguistik" (SCHIERHOLZ 2005/Z: 1) geschieht anhand größerer extsammlungen, die mithilfe des Computers analysiert werden. Das Ergebnis solcher korpuslinguistischer Untersuchungen kann beispielsweise eine Bestandsaufnahme von kollokativen Kookkurenzen oder von Fachwendungen sein. Im Gegensatz zu den theoretischen Linguisten, die sich introspektiv präskriptiv mit der Beschreibung von Sprache befassen, arbeitet der Korpuslinguist also eher deskriptiv. Die quantitative Erfassung von Vorkommenshäufigkeiten einzelner Wörter in ihrer grammatischen Ausprägung (Okkurrenz) oder von Wortkombinationen (Kookkurrenzen) ermöglicht eine weitgehend objektive Sprachbeschreibung. Um die Vielfalt von Sprache darstellen zu können und auch statistisch signifikante Aussagen über die natürliche Verwendung von Sprache machen zu können, ist eine Mindestzahl an Belegen erforderlich. Stefan Schierholz (2005/Z: 12) hält für eine Auswertung grammatischer Strukturen fünf Belege für ausreichend, unter der Voraussetzung, dass es sich nicht um Belege eines einzigen Autors (ebd.) oder gar um den selben Beleg an anderer Stelle handelt. 9

Häufig sind für die Beantwortung einer Fragestellung extsammlungen von einer bis zu mehreren Millionen Wörtern nötig. Für die Untersuchung solcher extmengen gibt es mittlerweile eine ganze Reihe von von Computerlinguisten entwickelten Softwarepaketen, die hauptsächlich von Korpuslinguisten angewendet werden. Es gibt zwei grundsätzliche ypen von Analysesystemen, zum einen die in erster Linie auf linguistischen Regeln basierenden regelbasierten Systeme und zum anderen solche, die mithilfe von manuell annotierten Referenzkorpora trainiert werden. Im Extremfall leitet man [bei statistischen Systemen] sogar die Grammatikregeln selbst aus dem Korpus ab (LEMNIZER ; ZINSMEISER 2006/L: 142). 1 Im Allgemeinen werden für korpuslinguistische Untersuchungen schriftliche bzw. mündliche Äußerungen von einer Vielzahl von Sendern gesammelt, um ein möglichst repräsentatives Ergebnis zu erhalten. Sammlungen zusammenhängender Äußerungen (Wortsequenzen) werden extkorpora genannt. Um präzise Anfragen an ein extkorpus stellen zu können, werden die einzelnen Wörter eines extkorpus mit linguistischen Zusatzinformationen versehen. Dies sind beispielsweise Informationen zur Wortart (part-of-speech, kurz POS) oder die Grundform eines Wortes, dem Lemma. Ist ein extkorpus mit Zusatzinformationen versehen, spricht man allgemein von einem annotierten Korpus, im Folgenden kurz Korpus genannt. Werden die Informationen wortweise zugeordnet, spricht man von positionellen Annotationen, beziehen sie sich auf ganze Wortsequenzen, so spricht man von strukturellen Annotationen. Die Daten im ursprünglichen Format, z. B. WAV-Dateien bei mündlich geäußerter Sprache; PDF-Dateien oder HML-Dateien bei schriftlich festgehaltenen Äußerungen, bezeichnet man als Rohdaten. Werden diese in ein Korpus aufgenommen, so werden in monomodalen Korpora die nonverbalen Bestandteile eines extes wie etwa Bilder oder Mimik von den verbalen Bestandteilen abgetrennt und nur der Fließtext übernommen. Bei schriftlichen Äußerungen werden auf diese Weise Angaben zur Makrostruktur, wie beispielsweise ein zweispaltiges Layout, entfernt. 2 Die reinen extdateien eines Korpus sind dessen Primärdaten (LEMNIZER ; ZINSMEISER 2006/L: 44). Damit diese von der Analysesoftware verarbeitet werden können, müssen die Primärdaten in ein für die automatische Verarbeitung passendes Format gebracht werden (siehe III 2 Vorverarbeitung). Nach abgeschlossener extaufbereitung ist eine automatische Annotation von Wortarten unter Zuhilfenahme unterschiedlicher statistischer Modelle möglich. Beispielsweise können von manuell annotierten Referenzkorpora Entscheidungsbäume abgeleitet werden und auf neue Strukturen angewendet werden. Das erstellte Korpus enthält außer linguistischen Informationen weitere nicht- 1 Ein Beispiel für ein Analysewerkzeug ist die IMS Open Corpus Workbench (CWB) der Universität Stuttgart. Dies ist ein Werkzeug zum Verwalten und Abfragen großer, mit linguistischen Annotationen versehener Korpora (100 M Wörter und mehr). Zentraler Bestandteil ist der Corpus Query Processor (CQP), eine Software zum Formulieren von Korpus-Abfragen. 2 Aus diesem Grund sind monomodale Korpora zur Untersuchung der Makrostruktur von exten ungeeignet. 10

linguistische Informationen (Metadaten). Diese enthalten Angaben über die Herkunft einzelner extsequenzen, etwa den Autor oder das Kapitel. (vgl. ebd.) Um den von Göpferich (98/L: 186) beschriebenen hoher Grad der Fachsprachlichkeit wissenschaftlicher Fachartikel zu verdeutlichen, soll das erstellte Fachsprachenkorpus mit einem gemeinsprachlichen Referenzkorpus abgeglichen werden. Ein für einen solchen Vergleich ideales Referenzkorpus enthielte ausschließlich geschriebene Sprache und müsste neben Anteilen des Amerikanischen und Britischen Englisch, auch über nicht muttersprachliche Beiträge verfügen. Ein solches Korpus stand jedoch nicht zur Verfügung. Das Referenzkorpus für das Britische Englisch, das British National Corpus (BNC), hingegen liegt am IMS der Universität Stuttgart vor. Dieses enthält Anteile geschriebener und gesprochender Gemeinsprache im Verhältnis 90% zu 10%. 11

2 Numerisches Simulieren Im folgenden Abschnitt wird die wissenschaftliche Arbeitsweise des numerischen Simulierens am Beispiel einer Simulationsmethode erläutert und diese anschließend zu weiteren Simulationsmethoden in Beziehung gesetzt. Dazu werden zwei sich ergänzende Anwendungsgebiete vorgestellt, nämlich die Fahrzeugaufprallsimulation und die Simulation von elastischen Wellen im Erdinnern (Erdbebenwellen). Diese beiden Anwendungsgebiete werden in der vorliegenden Arbeit stellvertretend für alle Anwendungsgebiete Numerischer Simulationen untersucht. Da nur ein Korpus zu numerischen Aufprallsimulationen erstellt werden konnte, wird hauptsächlich dieses Anwendungsgebiet vorgestellt und die wichtigsten Begriffe des Gebietes werden erklärt. Der erste Schritt jeder numerischen Simulation ist die Darstellung des zu untersuchenden komplexen Systems in einer vereinfachten, auf die jeweilige Methode zugeschnittenen Weise. Die Erzeugung aus vielen Einzelpunkten bestehender, diskontinuierlicher Modelle aus kontinuierlichen realen Systemen nennt man Diskretisierung. Untersucht man dabei ein physikalisches System, so handelt es sich in der Regel um eine Diskretisierung in Raum und Zeit. Alle diskreten Einzelpunkte des Modells haben einen eindeutig definierten Anfangszustand. In einer numerischen Simulation wird die Zustandsänderung dieser diskreten Punkte, wie z. B. eine Verschiebung aufgrund äußerer Kräfte, berechnet, indem sich die Auswirkung der Kraft in diskreten Zeitschritten im Modell schrittweise von einem diskreten Punkt im Raum zum benachbarten Punkt gemittelt (interpoliert) ausbreitet. Die so erhaltene Lösung ist daher nicht exakt, sondern genähert (Näherung, engl.: approximation) und kann bis zu einem gewissen Grad durch eine verfeinerte zeitliche bzw. räumliche Auflösung oder durch eine besser an die Problemstellung angepasste Methode optimiert werden. Numerische Simulationen basieren auf Methoden, die in der Regel aus der Numerischen Mathematik (Numerik) stammen. Während die Numerik wie beschrieben nur genäherte Lösungen liefert, werden in der Reinen Mathematik analytische Methoden zur exakten Lösung von Problemstellungen entwickelt. Numerische Methoden sind mächtige mathematische Werkzeuge zur Beantwortung von Fragestellungen in verschiedensten wissenschaftlichen und industriellen Anwendungsgebieten. Während einfache Systeme analytisch mit Stift und Papier lösbar sind, ist die numerische Mathematik erst mit dem Aufkommen von Computern für komplexere Problemstellungen einsetzbar geworden. 3 Numerische Simulationen kommen daher seit der Mitte 3 Die Darstellung komplexer, z. B. physikalischer, analytisch nicht mehr lösbarer Probleme mittels einer Vielzahl von 12

des zwanzigsten Jahrhunderts dort zum Einsatz, wo das Verhalten komplexer Systeme nicht mehr analytisch zu lösen ist und experimentelle Lösungen zu kostspielig oder aber unmöglich durchzuführen sind, wie dies etwa beim Brückenbau der Fall ist. Zur Beschreibung physikalischer Systeme sind verschiedene numerische Methoden entwickelt worden, wie etwa die Methode der Spektralen Elemente (SEM), der Finiten Differenzen (FDM) oder die Finite Elemente Methode (FEM) 4. Die Methoden unterscheiden sich in ihrer Eignung für bestimmte Anwendungen und in der Beschaffenheit der kleinsten Diskretisierungsbausteine. Die FDM basiert auf der bereits erläuterten Darstellung der Systemen durch diskrete Punkte im Raum und eignet sich besonders zur Beschreibung solcher Systeme, bei denen äußere Kräfte ausschließlich zu Beginn eines Vorgangs wirken, wie es beispielsweise für die Quellen von Erdbebenwellen (seismische Wellen) der Fall ist. Die FEM hingegen gehört zu den Methoden, deren Systeme in kleine räumliche Zellen, die sogenannten Elemente, zerlegt werden. Auf Finiten Elementen beruhende Methoden eignen sich besonders zur Beschreibung von Systemen mit kontinuierlich wirkenden äußeren Kräften. Ein Anwendungsgebiet hierfür ist die numerische Fahrzeugaufprallsimulation. 5,6 Die numerische Fahrzeugaufprallsimulation und die Simulation der Ausbreitung von Wellenfeldern im Erdinnern sind also Beispiele für Anwendungen grundsätzlich verschiedener ypen numerischer Methoden und eignen sich hierdurch zur Repräsentation zumindest der physikalischen Anwendungsgebiete des numerischen Simulierens, die in der vorliegenden Arbeit in allgemeiner Form nicht umfassend untersucht werden können. Numerische Aufprallsimulation sind heute ein fester Bestandteil der Entwicklung von Fahrzeugen und werden mit dem Ziel durchgeführt, das Energieaufnahmevermögen (crashworthiness) von Fahrzeugen zu optimieren, um so einen möglichst hohen Insassenschutz zu bieten. Die Simulationen ersetzen mittlerweile den Großteil der früher bis zur Marktreife erforderlichen experimentell durchgeführten Fahrzeugaufprallversuche. Das Energieaufnahmevermögen eines Körpers wird bestimmt durch dessen plastische Verformbarkeit. Wird ein Körper bei einem Stoß (impact) plastisch verformt, so wird kinetische Modellpunkten erfordert die Berechnung der zeitlichen Entwicklung über viele Zeitschritte. Hierzu ist eine Rechenmaschine erforderlich, die über genügend Rechengeschwindigkeit und Arbeitsspeicher verfügt. 4 Die FEM wird gelegentlich auch als Finite Element Analysis (FEA) oder kurz Finite Elemente (FE) bezeichnet. 5 he FEM is a computer-aided mathematical technique for obtaining approximate numerical solutions to the abstract equations of calculus that predict the response of physical systems subject to external influences. (BURNE 88/L: 3) 6 Weiterhin eignet sich die FEM zur Beschreibung von Systemen aus den folgenden physikalischen Bereichen: solid mechanics (e.g., elasticity, plasticity, statics, and dynamics), heat transfer (conduction, convection, and radiation), fluid mechanics (inviscid or viscous) [ ] as well as in coupled interaction of these phenomena (ebd.: 3-4). 13

Energie (Stoßenergie) in Wärme umgesetzt. Je höher also der Anteil an plastisch verformbaren 7 Komponenten ist, desto besser ist das Energieaufnahmevermögen eines Fahrzeuges. Während der Fahrt spielt die ragfähigkeit eines Fahrzeugs die entscheidende Rolle. Hierfür werden sowohl elastische als auch Fahrzeugkomponenten mit einer hohen Steifigkeit benötigt 8. Die Herausforderung bei der Entwicklung von Fahrzeugen besteht also darin, das optimale Verhältnis aus Energieaufnahmefähigkeit und ragfähigkeit zu finden (optimization) 9. Wenn ein Fahrzeug über eine zu hohe Steifigkeit verfügt, nimmt es beim Aufprall weniger Energie auf. Dies erfordert die Einführung einer weiteren Größe zur Beschreibung des Verhaltens bei einem Fahrzeugaufprall, der Aggressivität: While crashworthiness focuses on the capability of a vehicle to protect its occupants during a crash, aggressivity is measured in terms of casualties in the collision partner [003]. Werden bei der Optimierung unterschiedliche physikalische Parameter einbezogen, so spricht man im Englischen von Multidisciplinary Optimization. Im Korpustext [024] werden beispielsweise folgende drei Parameter berücksichtigt: multidisciplinary optimization including the weight, intrusion distance, and energy absorptions. Bei Aufprallszenarien unterscheidet man zwei Aufprallarten 10, die im Englischen mit leicht zu verwechselnden Begriffen bezeichnet werden und deshalb hier erwähnt werden; bei dem Aufprall wird zwischen dem hochdynamischen Aufprall (crash) und dem mit den Gesetzen der statischen Mechanik beschreibbaren Knautschung (crush) unterschieden. 11 Kommen wir nun zur Modellbildung. Als Einstieg folgt eine Beschreibung vollständiger Fahrzeugmodelle aus Korpustext [055] (S. 2), die die Komplexität solcher Modelle illustrieren soll: Current models in crashworthiness analysis contain well beyond 500 000 elements which may be a mix of shell elements, beam elements, 3D solid elements and many connection elements such as springs, dampers with nonlinear properties. For model efficiency often 7 Obwohl es sich bei der Verformung der im Fahrzeug integrierten plastischen Komponenten um einen kontrollierten Vorgang handelt, wird hier nicht von einer Umformung gesprochen, da nicht die am Ende erhaltene Form, sondern, sondern eine maximale Energieaufnahme im Vordergrund steht. 8 [he] main function of a structure is to support external loadings [136]. 9 Since structures which exhibit acceptable elastic behaviour are not necessarily adequate for crashworthiness (and vice-versa), designs which are generated separately for the elastic loading conditions and for crashworthiness may be inconsistent. ([152]: 85) 10 Begriff nach Behnke (98/H: 56). 11 Crash analysis simulate fast phenomena requiring a transient analysis. [ ] crush analysis simulate slow phenomena that are appropriately analysed using static analysis procedures or implicit dynamic techniques ([058]: 31). 14

larger parts are defined as rigid and for modeling almost rigid connections such as rivets often constraint conditions which are essentially small rigid bodies are used. Almost arbitrary joints and hinges can also be defined to allow a simple modeling of partially flexible connections. [ ] current fine meshes with element lengths of about 4 mm ([055]: 2). An der Beschreibung ist zu erkennen, dass das Verhalten vollständiger Fahrzeugmodelle mittels vieler verschiedener Subsysteme beschrieben wird. Subsysteme können einzelne Deformationselemente, Werkstoffprüflinge aus Metalllegierungen, Verbundmaterialien (composites) oder Hauptwabenstrukturen (honeycombs) sein. Auch das Verhalten von Verbindungselementen wie Klebeverbindungen (adhesive joints) ist zu berücksichtigen. Systeme, in denen das Verhalten physikalisch unterschiedlicher Komponenten berücksichtigt wird 12, werden auf Englisch multibody-systems genannt. 13 Der hohe Grad an Modellierungsgenauigkeit wird durch die zunehmende Rechenleistung der zur Simulation verwendeten Computer ermöglicht. Zur Beschreibung der oben erwähnten Substrukturen und auch der Multibody Systeme reicht die FEM alleine nicht mehr aus, so dass neue numerische Methoden nötig sind. Methoden zur Beschreibung von Subsystemen sind u. a. die Boundary Element Methode (BEM), [an] effective alternative to the traditional finite element (FEM) approaches in the shape optimization context [114]), die Virtual Distortion Method, (VDM, [115]), oder die space mapping (SM) technique [132] zu nennen. Bei der Beschreibung vollständiger Fahrzeugmodelle liegt der Schwerpunkt in der Analyse der Randbedingungen (boundary conditions). Hierfür wird beispielsweise die Response Surface Method (RSM) eingesetzt: Response surface methodology, a global approximation method developed [ ] to solve structural optimization problems with smooth design functions [...] as well as problems with noisy response e.g. high speed civil transport design [...], vehicle crashworthiness design 12 Zum Beispiel: a multibody formulation, which includes features from the hybrid formulations and modeling capabilities generally associated to the finite element method, is used to represent the crashworthy system. [029] 13 Einige Systeme lassen sich nicht direkt modellieren. In den Korpustexten ist dann vom Metamodelling die Rede. In Korpustext [137] wird dies wie folgt beschrieben: In the metamodeling approach, an approximate model of the true response function whose explicit form is not available is created using function values at some design points. Optimization is then performed on the metamodels [024]. In [137] wird das Metamodell wie folgt beschrieben: [a] model with a less computationally intensive model known as a metamodel, built from computational experiments. ). 15

optimization (Etman et al. 1996) and maximization of crushing energy absorption of cylindrical shells (Yamazaki et al. 1997). ([146]: 278) Für die Simulation stehen eine Reihe kommerzieller, auf der FEM basierender Softwaresysteme zur Verfügung, die jedoch zum eil schon neuere Methoden für die Berechnung von Substrukturen beinhalten. Zu nennen sind u. A. folgende FE-basierten Systeme zu nennen: explicit FE programs such as LS-DYNA [055], the explicit Finite Element (FE) code (PAM-CRASH) which is suited for more detailed local analysis of a substructure or structural element [043], DYNA3D, a displacement-based nonlinear explicit finite element code [ ] for simulating the behavior of composite structures [036], ABAQUS, Radioss, oder KRASH, the hybrid code (KRASH), which is appropriate for global crash analysis of a complete vehicle structure [043]. Aufgrund steigender Leistungsfähigkeit der Computer vollzieht sich zur Zeit ein Paradigmenwechsel in der Aufprallsimulation: Anstatt erste Simulationen erst im Anschluss an Fertigstellung und esten des ersten Prototyps durchzuführen, wird die während eines Aufpralls wirkende dynamische Kraft (dynamic load) bereits in die Designsoftware eines Fahrzeugs integriert. Mithilfe sich aktiv verformender Elemente (structural fuses) werden solche plötzlich auftretenden Belastungen also bereits während des Entwurfs von Fahrzeugen berücksichtigt: smart technologies [numerical tools for the structural design including dynamic loads] have been developing fast over the last decade, giving hope for more sophisticated solutions, taking advantage from real-time impact load identification (cf. Sekua et al. 2006) and plastic-like adaptation of predesigned active elements (so-called structural fuses) to the actual impact loads ([115]: 305). 14 Fachartikeln zu allen der hier besprochenen Simulationen sind für das Korpus relevant. Da für Aufprallsimulationen ganzer Fahrzeuge (full vehicle) auch die Modellierung grundlegender Strukturen erforderlich ist, sind Fachartikel, die sich mit deren Modellierung befassen für das Korpus genauso relevant wie Fachartikel die die Aufprallsimulation vollständiger Fahrzeuge beschreiben. 14 Der Einsatz solcher sich aktiv verformender Elemente zur Optimierung des Designs von Fahrzeugen bezüglich der Absorption von Aufprallkräften wird im Englischen mit AIA abgekürzt: a methodology for optimal design of such adaptive structures for adaptive impact absorption (AIA) ([115]: 305). 16

3 Fachsprache der numerischen Simulation Unter einer FACHSPRACHE verstehen wir eine für die Kommunikation unter Fachvertretern von endenzen zur Normung, Formalisierung und Internationalisierung mehr oder weniger stark geprägte funktionale Variante einer natürlichen Sprache. Sie bedient sich spezieller sprachlicher Mittel (das betrifft auch Elemente künstlicher Zeichensysteme: Symbole, Formeln), aber auch weitgehend der allgemeinsprachlichen Mittel (REINHARD E AL. (92/L: 2)). Die Sprache des numerischen Simulierens ist in hohem Grad internationalisiert. Die Fachvertreter sind hier numerische Simulationsmethoden entwickelnde und anwendende internationale Wissenschaftler und Ingenieure, die die englische Sprache für die Kommunikation verwenden. Die zugrunde liegende natürliche Sprache (ebd.) ist die englische Gemeinsprache von englischen Muttersprachlern und Nicht-Muttersprachlern. Die Fachvertreter bedienen sich spezieller sprachlicher Mittel (ebd.) wie mathematischer Symbole und Formeln und es kann angenommen werden, dass Fachbegriffe aus der Numerik enthalten sind, so dass ein ausgeprägter Fachwortschatz vorliegt. Auch über eine Schwerpunktverschiebung gemeinsprachlicher Mittel, wie Roelke (99/L: 71) dies für die Grammatik von Fachsprachen fordert, die gegenüber der allgemeinsprachlichen Grammatik kaum qualitative, sondern nahezu ausschließlich quantitative Unterschiede aufweist, verfügt die Sprache des numerischen Simulierens aufgrund ihrer wissenschaftlichen Funktion. Somit erfüllt diese alle von Reinhardt et al. (ebd.) geforderten Eigenschaften einer Fachsprache. Verwendet man die Definition für Fachsprache von Lothar Hoffmann (1976: 170) Fachsprache das ist die Gesamtheit aller sprachlichen Mittel, die in einem fachlich begrenzbaren Kommunikationsbereich [zur Verständigung] verwendet werden, so gibt es 'die Fachsprache des numerischen Simulierens' eigentlich nicht. Numerische Simulationen werden nämlich nicht in einem fachlich begrenzbaren Kommunikationsbereich (ebd.) eingesetzt, sondern in vielen verschiedenen ingenieur- und naturwissenschaftlichen Anwendungsgebieten. Es handelt sich dabei jeweils um Arbeitsgruppen, die numerische Simulationen einsetzen, um Fragestellungen des jeweiligen Fachgebietes zu beantworten. Weiterentwicklungen numerischer Methoden werden vorwiegend an Kollegen innerhalb des jeweiligen Fachbereichs kommuniziert; mit numerischen Methoden arbeitende Wissenschaftler kommunizieren seltener mit Fachleuten anderer numerischer Anwendungsgebiete oder mit Mathematikern aus der Numerik (Numerikern). Dennoch weist der Gegenstand der Beschreibung in den unterschiedlichen numerischen Anwendungsgebieten viele Gemeinsamkeiten auf wie zum Beispiel die Modellbildung und damit verbundene Diskretisierung, die Wahl der Form des Gitters bzw. der Elemente, die Implementierung von Algorithmen, und die Parallelisierung (siehe I 2 Numerische Simulation). Aufgrund dieser Gemeinsamkeiten des 17

Beschreibungsgegenstandes und des gemeinsamen Ursprungs der Methoden wird argumentiert, dass die Sprache numerisch arbeitender Fachleute, trotz der Verschiedenheit der Inhalte der Anwendungsgebiete, die Merkmale der Sprache eines fachlich begrenzbaren Kommunikationsbereichs aufweist. Daher wird im Folgenden von der 'Fachsprache des numerischen Simulierens' gesprochen. Den Schwerpunkt der Fachsprachenforschung bilden Untersuchungen zum Fachwortschatz (Lexikologie) und zur Erstellung von Fachwörterbüchern (Lexikographie). Aber auch Syntax und Morphologie sind Gegenstand der Fachsprachenforschung und spielen beispielsweise in der maschinellen Übersetzung von Fachtexten eine Rolle. Insgesamt zeichnet sich die Fachsprachenforschung durch eine starke [ ] endenz zur Präskription (ROELKE 99/L: 105) aus. In der Regel findet eine Normierung des Fachwortschatzes statt. eilweise sind Lexik und Syntax vorgeschrieben (kontrollierte Sprache). Um die fachsprachlichen Eigenschaften der Sprache des numerischen Simulierens in den oben genannten linguistischen Bereichen umfassend zu beschreiben, müsste die Sprache möglichst vieler numerischer Anwendungsgebiete, deren gemeinsamer Basisdisziplin, der Numerik und der reinen Fachgebiete untersucht werden. Da aber die Varietäten von Fachsprache im Bereich der echnik und der Naturwissenschaften bereits umfangreich beschrieben sind, soll der Schwerpunkt der vorliegenden Arbeit auf der Untersuchung der Beschreibung der vergleichsweise jungen Wissenschaftsmethode der numerischen Simulation auf dem Gebiet der Aufprallsimulationen von Fahrzeugen und deren erminologisierung liegen (deskriptive Zielsetzung). Wann aber ist eine Fachsprache konsolidiert? Fritzinger et al. (09/Z: 11) haben die Verwendung von Adverbien und Adjektiven in zwei juristischen Fachsprachen untersucht und am Beispiel von Adverbien gezeigt, dass die Menge verwendeter Modifikatoren in Fachwendungen stark begrenzt ist, während in der Gemeinspache eine deutlich höhere Anzahl an verschiedenen Modifikatoren verwendet wird. Ein Maß für die erminologisierung ist die Entropie. Diese ist für terminologisierte Adjektive innerhalb von Fachsprachen klein, wohingegen die Gemeinsprache eine höhere Variation von Adjektiven aufweist, so dass für diese eine höhere Entropie messbar ist. Es stellt sich nun die Frage, welche extsorten und welches Register sich für die Beantwortung der Fragestellungen eignen. Da das Ziel der vorliegenden Arbeit die Untersuchung der Fachsprache von numerische Simulationen entwickelnden und anwendenden Fachleuten ist, müssen diese die Sender des Sprachmaterials sein. Dies ist der Fall bei Fachbüchern und Fachzeitschriftenartikeln des Anwendungsgebietes. Fachzeitschriftenartikel haben in Hinblick auf die Ausgewogenheit eines 18

Korpus den Vorteil, dass sie einen relativ geringen Umfang von selten mehr als 40 Seiten haben. Dies ermöglicht, Veröffentlichungen verschiedener Autoren aus unterschiedlichen Ländern komplett zu übernehmen, ohne aufgrund von Kürzungen thematische Bereiche einzelner Veröffentlichungen ausklammern zu müssen. Göpferich (98/L: 90) bezeichnet Fachzeitschriftenartikel als eine fortschrittsorientiertaktualisierende Fachtexttypenvariante und unterscheidet zwischen faktenorientierten und publizistischen Fachzeitschriftenartikeln. Da für Letztere erstens nicht sicher gestellt werden kann, dass diese unmittelbar aus der Feder von Fachleuten stammen, und außerdem die Fachsprache in einer publizistischen Veröffentlichung von gemeinsprachlichen Wendungen durchdrungen ist, werden für die Untersuchung nur faktenorientierte Fachzeitschriftenartikel verwendet. Zusätzlich zur geschriebenen Sprache ist auch die gesprochene Sprache für die Untersuchung der Fachsprache relevant. Allerdings ist die Einbeziehung gesprochener Sprache für korpuslinguistische Untersuchungen mit einem hohen Aufbereitungsaufwand verbunden. Erstens sind inhaltlich geeignete Daten vermutlich nicht verfügbar und müssten eigens für die Untersuchung erhoben werden. Zweitens ist es nötig, akustisch erhobene Daten in geschriebenen ext zu transkribieren und in ein vom Computer lesbares Format zu bringen. Fachzeitschriftenartikel zu dem gewählten Anwendungsgebiet hingegen sind in Bibliotheken vor Ort verfügbar, so dass diese die Grundlage der Untersuchungen bilden. Hinsichtlich der an der Kommunikation mittels Fachzeitschriftenartikeln beteiligten Personen ist festzustellen, dass sowohl Sender als auch Empfänger Fachleute (Symmetrie) entweder Angehörige desselben Anwendungsgebietes ( intrafachliche Kommunikation (ROELKE 99/L: 23)) oder, deutlich seltener, verschiedener Anwendungsgebieten des numerischen Simulierens ( interfachliche Kommunikation (ebd.)) sind. Der Grund hierfür ist, dass nicht die Entwicklung von Methoden sondern die Beantwortung von Anwendungsgebiet-spezifischen Fragestellungen Ziel der Simulationen ist. Abgesehen von einigen wenigen Wissenschaftlern anderer Anwendungsgebiete, die ähnlich geartete Fragestellungen beantworten möchten, besteht der Adressatenkreis der Fachartikel somit in der Regel aus der internationalen Forschergemeinschaft des jeweiligen Anwendungsgebietes. Für mit der numerischen Simulation befasste Fachleute liegt eine vertikale Schichtung vor; erstens gibt es die Numeriker, die numerische Methoden entwickeln (heoriesprache, sehr hoher Grad der Abstraktion), zweitens konkrete Simulationen umsetzende und anwendende Wissenschaftler und Ingenieure (heoriesprache, hoher Grad der Abstraktion) und numerische Ergebnisse verwendende Fachpersonen (Werkstattsprache, niedriger Grad der Abstraktion). Die fachsprachlichen Varietäten, 19

die sich aus der vertikalen Schichtung ergeben, sind jedoch nicht Gegenstand der Untersuchung. (vgl. a. a. O.: 38 42) Die Untersuchung der Fachsprache des numerischen Simulierens könnte sich auf von englischen Muttersprachlern verfasste exte beschränken. Dies hätte den Vorteil, dass die Beherrschung der englischen Gemeinsprache seitens der Sender sichergestellt wäre und die Rohdaten von sprachlich hoher Qualität sein dürften. Dies widerspräche jedoch dem korpuslinguistischen Anspruch, die natürliche Sprachverwendung zu untersuchen, denn die Sprache des numerischen Simulierens ist, wie bereits erwähnt, stark internationalisiert, so dass eine Eingrenzung auf nur von englischen Muttersprachlern verfasste Fachzeitschriftenartikel nur einen Ausschnitt der Fachsprache des numerischen Simulierens wiedergeben würde. Der Grad der Rezeptionskompetenz (ROELKE 99/L: 154) und Produktionskompetenz (ebd.) der Nicht-Muttersprachler hängt vermutlich vom Grad der fachlichen Ausbildung ab. Der fachlich voll ausgebildete Nicht-Muttersprachler sollte jedoch ein dem muttersprachlichen Wissenschaftler vergleichbares fachsprachliches Niveau erreicht haben und somit auch in der Lage sein, exte ähnlicher Qualität zu verfassen. 15 15 Für den Fall, dass Adressatenkreis-spezifische Suchanfragen nötig sind, wird das Land des Institutes der veröffentlichenden Wissenschaftler im Korpus annotiert. 20