Einführung in NLP mit Deep Learning

Ähnliche Dokumente
Neural Networks: Architectures and Applications for NLP

Neural Networks: Architectures and Applications for NLP

Neural Networks: Architectures and Applications for NLP

Neural Networks: Architectures and Applications for NLP

Einführung in die Computerlinguistik

Machinelles Lernen. «Eine kleine Einführung» BSI Business Systems Integration AG

Neural Networks: Architectures and Applications for NLP

Reinforcement Learning

Exploring the knowledge in Semi Structured Data Sets with Rich Queries

Neural Networks: Architectures and Applications for NLP

Cognitive Solutions und IBM Watson

Anwendung von Vektormodell und boolschem Modell in Kombination

Universität Karlsruhe (TH)

LOG AND SECURITY INTELLIGENCE PLATFORM

Kybernetik Einführung

Neuronale Netze. Automatische Hinderniserkennung Paul Fritsche

"What's in the news? - or: why Angela Merkel is not significant

Was ist, kann und darf Deep Learning? Dr. Beat Tödtli Laboratory for Web Science

Emotion Recognition of Call Center Conversations Robert Bosch Engineering and Business Solutions Private Limited

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion

Kanton Zürich Direktion der Justiz und des Innern Staatsarchiv. Project. Automatisierte Handschriftenerkennung. Tobias Hodel (Staatsarchiv Zürich)

CC-Club Kongress Bruchsal George Orwell läßt Grüßen

Neue Erkenntnisse aus unstrukturierten Daten gewinnen

Neuronale Netze. Christian Böhm.

Künstliche Intelligenz

Voice Assistants. What s new in Amazon s Alexa / Google s Assistant. Dominik Helleberg / Sebastian Messingfeld

Deep Learning für Automatische Dokumentanalyse

Fachübersetzen - Ein Lehrbuch für Theorie und Praxis

Big Data Künstliche Intelligenz Und das Ich

Konzepte der AI Neuronale Netze

DevOps. Alexander Pacnik, Head of DevOps Engineering

Lektion 9: Konjugation von Verben im Präsens (conjugation of verbs in present tense)

Objektorientierte Datenbanken

Entwicklung einer KI für Skat. Hauptseminar Erwin Lang

Watson für Handelsunternehmen Kognitive Texterkennung für den deutschen Handelsmarkt

August Macke Abschied, 1914 Museum Ludwig, Köln

Organisatorisches. Unit1: Intro and Basics. Bewertung. About Me.. Datenorientierte Systemanalyse. Gerhard Wohlgenannt

Wir haben in den vorherigen Kapiteln verschiedene Verfahren zur Regression und Klassifikation kennengelernt (z.b. lineare Regression, SVMs)

Einführung in die Methoden der Künstlichen Intelligenz

Browser- gestützte Visualisierung komplexer Datensätze: Das ROAD System

Künstliche Intelligenz

Echtzeitfähige Algorithmen für markerloses Tracking und Umfelderkennung , Dr.-Ing. Steffen Herbort, A.R.T. GmbH

Bioinformatik I (Einführung)

Natural Language Processing

Killy Literaturlexikon: Autoren Und Werke Des Deutschsprachigen Kulturraumes 2., Vollstandig Uberarbeitete Auflage (German Edition)

NoSQL & Big Data. NoSQL Databases and Big Data. NoSQL vs SQL DBs. NoSQL DBs - Überblick. Datenorientierte Systemanalyse. Gerhard Wohlgenannt

NoSQL Databases and Big Data

Die besten Chuck Norris Witze: Alle Fakten über den härtesten Mann der Welt (German Edition)

Introduction to Python. Introduction. First Steps in Python. pseudo random numbers. May 2016

Künstliche Neuronale Netze

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank

Arbeitsblatt Nein, Mann!

Maschinelles Lernen: Neuronale Netze. Ideen der Informatik

Hackerpraktikum SS 202

Bayesian updating in natural hazard risk assessment

Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume

Maschinelle Analyse und Übersetzung natürlicher Sprachen

END OF TERM 1 EXAM 2018 Y3 REVISION

Bachelorarbeit (Informatik) Machine Learning bei Textanalyse: Weiss mein Computer wie alt ich bin?

ISO Reference Model

Florian Hopf elasticsearch. Bern

Faszination Ecstasy - Inbegriff der Technokultur mit hohem Risikopotential (German Edition)

Extraktion und Visualisierung von multidimensionalen Textinformationen zur Integration von Big Data in unternehmensspezifischen Wissenslandkarten

Florian Hopf elasticsearch.

Kämpferherz: Das wilde Abenteuer, ein echter Mann zu werden (German Edition)

Reinforcement-Learning

Context-adaptation based on Ontologies and Spreading Activation

Kursbuch Naturheilverfahren: Curriculum der Weiterbildung zur Erlangung der Zusatzbezeichnung Naturheilverfahren (German Edition)

Von der Entscheidungsunterstützung zur Entscheidungsautomatisierung mit Big Data und Künstlicher Intelligenz

Kapitel LF: I. Beispiele für Lernaufgaben. Beispiele für Lernaufgaben. LF: I Introduction c STEIN

TH Köln Institute of Agricultural Engineering and Renewable Energies. TU-Dresden Chair of Agricultural Systems and Technology

Nürnberg und der Christkindlesmarkt: Ein erlebnisreicher Tag in Nürnberg (German Edition)

DATA ANALYSIS AND REPRESENTATION FOR SOFTWARE SYSTEMS

New Trends in Business Management Theory Consequences for SME. Neue Trends in der Managementlehre Konsequenzen für KMU

Analyse und Interpretation der Kurzgeschichte "Die Tochter" von Peter Bichsel mit Unterrichtsentwurf für eine 10. Klassenstufe (German Edition)

Institut für Künstliche Intelligenz

EINSPEISEMANAGEMENT: GRUNDLAGEN, ANALYSE- UND PROGNOSEMÖGLICHKEITEN

Text Mining. A new approach in FFG to achieve deeper insights into project data. TAFTIE Expert Session Sept 14, 2017

Listening Comprehension: Talking about language learning

Einsatz einer Dokumentenverwaltungslösung zur Optimierung der unternehmensübergreifenden Kommunikation

Die Zukunft der Zeitung

Lies doch mal! 2: 50 wichtige Jugendbücher (German Edition)

Informationsveranstaltung Master Wiwi. Major: Finance. Prof. Dr. Marcel Prokopczuk, CFA Institut für Finanzmarkttheorie

H Mcast Future Internet made in Hamburg?

auf differentiellen Leitungen

Wissensentdeckung in Datenbanken

Modellfreie numerische Prognosemethoden zur Tragwerksanalyse

Education Day Wissensgold aus Datenminen: wie die Analyse vorhandener Daten Ihre Performance verbessern kann! Education Day

Hybrid approach of neural networks with knowledge based explicit models with applications to a ping pong playing robot

Maschinelles Lernen: Neuronale Netze. Ideen der Informatik Kurt Mehlhorn

Vorbesprechung Seminar Biomedical Informatics

jasimasolutions Simulation based process optimization for the agri food sector jasimabeverageplanner jasima Solutions Spin Off from

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen

Username and password privileges. Rechteverwaltung. Controlling User Access. Arten von Rechten Vergabe und Entzug von Rechten DBS1 2004

DIBELS TM. German Translations of Administration Directions

Betriebliche Anspruchsgruppen. Der Shareholder- Value- und der Stakeholder-Value Ansatz (German Edition)

Watson Services on Bluemix Workshop

Transkript:

Einführung in NLP mit Deep Learning Hans-Peter Zorn Minds mastering Machines, Köln, 26.4.2018

NLP ist auf einmal überall Zusammenfassung aggregated reviews Dokumentklassifikation Übersetzung Dialogsysteme / Chatbots Question Answering AI Deep Learning 2

Embed, Encode, Attend, Predict The new deep learning formula for state-of-theart NLP models Matthew Honnibal, explosion.io (SpaCy) - https://explosion.ai/blog/deep-learning-formula-nlp 3

Ein neuronales Netz X Y Hidden 4

Repräsentation von Sprache Bag-of-Words, Vectorspace-Model 1 5 1 Wenn 1 Fliegen 2 Hinter 3 Nach 4 1 Wenn fliegen hinter fliegen fliegen, fliegen fliegen nach Embeddings 5

Embed Encode Attend Predict

0 0 0 0 0 1 0 0 Vectorspace Modell Embed Embeddings 7

Emdedding Table/Layer ID 1 0.905 0.505 0.8750 2.5992.1213.6020 3.8355.758.5278 Effizientes Mapping von Merkmalen zu Embeddings Gewichte beim Training gelernt 8

Pre-trained embeddings Word2vec, GloVe, fasttext King Queen Woman Große Corpora: CommonCrawl, Wikipedia CBOW, Skip-gram, Character-ngrams (Morphologie) 9

Embed Encode Attend Predict

Recurrent Neural Networks hinter wenn Fliegen Input wird schrittweise dem Netz präsentiert Output ist Input für den nächsten Schritt CNN auch möglich 11

Recurrent Neural Networks unfolded A A A A Timesteps Long-term dependencies LSTM/GRU Padding notwendig wenn fliegen hinter fliegen 12

Encoder-Decoder (Seq2Seq) Neural machine translation When flies fly behind Input reversed Fliegen Wenn fliegen hinter hinter fliegen fliegen wenn Sequence to Sequence Learning with Neural Networks, Ilya Sutskever, Oriol Vinyals, Quoc V. Le, 2014 13

Embed Encode Attend Predict Les Chatfield/Flickr

Attention https://www.tensorflow.org/tutorials/seq2seq, CC-BY 3.0 15

Embed Encode Attend Predict

Predict Klassifikation (softmax) Sentiment Inhalt Decoder Zusammenfassung Keyword Extraction 17

Example: Using Natural Language to Query nosql Databases Masterarbeit Sebastian Blank, inovex/kit-aifb Predict 18

Fragen in natürlicher Sprache an Elasticsearch Who was the writer of true lies? James Cameron, Claude Zidi model 19

Fragen in natürlicher Sprache an Elasticsearch Who was the writer of true lies? Question James Cameron, Claude Zidi Answer model Query 20

Reinforcement Learning to the Rescue

Reinforcement Learning Agent interagiert mit Umgebung Lernen und durch Bestrafung/Belohnung Source: Wikipedia/megajuice 22

Model selection & Implementation Basic idea Who was the writer of true lies? James Cameron, Claude Zidi model Query field: Query entity: name true lies Response field: author Zhong, Socher (2017): Seq2SQL: Generating Structured Queries from Natural Language using Reinforcement Learning 23

Model selection & Implementation Basic idea +25 Who was the writer of true lies? James Cameron, Claude Zidi model Query field: Query entity: name true lies Response field: author 25

Model selection & Implementation Basic idea Who was the writer of true lies? -1 Thriller model Query field: Query entity: name true lies Response field: author 26

Model selection & Implementation Basic idea Who was the writer of true lies? -2 <error> model Query field: Query entity: name true lies Response field: author 27

28

What movies did Temuera Morrison act in? After 10 epochs After 20 epochs 29

What movies did Temuera Morrison act in? After 30 epochs After 40 epochs 30

Perfromance-Vergleich MBs 256 31

Generalisierung 32

Conclusion State of the Art DL4NLP: Embed, Encode, Attend, Predict Es funktioniert! Erstaunlich gut auf dem relativ klar definierten Datensatz Mittels Reinforcement Learning können nicht-differenzierbare Bruchstellen (z.b. nosql) überbrückt werden. 33

Vielen Dank! Hans-Peter Zorn Data Management & Analytics Head of Machine Perception & AI inovex GmbH Ludwig-Erhard-Allee 6 76133 Karlsruhe Sie möchten individuelle Beratung? Nehmen Sie Kontakt mit uns auf! info@inovex.de Mobil: +49 (0)173 3181 093 Mail: hzorn@inovex.de