Spezialisierte adaptive Algorithmen für die Modellprädiktive Regelung von PDEs Lehrstuhl für Angewandte Mathematik Mathematisches Institut Universität Bayreuth 28.02.2018 12. Elgersburg Workshop (26.02. - 01.03.2018) Lars Grüne, Manuel Schaller und Anton Schiela
Gliederung 1 Einführung 2 Sensitivitätsanalyse 3 Numerische Ergebnisse Manuel Schaller spez. Alg. für MPC von PDEs 1 / 17
Einführung Inhalt 1 Einführung Manuel Schaller spez. Alg. für MPC von PDEs 2 / 17
Einführung Was ist Modellprädiktive Regelung (MPC)? Technik zur Konstruktion von Feedback-Controllern Optimalsteuerungsproblem auf großem (unendlichem) Zeithorizont L viele Optimalsteuerungsprobleme mit (endlichem) kürzerem Horizont T, T L Manuel Schaller spez. Alg. für MPC von PDEs 2 / 17
Einführung Was ist Modellprädiktive Regelung (MPC)? Technik zur Konstruktion von Feedback-Controllern Optimalsteuerungsproblem auf großem (unendlichem) Zeithorizont L viele Optimalsteuerungsprobleme mit (endlichem) kürzerem Horizont T, T L One technique for obtaining a feedback controller synthesis from knowledge of open-loop controllers is to measure the current control process state and then compute very rapidly for the open-loop control function. The first portion of this function is then used during a short time interval, after which a new measurement of the process state is made and a new open-loop control function is computed for this new measurement. The procedure is then repeated. - Foundations of optimal control theory, Lee and Markus, 1967 Manuel Schaller spez. Alg. für MPC von PDEs 2 / 17
Einführung Der MPC-Algorithmus System Manuel Schaller spez. Alg. für MPC von PDEs 3 / 17
Einführung Der MPC-Algorithmus Zustand OSP auf [0, T ] System Manuel Schaller spez. Alg. für MPC von PDEs 3 / 17
Einführung Der MPC-Algorithmus Zustand OSP auf [0, T ] System T min J(y, u) 0 s.t. c(y, u) = 0 Manuel Schaller spez. Alg. für MPC von PDEs 3 / 17
Einführung Der MPC-Algorithmus Zustand OSP auf [0, T ] System Anfangsstück der Kontrolle u [0,τ] T min J(y, u) 0 s.t. c(y, u) = 0 Manuel Schaller spez. Alg. für MPC von PDEs 3 / 17
Einführung Die exponentielle Turnpike Eigenschaft Bestimmtes Verhalten von Lösungen zeitabhängiger Optimalsteuerungsprobleme Aktuelle Resultate von Porretta und Zuazua (2013,2016), Trélat und Zuazua (2015) und Trélat et al.(2016) t = 0 Lösung des OSP Turnpike t = T Manuel Schaller spez. Alg. für MPC von PDEs 4 / 17
Einführung Motivation für die Sensitivitätsanalyse t = 0 τ Lösung gestörte Lösung t = T verwendet im MPC-Alg. Manuel Schaller spez. Alg. für MPC von PDEs 5 / 17
Einführung Motivation für die Sensitivitätsanalyse t = 0 τ Lösung gestörte Lösung t = T verwendet im MPC-Alg. Wie modelliert man Diskretisierungsfehler als Störungen? Für gew. Dgl, vgl. Gear (1971): ẋ = f(x(t), t) x = f( x(t), t) + ε(t) ε(t) Gittergrobheit Manuel Schaller spez. Alg. für MPC von PDEs 5 / 17
Einführung Einordnung und Überblick Gitter, die in der Zeit exponentiell gröber werden Manuel Schaller spez. Alg. für MPC von PDEs 6 / 17
Einführung Einordnung und Überblick Gitter, die in der Zeit exponentiell gröber werden Störungen ε, die in der Zeit exponentiell wachsen Manuel Schaller spez. Alg. für MPC von PDEs 6 / 17
Einführung Einordnung und Überblick Gitter, die in der Zeit exponentiell gröber werden Störungen ε, die in der Zeit exponentiell wachsen Sensitivitätsanalyse Fehler die in der Zeit exponentiell wachsen Manuel Schaller spez. Alg. für MPC von PDEs 6 / 17
Einführung Einordnung und Überblick Gitter, die in der Zeit exponentiell gröber werden Störungen ε, die in der Zeit exponentiell wachsen Sensitivitätsanalyse Fehler die in der Zeit exponentiell wachsen Konsequenzen im MPC-Kontext: Verwendete Kontrolle u [0,τ] ist sehr genau Effiziente Lösung der zugrundeliegenden Optimalsteuerungsprobleme durch spezielle Gitter Manuel Schaller spez. Alg. für MPC von PDEs 6 / 17
Einführung Lineare parabolische partielle Differentialgleichungen Bochnerraum L 2 (0, T ; V ), Gelfand-Dreier V H V Schwache Zeitableitung D : W ([0, T ]) L 2 (0, T ; V ) H, T (Dw)(v, v 0 ) := w (t)(v(t)) dt + w(0), v 0 H. Schwache Ortsableitung, Transportterme... Λ : L 2 (0, T ; V ) L 2 (0, T ; V ) Kontrolleinfluss B : L 2 (0, T ; L 2 (Ω)) L 2 (0, T ; H). 0 Manuel Schaller spez. Alg. für MPC von PDEs 7 / 17
Einführung Lineare parabolische partielle Differentialgleichungen Bochnerraum L 2 (0, T ; V ), Gelfand-Dreier V H V Schwache Zeitableitung D : W ([0, T ]) L 2 (0, T ; V ) H, T (Dw)(v, v 0 ) := w (t)(v(t)) dt + w(0), v 0 H. Schwache Ortsableitung, Transportterme... Λ : L 2 (0, T ; V ) L 2 (0, T ; V ) Kontrolleinfluss B : L 2 (0, T ; L 2 (Ω)) L 2 (0, T ; H). lineare part. Dgl (vgl. Schiela (2013)) Dy Λy Bu = y 0, 0 Manuel Schaller spez. Alg. für MPC von PDEs 7 / 17
Einführung Optimalsteuerungsprobleme Wir behandeln das Optimalsteuerungsproblem min y,u 1 2 C(y y d) 2 L 2 ([0,T ] Ω) + α 2 R(u u d) 2 L 2 ([0,T ] Ω) s.t. Dy Λy Bu = y 0, C linear beschränkt, R linear, beschränkt und invertierbar. Manuel Schaller spez. Alg. für MPC von PDEs 8 / 17
Einführung Optimalsteuerungsprobleme Wir behandeln das Optimalsteuerungsproblem min y,u 1 2 C(y y d) 2 L 2 ([0,T ] Ω) + α 2 R(u u d) 2 L 2 ([0,T ] Ω) s.t. Dy Λy Bu = y 0, C linear beschränkt, R linear, beschränkt und invertierbar. Optimalitätsbedingungen: C M y C 0 (D Λ) y C M y Cy d 0 αr M u R B u = αr M u Ru d (D Λ) B 0 λ y 0, ( C M y C (D Λ) ) ( ) ( y C (D Λ) BQ 1 B = ) M y Cy d, λ y 0, + Bu d }{{} =:M wobei Q := αr M u R und u = Q 1 B λ + u d. (Elimination der Kontrolle) Manuel Schaller spez. Alg. für MPC von PDEs 8 / 17
Sensitivitätsanalyse Inhalt 2 Sensitivitätsanalyse Manuel Schaller spez. Alg. für MPC von PDEs 9 / 17
Sensitivitätsanalyse Eine Gleichung für den absoluten Fehler M Exakte Lösung ( ) ( y C = ) M y Cy d λ y 0, + Bu d Manuel Schaller spez. Alg. für MPC von PDEs 9 / 17
Sensitivitätsanalyse Eine Gleichung für den absoluten Fehler M Exakte Lösung ( ) ( y C = ) M y Cy d λ y 0, + Bu d Gestörte Lösung (ỹ ) ( C M = ) M y Cy d + λ y 0, + Bu d ( ε1 ε 2 ) Manuel Schaller spez. Alg. für MPC von PDEs 9 / 17
Sensitivitätsanalyse Eine Gleichung für den absoluten Fehler M Exakte Lösung ( ) ( y C = ) M y Cy d λ y 0, + Bu d Gestörte Lösung (ỹ ) ( C M = ) M y Cy d + λ y 0, + Bu d ( ε1 ε 2 ) (ỹ ) y M = λ λ }{{} =:(δy,δλ) ( ε1 ε 2 ) (1) Absoluter Fehler Manuel Schaller spez. Alg. für MPC von PDEs 9 / 17
Sensitivitätsanalyse Eine Gleichung für den absoluten Fehler M Exakte Lösung ( ) ( y C = ) M y Cy d λ y 0, + Bu d Gestörte Lösung (ỹ ) ( C M = ) M y Cy d + λ y 0, + Bu d ( ε1 ε 2 ) (ỹ ) y M = λ λ }{{} =:(δy,δλ) ( ε1 ε 2 ) (1) Absoluter Fehler Wie beeinflusst das zeitliche Verhalten von (ε 1, ε 2 ) das zeitliche Verhalten des absoluten Fehlers (δy, δλ)? Manuel Schaller spez. Alg. für MPC von PDEs 9 / 17
Sensitivitätsanalyse Einfluss von Störungen wird exponentiell gedämpft Theorem (Grüne, S., Schiela, 2018) Angenommen (δy, δλ) W ([0, T ]) 2 löst (1). Sei X := L 2 (0, T ; H) 0 µ < 1 M 1 (X ) 2 X 2 e µt ε 1 (t) X + e µt ε 2 (t) X ρ, ρ 0 Dann existiert eine Konstante c 1 0 sodass e µt δy X + e µt δu U + e µt δλ X c 1 M 1 (X ) 2 X 2ρ, Manuel Schaller spez. Alg. für MPC von PDEs 10 / 17
Sensitivitätsanalyse Einfluss von Störungen wird exponentiell gedämpft Theorem (Grüne, S., Schiela, 2018) Angenommen (δy, δλ) W ([0, T ]) 2 löst (1). Sei X := L 2 (0, T ; H) 0 µ < 1 M 1 (X ) 2 X 2 e µt ε 1 (t) X + e µt ε 2 (t) X ρ, ρ 0 Dann existiert eine Konstante c 1 0 sodass e µt δy X + e µt δu U + e µt δλ X c 1 M 1 (X ) 2 X 2ρ, Interpretation: ε(t) L 2 H ρe µt L δy(t) 2 H ρ wenn t klein Manuel Schaller spez. Alg. für MPC von PDEs 10 / 17
Sensitivitätsanalyse Neue Fragestellung Inwiefern hängt M 1 (L2 (0,T ;H) ) 2 L 2 (0,T ;H) 2 ab? von T Manuel Schaller spez. Alg. für MPC von PDEs 11 / 17
Sensitivitätsanalyse Stabilität von part. Differentialgleichungen Definition Ein linearer Operator S heißt exponentiell stabil, wenn es eine Lösung y W [0, T ] von (Dy)(v, v 0 ) Syv = y 0, v 0 (v, v 0 ) L 2 (0, T ; V ) H gibt, für die gilt, wobei M, k > 0. y(t) H Me kt y 0 H t [0, T ] Manuel Schaller spez. Alg. für MPC von PDEs 12 / 17
Sensitivitätsanalyse Abschätzung der Operatornorm M 1 min y,u 1 2 C(y y d) 2 L 2 ([0,T ] Ω) + α 2 R(u u d) 2 L 2 ([0,T ] Ω) s.t. Dy Λy Bu = y 0, Definition (Λ, B) exp. stabilisierbar, wenn es einen Feedback-Operator K B gibt, sodass Λ + BK B exp. stabil ist. (Λ, C) exp. entdeckbar, wenn (Λ, C ) exp. stabilisierbar. Theorem (Grüne, S., Schiela, 2018) Sei (Λ, B) exp. stabilisierbar, (Λ, C) exp. entdeckbar, dann M 1 L2 (0,T ;H ) 2 L 2 (0,T ;H) 2 c, c unabhängig von T Manuel Schaller spez. Alg. für MPC von PDEs 13 / 17
Numerische Ergebnisse Inhalt 3 Numerische Ergebnisse Manuel Schaller spez. Alg. für MPC von PDEs 14 / 17
Numerische Ergebnisse Ein Modellproblem Beispiel min (y,u) 30 s.t. (Dy)(v, v 0 ) + 1 2 (y y d) 2 L 2 ([0,30] [0,1] 2 ) + α 2 u 2 L 2 ([0,30] [0,1] 2 ) 30 d y v dωdt uv dωdt = 0 (v, v 0 ) 0 [0,1] 2 0 [0,1] (ẏ 2 ) d y = u, y(0) = 0 (starke Formulierung) exponentielles Gitter uniformes Gitter 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 Manuel Schaller spez. Alg. für MPC von PDEs 14 / 17
Numerische Ergebnisse Open-loop Fehler 0.02 Norm der Lösung 10 0 Absoluter Fehler y(t) H u(t) H 0.015 0.01 0.005 0 0.05 0.04 0.02 exakte Lösung exponentielles Gitter uniformes Gitter δy(t) H δu(t) H 10 6 10 12 10 1 10 7 λ(t) H 0 6 4 2 δλ(t) H 10 15 10 1 10 7 exponentielles Gitter uniformes Gitter 0 0 5 10 15 20 25 30 10 15 0 5 10 15 20 25 30 time t time t Manuel Schaller spez. Alg. für MPC von PDEs 15 / 17
Numerische Ergebnisse Closed-loop Kosten: uniformes vs. exponentielles Gitter Zielfunktionswert 0.04 0.03 0.02 0.015 0.01 Stabile Dynamik 1 uniformes Gitter exponentielles Gitter Referenz 0.008 3 6 11 21 41 1 Instabile Dynamik 1 0.035 0.03 Stabile Dynamik 2 0.0272 3 4 5 6 8 10 Instabile Dynamik 2 Zielfunktionswert 0.1 0.014 3 4 5 6 8 #Gitterpunkte 1 0.1 0.03 0.01 8 21 41 61 #Gitterpunkte Manuel Schaller spez. Alg. für MPC von PDEs 16 / 17
Numerische Ergebnisse Offene Fragen und Ausblick Abschätzung in L 2 (0, T ; H)-Norm ( Stabilität in V -Sinn?) Erweiterung für Randkontrolle Nichtlineare Optimalsteuerungsprobleme Konstruktion von Algorithmen Manuel Schaller spez. Alg. für MPC von PDEs 17 / 17
Numerische Ergebnisse Offene Fragen und Ausblick Abschätzung in L 2 (0, T ; H)-Norm ( Stabilität in V -Sinn?) Erweiterung für Randkontrolle Nichtlineare Optimalsteuerungsprobleme Konstruktion von Algorithmen Danke für die Aufmerksamkeit! Manuel Schaller spez. Alg. für MPC von PDEs 17 / 17
Eine exponentielle Turnpike Eigenschaft Statisches Optimalsteuerungsproblem 1 min ȳ,ū 2 C(ȳ y d) 2 L 2 (Ω) + α 2 R(ū u d) 2 L 2 (Ω) s.t. Λȳ Bū = 0. Optimalitätsbedingungen ( C M y C (D Λ) ) ( ) y ȳ (D Λ) BQ 1 B λ λ = }{{} (δy,δλ) T ( ) λ, y 0 ȳ, (2) Manuel Schaller spez. Alg. für MPC von PDEs 1 / 2
Eine exponentielle Turnpike Eigenschaft Theorem Angenommen (δy, δλ) löst (2). Dann gibt es 0 µ 1 M 1 (X H) 2 X 2 sodass 1 e µt + e µ(t t) δy 1 X + e µt + e µ(t t) δu 1 U + e µt + e µ(t t) δλ X c 2 M 1 (X H) 2 X 2( y 0 ȳ H + λ H ) Manuel Schaller spez. Alg. für MPC von PDEs 2 / 2