Satz 3.1 (Optimalitätsprinzip), Dynamische Programmierung nach Bellman

Satz 3.1 (Optimalitätsprinzip)

Eine optimale Lösung hat die Eigenschaft, dass bei jedem Punkt dieser Lösung beginnend die verbleibende Lösung optimal im Sinne der zu lösenden Aufgabe ist mit dem gewählten Punkt als Anfangsbedingung.

Diese Idee wird nun im Sinne der dynamischen Programmierung nach Bellman so verwendet, dass die Optimierungsaufgabe (3.2) vom Endzeitpunkt N beginnend rückwärts gelöst wird. Dabei kann der Wert der optimalen Steuerung für den Zeitpunkt N, also uN1, unabhängig vom erreichten Zustand xN1 gelöst werden. Im nächsten Schritt wird ausgehend von der optimalen Lösung uN1 das optimale uN2 berechnet. Wiederholt man diese Vorgehensweise bis k=0, so ist die optimale Steuerstrategie gefunden.

Zugehörige Formeln

(3.2)J(x0)=k=0N1(xkTQxk+ukTRuk+2ukTNxk)+xNTSxN=k=0N1[xkTukT][QNTNR]J[xkuk]+xNTSxN