Zusammenfassung
Der umfangreiche, auf geometrische Überlegungen gründende Beweis des Maximumprinzips vonPontrjagin läßt sich vollständig durch funktionalanalytische Herleitungen ersetzen: anstelle der totalen Ableitung von Prozeß und Zielfunktional bei der direkten Methode sind hier nur die partiellen Ableitungen in Richtung der Zustandsvariablen nötig, während die Differenz in Richtung der Steuerungen nicht linearisiert wird. Die Kozustandsvariablen sind Hilfsgrößen, die zur Umformung eines Skalarproduktes dienen. (Sie ergeben sich als Lösung einer linearen Gleichung, deren Operator durch die Adjungierte zur partiellen Ableitung des Prozeßoperators gegeben ist und deren rechte Seite das teillinearisierte Zielfunktional bildet.) Dabei erhält man die bekannte Ungleichung der Hamiltonfunktionen, deren Gültigkeitsbereich in einem Widerspruchsbeweis globalisiert wird.
Dieser funktionalanalytische Beweis ist kürzer, konstruktiver und allgemeiner: so ergibt sich die Politikiteration vonHoward als Anwendung des Maximumprinzips auf bewertete stationäre Markovprozesse.
Summary
The tedious proof ofPontrjagin's maximum principle, based on geometric considerations, can be fully replaced by methods of functional analysis: instead of complete differentiation of the process and the objective functional in the direct method, only partial derivation in direction of state variables are used, while the difference in direction of the control is not linearized. The costate variables furnish a means to transform an innerproduct. (They are the solution of a linear equation whose operator is the adjoint of the partial derivative of the process operator and whose right side is formed by the partial linearized objective functional.) As result we obtain the wellknown unequality of the Hamiltonians, whose domain of validity is globalized in a proof by contradiction.
This proof by methods of functional analysis is more concise, constructive and more general: application of the maximal principle to ergodic Marcovprocesses with rewards results inHoward's method of policy iteration.
Explore related subjects
Discover the latest articles, news and stories from top researchers in related subjects.Literatur
Lee, E. B., andL. Markus: Foundations of Optimal Control Theory. New York: Wiley. 1967.
Pontrjagin, L. S.,et al.: Mathematische Theorie optimaler Prozesse. München: Oldenbourg-Verlag, 1967; dt. Übersetzung des russ. Originals.
Spremann, K.: Das Maximumprinzip von Pontrjagin — konstruktive Anwendung und ein Zusammenhang mit der direkten Methode. Diplomarbeit, Inst. f. Angew. Math. d. TU München (1970).
Gessner, P., undK. Spremann: Optimierung in Funktionenräumen (Lecture Notes in Economics and Mathematical Systems, Vol. 6). Berlin-Heidelberg-New York: Springer. 1972.
Canon, M. D., C. D. Cullum, Jr., andE. Polak: Theory of Optimal Control and Mathematical Programming, New York: McGraw-Hill. 1970.
Gessner, P.: Optimierungsprobleme in unitären Räumen. Habilitationsschrift, TU München (1970).
Gessner, P., undH. J. Wacker: Dynamische Optimierung — Modelle und Computerprogramme. München: Carl Hanser Verlag. 1972.
Holtzman, I. M.: Convexity and the Maximum Principle for Discrete Systems. IEEE Trans. on Automatic Control, AC-11,1, 30–35 (1966).
Howard, R. A.: Dynamic Programming and Markov Processes, 2nd ed., pp. 32–43. Cambridge, Mass.: MIT Press. 1962.
Feilmeier, M., P. Gessner undH. J. Wacker: Lineare Kontrollprobleme. Unternehmensforschung14, 4, 263–275 (1970).
Author information
Authors and Affiliations
Rights and permissions
About this article
Cite this article
Spremann, K. Ein funktionalanalytischer Beweis des Maximumprinzips von Pontrjagin und dessen Verwendung zur Herleitung der Politikiteration von Howard. Computing 9, 343–353 (1972). https://doi.org/10.1007/BF02241608
Received:
Issue Date:
DOI: https://doi.org/10.1007/BF02241608