BY 4.0 license Open Access Published by Oldenbourg Wissenschaftsverlag June 30, 2021

Zur Theorie und Anwendung der Flachheit nichtlinearer zeitdiskreter Systeme in Zustandsdarstellung

Theory and applications of flat nonlinear discrete-time systems in state representation
Bernd Kolar, Johannes Diwold and Markus Schöberl

Zusammenfassung

Der Beitrag gibt einen Überblick über Theorie und Anwendungsmöglichkeiten des Konzepts der Flachheit für nichtlineare zeitdiskrete Systeme. Anstatt von Zeitableitungen der Systemgrößen kann ein flacher Ausgang im zeitdiskreten Fall von deren zukünftigen und vergangenen Werten abhängen. Für den in der Literatur meistens betrachteten – und für zahlreiche praktische Anwendungen relevanten – Fall der Vorwärts-Flachheit, bei dem man sich auf aktuelle und zukünftige Werte einschränkt, geben wir eine vollständige geometrische Charakterisierung an. Damit ist es möglich, die Vorwärts-Flachheit eines Systems rechentechnisch effizient und analog zum bekannten Test für Eingangs-Zustands-Linearisierbarkeit zu beurteilen. Als Anwendungsbeispiel betrachten wir die exakte Diskretisierung eines mobilen Roboters.

Abstract

The contribution provides an overview of the theory and possible applications of the concept of flatness for nonlinear discrete-time systems. In the discrete-time case, instead of time derivatives, a flat output may depend on future and past values of the system variables. For the special – but practically relevant – case of forward-flatness, which is usually considered in the literature and allows only a dependence on current and future values, we provide a complete geometric characterization. This allows to check the forward-flatness of a system analogously to the well-known test for static feedback linearizability in a computationally efficient way. As a practical example, we consider the exact discretization of a mobile robot.

1 Einleitung

Das von Fliess, Lévine, Martin und Rouchon 1992 eingeführte Konzept der Flachheit für nichtlineare zeitkontinuierliche Systeme [6], [7], [8] zählt unumstritten zu den wichtigsten Methoden der nichtlinearen Regelungstechnik. Flache zeitkontinuierliche Systeme besitzen die charakteristische Eigenschaft, dass alle Systemgrößen durch einen flachen Ausgang und dessen Zeitableitungen ausgedrückt werden können, welcher umgekehrt von den Systemgrößen und deren Zeitableitungen abhängt. Damit ergibt sich eine Eins-zu-eins-Korrespondenz zwischen den Trajektorien eines flachen Systems und den Trajektorien eines trivialen Systems. Das erlaubt auch für nichtlineare Systeme eine einfache Trajektorienplanung und einen systematischen Entwurf von Folgeregelungen [3], [22].

Für eine Übertragung auf zeitdiskrete Systeme gibt es im Wesentlichen zwei Möglichkeiten. Ein in der Literatur häufig gewählter Zugang besteht darin, die Zeitableitungen der Systemgrößen aus der bekannten zeitkontinuierlichen Definition durch deren Vorwärts-Shifts, d. h. zukünftige Werte, zu ersetzen [11], [13], [27]. Das führt zu einer Übereinstimmung mit der in [1] für zeitdiskrete Systeme definierten Linearisierbarkeit durch eine endogene dynamische Zustandsrückführung, welche für zeitkontinuierliche Systeme äquivalent zur Flachheit ist. Im Rahmen dieses Beitrags betrachten wir als Ausgangspunkt stattdessen die Existenz einer Eins-zu-eins-Korrespondenz zwischen den Lösungstrajektorien des Systems und Lösungstrajektorien eines trivialen Systems [5]. Dieser Zugang ist allgemeiner und erlaubt, dass der flache Ausgang sowohl von zukünftigen als auch vergangenen Werten (Rückwärts-Shifts) der Systemgrößen abhängen darf, siehe auch [10]. Den Fall ohne Rückwärts-Shifts bezeichnen wir als Vorwärts-Flachheit.

Die Motivation für eine Übertragung des Konzepts der Flachheit auf zeitdiskrete Systeme besteht aus regelungstechnischer Sicht vor allem darin, dass die bei einer physikalischen Modellbildung auftretenden Systeme zwar typischerweise zeitkontinuierlich sind, aber die hergeleiteten Regelgesetze schließlich trotzdem zeitdiskret implementiert werden müssen (siehe z. B. [16] oder [25]). Insbesondere für Anwendungsfälle, bei denen die Abtastzeit bezogen auf die Dynamik der Solltrajektorien relativ groß ist – und somit die dem Reglerentwurf zugrundeliegende Annahme, dass das Regelgesetz kontinuierlich ausgewertet wird, an ihre Grenzen stößt – bietet es sich an, den flachheitsbasierten Steuerungs- bzw. Regelungsentwurf anhand des diskretisierten Systems durchzuführen. Ideal wäre dafür natürlich eine exakte Diskretisierung, da diese die stückweise konstanten Stellgrößen eines digitalen Regelkreises perfekt berücksichtigt. Eine exakte Diskretisierung ist aber einerseits meist schwierig zu berechnen und zerstört andererseits oft die Eigenschaft der Flachheit. Dennoch gibt es Ausnahmen wie zum Beispiel die in [1] betrachtete exakte Diskretisierung eines mobilen Roboters. Besonders geeignet ist hingegen die einfache Euler-Diskretisierung, da sie in vielen Fällen die Flachheit eines zeitkontinuierlichen Systems erhält. So sind z. B. die Euler-Diskretisierungen des Laborhelikopters aus [15], des Quadrokopters aus [19], des kinematischen Fahrzeugmodells aus [22] und der Asynchronmaschine aus [2] allesamt vorwärts-flach und auch die bekannten flachen Ausgänge werden erhalten. Ein weiteres Beispiel ist das gyroskopische Pendel in Impuls-Koordinaten, dessen Euler-Diskretisierung sogar eingangs-zustands-linearisierbar ist. Darüber hinaus sind auch die Euler-Diskretisierungen diverser akademischer flacher zeitkontinuierlicher Systeme ebenfalls flach. Dass die Euler-Diskretisierung die Flachheit eines Systems aber nicht generell erhält, kann man schon im Eingrößenfall einfach mit einem Gegenbeispiel zeigen, da in diesem Fall die Eigenschaften Flachheit, Vorwärts-Flachheit und Eingangs-Zustands-Linearisierbarkeit äquivalent sind. Im Hinblick auf die numerische Stabilität kann natürlich auch eine implizite Euler-Diskretisierung sinnvoll sein. Als Beispiele, bei denen diese die Flachheit erhält, seien exemplarisch wiederum die Asynchronmaschine sowie ein hydraulisches System (siehe [17]) genannt. Bei ersterer findet man zusätzlich zum bereits aus dem zeitkontinuierlichen Fall bekannten flachen Ausgang einen weiteren vorwärts-flachen Ausgang, während letzteres System sogar eingangs-zustands-linearisierbar ist.

Auch die optimierungsbasierte Trajektorienplanung gestaltet sich einfacher als im zeitkontinuierlichen Fall. Da die zu planenden Solltrajektorien nun Folgen anstatt Zeitfunktionen sind, ergibt sich von vornherein ein endlichdimensionales Optimierungsproblem und es entfällt die Diskretisierung eines unendlichdimensionalen Funktionenraums. Entsprechend kann die Flachheit eines zeitdiskreten Systems auch im Bereich der modellprädiktiven Regelung ausgenutzt werden, siehe z. B. [18]. Darüber hinaus gibt es aber auch Anwendungen abseits der Regelungstechnik, z. B. im Gebiet der Kryptographie, siehe [10]. Aus diesem Grund betrachten wir zeitdiskrete Systeme ganz allgemein, unabhängig davon, ob sie durch Diskretisierung eines zeitkontinuierlichen Systems entstanden sind.

Der Beitrag gliedert sich wie folgt: In Abschnitt 2 diskutieren wir das Konzept der Flachheit für zeitdiskrete Systeme basierend auf der Eins-zu-eins-Korrespondenz zwischen Systemtrajektorien und Trajektorien eines trivialen Systems. In Abschnitt 3 geben wir für den Spezialfall der Vorwärts-Flachheit einen rechentechnisch effizienten Test an, der eine geradlinige Verallgemeinerung des bekannten Tests für Eingangs-Zustands-Linearisierbarkeit darstellt. In Abschnitt 4 veranschaulichen wir die vorgestellten Konzepte schließlich anhand von Beispielen. Insbesondere zeigen wir anhand der Simulation eines mobilen Roboters mit einer zeitdiskret berechneten Vorsteuerung die möglichen Vorteile des zeitdiskreten Zugangs auf.

2 Äquivalenz von Trajektorien und Flachheit zeitdiskreter Systeme

Wir betrachten in diesem Beitrag zeitdiskrete Systeme

(1)xi,+=fi(x,u),i=1,,n

in Zustandsdarstellung mit dim(x)=n, dim(u)=m und glatten Funktionen fi(x,u), welche die Submersivitätsbedingung

(2)rank((x,u)f)=n

erfüllen. Die Bedingung (2) ist notwendig für die Erreichbarkeit eines zeitdiskreten Systems und folglich auch für dessen Flachheit, weshalb sie keine Einschränkung darstellt. Das ist unmittelbar ersichtlich, da im Fall rank((x,u)f)<n die durch (1) repräsentierte Abbildung nicht surjektiv ist und somit nicht jeder Zustand x+ erreicht werden könnte.

Wie schon in der Einleitung angemerkt, gibt es verschiedene Ansätze, den Begriff der Flachheit vom zeitkontinuierlichen Fall auf den zeitdiskreten Fall zu übertragen. Eine Möglichkeit besteht darin, Zeitableitungen durch Vorwärts-Shifts zu ersetzen. Im Rahmen dieses Beitrags bezeichnen wir diesen Zugang als Vorwärts-Flachheit und verfolgen stattdessen einen allgemeineren Ansatz. Als Ausgangspunkt betrachten wir die zentrale Eigenschaft eines zeitkontinuierlichen Systems x˙=f(x,u), dass es eine Eins-zu-eins-Korrespondenz zwischen Systemtrajektorien (x(t),u(t)) und Trajektorien y(t) eines trivialen Systems (hinreichend glatt, aber ansonsten beliebig) mit dim(y)=dim(u) gibt. Analog dazu bezeichnen wir ein zeitdiskretes System (1) als flach, wenn es eine Eins-zu-eins-Korrespondenz zwischen den Systemtrajektorien (x(k),u(k)) und Trajektorien y(k) eines trivialen Systems (beliebige Folgen, welche keine Differenzengleichung erfüllen müssen) mit dim(y)=dim(u) gibt. Unter Eins-zu-eins-Korrespondenz verstehen wir dabei, dass x(k) und u(k) zu einem fixen Zeitschritt k von einer beliebigen, aber finiten Anzahl von zukünftigen und vergangenen Werten von y(k) abhängen dürfen, d. h. von der ganzen Trajektorie in einem beliebig großen, aber finiten Zeitintervall. Umgekehrt darf der Wert von y(k) zu einem fixen Zeitschritt k von einer beliebigen, aber finiten Anzahl von zukünftigen und vergangenen Werten von x(k) und u(k) abhängen. Die Verwendung von sowohl zukünftigen als auch vergangenen Werten erscheint auch deshalb sinnvoll, da die Zeitableitungen im zeitkontinuierlichen Fall über die Taylor-Entwicklung ja auch eine Information über die Trajektorie sowohl in Vorwärts- als auch Rückwärts-Richtung liefern.

Die Eins-zu-eins-Korrespondenz der Trajektorien kann prinzipiell durch Abbildungen der Form

(3)(x(k),u(k))=F(k,y(kr1),,y(k),,y(k+r2))

und

(4)y(k)=φ(k,x(kq1),u(kq1),,aaaaaaaaaax(k),u(k),,x(k+q2),u(k+q2))

mit geeigneten r1, r2, q1, q2 beschrieben werden. Einsetzen von (4) in (3), oder umgekehrt, muss im Sinne der Eins-zu-eins-Korrespondenz identisch erfüllte Gleichungen liefern. Weiters müssen nach Einsetzen von (3) in die Systemgleichungen (1) letztere identisch erfüllt sein, da die Lösungstrajektorien y(k) eines trivialen Systems ja beliebig sind. Da wir zeitinvariante Systeme betrachten, sind wir im Folgenden aber nur an Abbildungen (3) und (4) interessiert, welche nicht explizit vom Zeitschritt k abhängen. Weiters ist es nicht erforderlich, sowohl in (3) als auch in (4) gleichermaßen Vorwärts- und Rückwärts-Shifts zu betrachten. Durch Definition eines geeigneten Rückwärts-Shifts von y als neuer flacher Ausgang kann immer erreicht werden, dass in der Abbildung (3) nur Vorwärts-Shifts auftreten. Die Abbildungen (3) und (4) vereinfachen sich damit zu

(5)(x(k),u(k))=F(y(k),,y(k+r))

und

(6)y(k)=φ(x(kq1),u(kq1),,x(k),u(k),,x(k+q2),u(k+q2)).

Eine weitere Vereinfachung betrifft die Darstellung des flachen Ausgangs (6), da die Trajektorien des Zustands x(k) und des Eingangs u(k) nicht unabhängig voneinander sind. Mithilfe der Systemgleichungen (1) können sämtliche Vorwärts-Shifts x(k+j) der Zustandsgrößen durch x(k) und Vorwärts-Shifts u(k),,u(k+j1) der Eingangsgrößen ausgedrückt werden:

(7)x(k+1)=f(x(k),u(k))x(k+2)=f(f(x(k),u(k)),u(k+1))a

In Rückwärts-Richtung gelingt das mithilfe von Rückwärts-Shifts der Eingänge nur für Systeme, bei denen die Bedingung rank(xf)=n erfüllt ist. Wegen (2) lassen sich aber immer m Funktionen g(x,u) so finden, dass die Jacobimatrix von

(8)x+=f(x,u)ζ=g(x,u)

regulär und somit (8) lokal invertierbar ist. Mit den Inversen

(9)x=ψx(x+,ζ)u=ψu(x+,ζ)

sind alle Rückwärts-Shifts x(kj) und u(kj) der Zustands- und Eingangsgrößen durch x(k) und Rückwärts-Shifts ζ(k1),,ζ(kj) der gemäß (8) definierten Systemgrößen ζ eindeutig bestimmt:

(10)(x(k1),u(k1))=ψ(x(k),ζ(k1))(x(k2),u(k2))=ψ(ψ(x(k),ζ(k1)),ζ(k2))a

Durch Einsetzen von (7) und (10) ergibt sich für die Abbildung (6), d. h. den flachen Ausgang, eine Darstellung der Form

y(k)=φ(ζ(kq1),,ζ(k1),x(k),u(k),,u(k+q2)).

Die Wahl der Funktionen g(x,u) in (8) ist nicht eindeutig, hat aber keine Auswirkung auf die Flachheit des Systems, sondern nur auf die Darstellung des flachen Ausgangs.

Um eine mathematisch präzise Definition der Flachheit zeitdiskreter Systeme formulieren zu können, benutzen wir einen Raum mit Koordinaten (,ζ[1],x,u,u[1],), wobei das Subskript den entsprechenden Shift bezeichnet.[1] Wegen (7) and (10) entspricht jeder Punkt dieses Raumes einer eindeutigen Lösungstrajektorie des Systems (1). Auf diesem Raum lässt sich nun der für eine beliebige Funktion h gemäß (8) mit

δ(h(,ζ[2],ζ[1],x,u,u[1],))=aaaaaaaaaah(,ζ[1],g(x,u),f(x,u),u[1],u[2],)

definierte Vorwärts-Shift-Operator δ einführen. Seine Inverse ist gemäß (9) durch

δ1(h(,ζ[1],x,u,u[1],u[2],))=aaaaaaaaaah(,ζ[2],ψx(x,ζ[1]),ψu(x,ζ[1]),u,u[1],)

gegeben und wird als Rückwärts-Shift-Operator bezeichnet. Eine β-fache Anwendung von δ oder seiner Inversen wird mit δβ bzw. δβ bezeichnet. In der folgenden Definition betrachten wir, in Übereinstimmung mit der Literatur über die exakte Linearisierung von zeitdiskreten Systemen mittels statischer oder dynamischer Zustandsrückführung, nur eine Umgebung einer Ruhelage x0=f(x0,u0), siehe z. B. [20] oder [1].[2] Das Konzept ist aber in vielen Fällen auch dann sinnvoll anwendbar, wenn die Bedingungen in der Ruhelage selbst nicht erfüllt sind.

Definition 1.

Das System (1) ist flach in der Umgebung einer Ruhelage(x0,u0), wenn dien+mKoordinatenfunktionen x und u lokal durch ein m-Tupel von Funktionen

(11)yj=φj(ζ[q1],,ζ[1],x,u,,u[q2])
und eine finite Anzahl von deren Vorwärts-Shifts
y[1]=δ(φ(ζ[q1],,ζ[1],x,u,,u[q2]))y[2]=δ2(φ(ζ[q1],,ζ[1],x,u,,u[q2]))a
ausgedrückt werden können. Das m-Tupel (11) ist ein flacher Ausgang.

Es kann gezeigt werden, dass alle Vorwärts- und Rückwärts-Shifts eines flachen Ausgangs (11) funktional unabhängig sind (siehe [5]). Das wiederum garantiert die Eindeutigkeit der Abbildung (5). Diese ist außerdem eine Submersion, d. h. die Zeilen ihrer Jacobimatrix sind linear unabhängig, und hat die spezielle Form

xi=Fxi(y,,y[R1]),i=1,,nuj=Fuj(y,,y[R]),iaj=1,,m.

Der Multi-Index R=(r1,,rm) soll verdeutlichen, dass die Anzahl der auftretenden Vorwärts-Shifts der einzelnen Komponenten eines flachen Ausgangs unterschiedlich sein kann. Der Unterschied zwischen Flachheit und Vorwärts-Flachheit besteht nun lediglich darin, dass ein vorwärts-flacher Ausgang unabhängig von den Größen ζ bzw. deren Rückwärts-Shifts sein muss.

Definition 2.

Das System (1) ist vorwärts-flach, wenn es die Bedingungen von Definition1mit einem flachen Ausgang der Formy=φ(x,u,,u[q2])erfüllt.

Anmerkung 1.

Alternativ ist auch eine Definition von Flachheit bzw. Vorwärts-Flachheit für zeitdiskrete Systeme im Rahmen des in [7] oder [23] benutzten algebraischen Zugangs denkbar. Dabei sind formal auch Analogien zu den in [23] und [24] betrachteten Totzeitsystemen zu erwarten, da bei diesen ebenfalls Zeitverschiebungen eine Rolle spielen. Allerdings muss betont werden, dass die Lösungen von Totzeitsystemen Zeitfunktionen und keine Folgen sind.

Wie bei zeitkontinuierlichen Systemen ist auch im zeitdiskreten Fall die Eigenschaft der Flachheit eng mit dem Problem der exakten Linearisierung mittels dynamischer Zustandsrückführung verknüpft. In [1] wird eine zeitdiskrete dynamische Zustandsrückführung

(12)z+=α(x,z,v)u=β(x,z,v)

als endogen bezeichnet, wenn die Größen z und v als Funktionen von x, u und Vorwärts-Shifts von u ausgedrückt werden können. Dazu passend ist ein System (1) genau dann vorwärts-flach, wenn es mittels einer solchen endogenen Zustandsrückführung exakt linearisiert werden kann. In [5] wird aber gezeigt, dass auch für flache Systeme gemäß der allgemeineren Definition 1 immer eine exakt linearisierende dynamische Zustandsrückführung der Form (12) existiert, welche zwar nicht endogen im Sinne von [1] ist, aber immerhin die Eigenschaft besitzt, dass die Trajektorien des geschlossenen Kreises in einer Eins-zu-eins-Korrespondenz zu den Trajektorien des Originalsystems stehen und auch die Submersivität erhalten bleibt. Da das prinzipiell mit der aus dem zeitkontinuierlichen Fall bekannten Definition einer endogenen dynamischen Zustandsrückführung übereinstimmt, stellt sich die Frage, ob die in [1] benutzte Definition einer endogenen dynamischen Zustandsrückführung mit der Einschränkung auf Vorwärts-Shifts nicht zu restriktiv ist. Im Sinne dieses Beitrags würde sich dafür der Begriff vorwärts-endogen anbieten.

Es lässt sich zeigen, dass für lineare Systeme und nichtlineare Eingrößensysteme die Eigenschaften Flachheit, Vorwärts-Flachheit und Eingangs-Zustands-Linearisierbarkeit äquivalent sind und somit immer eine Transformation auf Brunovsky-Normalform möglich ist [5]. Die wesentliche Schwierigkeit besteht also wie bei zeitkontinuierlichen Systemen im Nachweis der Flachheit bzw. der Konstruktion von flachen Ausgängen für nichtlineare Mehrgrößensysteme. Während es für den allgemeinen Fall gemäß Definition 1 noch keine einfach verifizierbaren notwendigen und hinreichenden Bedingungen gibt, wurde dieses Problem für den Spezialfall der Vorwärts-Flachheit in [12] basierend auf Ergebnissen aus [14] vollständig gelöst. Ein alternativer Ansatz findet sich in [26]. Darüber hinaus wurde in [4] gezeigt, dass jedes vorwärts-flache System (1) mit m2 Eingängen durch eine Zustands- und Stellgrößentransformation sogar in eine strukturell flache Normalform gebracht werden kann.

3 Geometrische Charakterisierung von vorwärts-flachen Systemen

In diesem Abschnitt geben wir eine vollständige differentialgeometrische Charakterisierung für vorwärts-flache Systeme an. Bevor wir in Abschnitt 3.2 eine Verallgemeinerung des bekannten Tests für Eingangs-Zustands-Linearisierbarkeit (siehe [9] oder [20]) auf vorwärts-flache Systeme vorstellen, gehen wir in Abschnitt 3.1 auf die dafür benötigten mathematischen Konzepte ein.

3.1 Projizierbare Vektorfelder und Distributionen

Der differentialgeometrische Test für Vorwärts-Flachheit benutzt eine Interpretation des Systems (1) als Abbildung

(13)f:X×UX+

von einer Mannigfaltigkeit X×U mit Koordinaten (x,u) auf eine Mannigfaltigkeit X+ mit Koordinaten x+. Die zentrale mathematische Aufgabe bei diesem Test besteht darin, festzustellen, ob ein gegebenes Vektorfeld[3]

(14)v=vxi(x,u)xi+vuj(x,u)uj

auf X×U durch die (punktweise definierte) Tangentialabbildung f:T(X×U)T(X+) auf ein eindeutiges Vektorfeld

(15)w=wi(x+)xi,+

auf X+ abgebildet wird oder nicht.[4] Für die Komponenten der beiden Vektorfelder gilt dann

wi(x+)f(x,u)=xkfivxk(x,u)+ujfivuj(x,u),

und wir bezeichnen die Vektorfelder als f-verwandt bzw. das Vektorfeld (14) als „projizierbar“. Das Vektorfeld (15) bezeichnen wir auch als „Pushforward“ von (14) und schreiben w=f(v).

Ob ein Vektorfeld (14) projizierbar ist oder nicht, lässt sich einfach feststellen, indem man auf X×U spezielle Koordinaten einführt. Dazu wählt man eine Transformation der Form

(16)θi=fi(x,u),i=1,,nξj=hj(x,u),j=1,,m,

wobei die m Funktionen hj(x,u) so gewählt werden müssen, dass die Jacobimatrix

xfufxhuh

regulär ist. Da die Zeilen der Jacobimatrix von f wegen der Submersivitäts-Bedingung (2) linear unabhängig sind, ist eine solche Erweiterung immer möglich und garantiert, dass (16) lokal invertierbar ist. Mit den neuen Koordinaten (θ,ξ) auf X×U nimmt die Abbildung (13) die einfache Form

(17)xi,+=θi,i=1,,n

an. Das bedeutet, dass alle Punkte mit demselben Wert der Koordinaten θ auf denselben Punkt von X+ abgebildet werden, unabhängig vom Wert der Koordinaten ξ. In adaptierten Koordinaten (16) hat ein Vektorfeld (14) im Allgemeinen die Form

v=ai(θ,ξ)θi+bj(θ,ξ)ξj

und gemäß (17) führt eine Anwendung der Tangentialabbildung f auf

(18)f(v)=ai(θ,ξ)xi,+,

d. h. der Term bj(θ,ξ)ξj wird abgeschnitten. Offensichtlich ist (18) genau dann ein wohldefiniertes Vektorfeld auf X+, wenn die Funktionen ai unabhängig von ξ sind. In diesem Fall ergibt Ersetzen von θ durch x+ gemäß (17) das gesuchte zu (14) f-verwandte Vektorfeld (15). Ein Vektorfeld (14) ist also genau dann projizierbar, wenn es in adaptierten Koordinaten (16) die Form

(19)ai(θ)θi+bj(θ,ξ)ξj

hat. Der Pushforward (15) eines solchen Vektorfeldes ist durch ai(x+)xi,+ gegeben.

Analog zu projizierbaren Vektorfeldern bezeichnen wir eine Distribution D auf X×U als “projizierbar”, wenn die Distribution eine aus projizierbaren Vektorfeldern bestehende Basis besitzt. Die Existenz einer solchen Basis garantiert, dass der Pushforward f(D) einer projizierbaren Distribution eine wohldefinierte Distribution auf X+ ist. Bei dem in Abschnitt 3.2 vorgestellten Test für Vorwärts-Flachheit machen wir unter anderem Gebrauch von der Eigenschaft, dass der Pushforward einer projizierbaren, involutiven Distribution wieder involutiv ist. Weiters benötigen wir noch das folgende Theorem, welches sicherstellt, dass bei diesem Test keine Freiheitsgrade auftreten.

Theorem 1.

Die größte projizierbare SubdistributionDPDeiner Distribution D aufX×Uist eindeutig bestimmt. Wenn D involutiv ist, dann ist auchDPinvolutiv.

Der Beweis kann in adaptierten Koordinaten (16) geführt werden und ist in [12] zu finden.

3.2 Verallgemeinerung des Tests für Eingangs-Zustands-Linearisierbarkeit

Die Erweiterung des Tests für Eingangs-Zustands-Linearisierbarkeit auf vorwärts-flache Systeme basiert auf der folgenden, in [14] hergeleiteten, notwendigen Bedingung.

Theorem 2.

Die aufX×Udefinierte Eingangs-Distributionspan{u}eines vorwärts-flachen Systems (1) mitrank(uf)=menthält ein nichttriviales, bezüglich der Abbildung (13) projizierbares Vektorfeldv=vuj(x,u)uj.

Anders formuliert gibt es bei einem vorwärts-flachen System immer eine zumindest eindimensionale, projizierbare Subdistribution Dspan{u}. Diese Distribution auf X×U kann durch Anwendung des Frobenius-Theorems mittels einer Stellgrößentransformation

(20)(u¯1,u¯2)=Φu(x,u)

mit dim(u¯2)=dim(D) in die Form D=span{u¯2} gebracht, d. h. „ausgerichtet“ bzw. „begradigt“, werden. Ebenso kann die zugehörige Distribution Δ=f(D) auf X+ mittels einer Zustandstransformation

(21)(x¯1,x¯2)=Φx(x)

mit dim(x¯2)=dim(Δ) in die Form Δ=span{x¯2+} gebracht werden. Diese Zustandstransformation muss gemäß dem Transformationsgesetz für zeitdiskrete Systeme gleichermaßen für x und x+, d. h. sowohl auf X×U als auch auf X+, durchgeführt werden. In diesen neuen Koordinaten hat das System (1) die Form

(22)x¯1i1,+=f¯1i1(x¯1,x¯2,u¯1),i1=1,,nm2x¯2i2,+=f¯2i2(x¯1,x¯2,u¯1,u¯2),i2=1,,m2

mit dim(u¯2)=dim(x¯2)=m2. Die Besonderheit der Systemdarstellung (22) besteht darin, dass das Gesamtsystem genau dann vorwärts-flach ist, wenn das Subsystem

(23)x¯1+=f¯1(x¯1,x¯2,u¯1)

mit den m Eingängen (x¯2,u¯1) vorwärts-flach ist (siehe z. B. [13]). Die Form (22) kann auch als Zerlegung in ein Subsystem (23) und eine endogene dynamische Zustandsrückführung interpretiert werden. Somit ist das Problem der Untersuchung der Vorwärts-Flachheit des ursprünglichen Systems übergeführt auf die Untersuchung der Vorwärts-Flachheit des kleineren Systems (23). Dieses System muss – nach der Elimination ggf. auftretender redundanter Eingänge – wieder die notwendige Bedingung gemäß Theorem 2 erfüllen und kann somit, sofern es vorwärts-flach ist, selbst wieder zerlegt werden. Eine wiederholte Zerlegung ermöglicht nach höchstens n1 Schritten eine Beurteilung der Vorwärts-Flachheit des ursprünglichen Systems (1) und liefert im Falle eines positiven Ergebnisses auch gleich einen vorwärts-flachen Ausgang (siehe [14]).

Der Nachteil dieser Vorgangsweise besteht aus rechentechnischer Sicht jedoch darin, dass zur Konstruktion der Transformationen (20) und (21) jeweils die Distributionen D und Δ mittels des Frobenius-Theorems begradigt werden müssen. Das erfordert wiederum die Lösung von im Allgemeinen nichtlinearen (aber oft einfachen) gewöhnlichen Differentialgleichungen. Die Grundidee besteht nun darin, nur zu prüfen, ob die wiederholten Zerlegungen möglich sind oder nicht, ohne die entsprechenden Transformationen tatsächlich auszuführen. Das führt zu einem Test, basierend auf einer Sequenz von Distributionen, welcher als Spezialfall den bekannten Test für Eingangs-Zustands-Linearisierbarkeit einschließt. Zur Berechnung dieser Sequenz von Distributionen benötigen wir neben der Abbildung (13) auch eine gemäß

xi,+=xi,i=1,,n

definierte Abbildung

π:X×UX+.

Wir setzen voraus, dass die im Folgenden konstruierten Distributionen lokal konstante Dimension haben.

Algorithmus 1.

Schritt 0: Berechnung der größten Subdistribution

D0E0=span{u},
welche bezüglich der Abbildung (13) projizierbar ist. Wegen Theorem1istD0eindeutig bestimmt und involutiv, weshalb der Pushforward
Δ1=f(D0)
eine wohldefinierte, involutive Distribution aufX+ist.

Schrittk1: Konstruktion der involutiven Distribution[5]

Ek=π1(Δk)
aufX×Uund Berechnung der größten bezüglich der Abbildung (13) projizierbaren Subdistribution
DkEk.
Wegen Theorem1istDkeindeutig und involutiv. Weiters giltDk1Dkund folglich ist der Pushforward
(24)Δk+1=f(Dk)
eine wohldefinierte, involutive Distribution aufX+mit
(25)ΔkΔk+1.
Stop sobald für eink=k¯gilt
dim(Δk¯+1)=dim(Δk¯).

Wegen (25) und dim(X+)=n endet der Algorithmus nach höchstens n Schritten. Man erhält eine eindeutige, verschachtelte Sequenz von projizierbaren, involutiven Distributionen

(26)D0D1Dk¯1

auf X×U und eine eindeutige, verschachtelte Sequenz von involutiven Distributionen

(27)Δ1Δ2Δk¯

auf X+, welche über die Beziehung (24) verknüpft sind. Die Sequenz (27) stellt eine Verallgemeinerung der in [9] eingeführten Sequenz zur Überprüfung eines zeitdiskreten Systems (1) auf Eingangs-Zustands-Linearisierbarkeit dar.

Theorem 3.

Ein System (1) mitrank(uf)=mist genau dann eingangs-zustands-linearisierbar, wennDk=Ek,k0unddim(Δk¯)=n.

Für Eingangs-Zustands-Linearisierbarkeit ist also eine Voraussetzung, dass in jedem Schritt die gesamte Distribution Ek projizierbar ist. Für einen Beweis siehe [9] oder [20]. Durch Weglassen der Bedingung Dk=Ek ergeben sich notwendige und hinreichende Bedingungen für Vorwärts-Flachheit.

Theorem 4.

Ein System (1) mitrank(uf)=mist genau dann vorwärts-flach, wenndim(Δk¯)=n.

Für einen ausführlichen Beweis siehe [12]. Mit Theorem 4 kann die Vorwärts-Flachheit eines Systems (1) analog zur Eingangs-Zustands-Linearisierbarkeit rechentechnisch effizient überprüft werden, ohne tatsächlich einen vorwärts-flachen Ausgang berechnen zu müssen. Die Konstruktion der Distributionen (26) und (27) erfordert nur die Lösung von algebraischen Gleichungen. Im Falle eines positiven Ergebnisses kann durch Begradigen der Distributionen mit dem Frobenius-Theorem ein vorwärts-flacher Ausgang berechnet werden.

4 Beispiele

In diesem Abschnitt veranschaulichen wir die vorgestellten Konzepte anhand von zwei Beispielen. Zuerst erklären wir die Anwendung des Tests für Vorwärts-Flachheit aus Abschnitt 3.2 nochmals mithilfe eines akademischen Beispiels. Anschließend betrachten wir ein praktisches Beispiel, welches flach aber nicht vorwärts-flach ist, und zeigen Simulationsergebnisse für eine zeitdiskret entworfene Vorsteuerung.

4.1 Akademisches Beispiel

Zur Illustration des Tests für Vorwärts-Flachheit gemäß Algorithmus 1 und Theorem 4 benutzen wir das akademische Beispiel

(28)x1,+=u2x2,+=u1(x1+1)(u2+1)x3,+=x1x2+x1+x2x4,+=x1(x4+1)+x3x5,+=x4+x5+u2.

Zuerst benötigen wir auf X×U adaptierte Koordinaten (16). Eine mögliche Wahl ist

(29)θi=fi(x,u),i=1,,5ξ1=x1ξ2=x4.
Schritt 0: Die Distribution E0=span{u1,u2} ist in adaptierten Koordinaten (29) durch
E0=span{θ1+θ5,θ2}

gegeben, wobei hier bereits durch Skalierung bzw. Linearkombination der beiden Vektorfelder eine einfache, normierte Basis gewählt wurde. Man erkennt, dass die Distribution von projizierbaren Vektorfeldern der Form (19) aufgespannt wird und somit vollständig projizierbar ist. Es gilt also D0=E0. Der Pushforward Δ1=f(D0) dieser Distribution ist gemäß Abschnitt 3.1 die wohldefinierte Distribution

Δ1=span{x1,++x5,+,x2,+}

auf X+.

Schritt 1: Die Distribution E1=π1(Δ1) ist durch

E1=span{x1+x5,x2,u1,u2}

gegeben und hat in adaptierten Koordinaten (29) die Form

E1=span{θ1+θ5,θ2,θ3,θ4+1ξ2+1θ5+1ξ2+1ξ1}.

Durch geeignete Linearkombination der Vektorfelder wurde bereits wieder eine spezielle Basis erzeugt, anhand derer man erkennt, dass es eine dreidimensionale projizierbare Subdistribution

D1=span{θ1+θ5,θ2,θ3}E1

gibt. Für den Pushforward Δ2=f(D1) ergibt sich

Δ2=span{x1,++x5,+,x2,+,x3,+}.
Schritt 2: Die Distribution E2=π1(Δ2) ist durch
E2=span{x1+x5,x2,x3,u1,u2}

gegeben und hat in adaptierten Koordinaten (29) die Form

E2=span{θ1ξ1,θ2,θ3,θ4,θ5+ξ1}.

Hier wurde ebenfalls durch Linearkombinationen eine Basis erzeugt, bei der alle Vektorfelder die Form (19) haben und somit projizierbar sind. Dementsprechend gilt D2=E2 und der Pushforward Δ3=f(D2) ist die Distribution

Δ3=span{x1,+,x2,+,x3,+,x4,+,x5,+}

auf X+. Wegen dim(Δ3)=n=5 ist damit bereits die Dimension des Zustandsraums erreicht und das System gemäß Theorem 4 vorwärts-flach. Durch Begradigen der berechneten Distributionen mit dem Frobenius-Theorem kann der vorwärts-flache Ausgang

y=(x4,x5x1)

ermittelt werden, siehe dazu [12] oder [4]. Anhand der Systemgleichungen (28) kann man sich einfach davon überzeugen, dass durch diesen flachen Ausgang tatsächlich sämtliche Zustands- und Stellgrößen parametriert werden können. Aus der Differenz der letzten und der ersten Systemgleichung erhält man die Parametrierung von x5, aus welcher unmittelbar jene von x1 folgt. Aus der vierten Gleichung ergibt sich dann die Parametrierung von x3 und aus der dritten Gleichung wiederum die Parametrierung von x2. Die Parametrierung der Stellgrößen u1 und u2 folgt schließlich aus den ersten beiden Gleichungen.

4.2 Mobiler Roboter

Als praktisches Beispiel betrachten wir die exakte Diskretisierung eines mobilen Roboters, welche in [1] und [21] bereits im Rahmen der Linearisierung mittels dynamischer Zustandsrückführung diskutiert wurde. Die zeitkontinuierlichen Systemgleichungen haben die Form

(30)x˙1=u1cos(x3)x˙2=u1sin(x3)x˙3=u2

und sind auch als kinematisches Einachsmodell eines Fahrzeugs bekannt. Die Zustandsgrößen x1, x2 und x3 beschreiben Position und Winkel des mobilen Roboters. Bei den Stellgrößen u1 und u2 handelt es sich um die translatorische Geschwindigkeit und die Winkelgeschwindigkeit. Eine exakte Diskretisierung des Systems (30) mit einer allgemeinen Abtastzeit T>0 durch Berechnung der Lösung für im Abtastintervall konstante Stellgrößen führt zunächst auf

(31)x1,+=x1+u1Tcosx3+u2T2sinu2T2u2T2x2,+=x2+u1Tsinx3+u2T2sinu2T2u2T2x3,+=x3+u2T,

vgl. [21] oder [28]. Durch eine anschließende Stellgrößentransformation

u¯1=2u1sinu2T2u2u¯2=x3+u2T2

erhält man das System

(32)x1,+=x1+u¯1cos(u¯2)x2,+=x2+u¯1sin(u¯2)x3,+=2u¯2x3.

Es sei weiters angemerkt, dass für u2=0 im Grenzübergang

limu20sinu2T2u2T2=1

gilt und somit weder in (31) noch in der Stellgrößentransformation eine Singularität auftritt.

Zuerst wollen wir mit Algorithmus 1 nachweisen, dass das System (32) nicht vorwärts-flach ist. Dazu benötigen wir adaptierte Koordinaten (16) und treffen dafür die Wahl

θi=fi(x,u¯),i=1,,3ξ1=u¯1ξ2=u¯2.

In diesen Koordinaten haben die Eingangs-Vektorfelder u¯1 und u¯2 die Form

cos(ξ2)θ1+sin(ξ2)θ2+ξ1

und

ξ1sin(ξ2)θ1+ξ1cos(ξ2)θ2+2θ3+ξ2.

Für die Distribution E0=span{u¯1,u¯2} ergibt sich damit

E0=span{θ12sin(ξ2)ξ1θ3+cos(ξ2)ξ1sin(ξ2)ξ1ξ2,aaaaaaaθ2+2cos(ξ2)ξ1θ3+sin(ξ2)ξ1+cos(ξ2)ξ1ξ2},

wobei bereits eine durch Linearkombinationen normierte Basis gewählt wurde. Man kann erkennen, dass es keine Linearkombination der beiden Vektorfelder gibt, welche die Form (19) hat, d. h. projizierbar ist. Somit gibt es keine nicht-triviale projizierbare Subdistribution. Wir erhalten folglich D0={0} und der Algorithmus stoppt bereits nach dem ersten Schritt mit Δ1=f(0)={0}.

Obwohl das System nicht vorwärts-flach ist kann man aber zeigen, dass es flach im Sinne der allgemeineren Definition 1 ist. Mit der Wahl

ζ1=x3ζ2=x1

für die Größen ζ aus (8) existiert ein flacher Ausgang[6]

(33)y=(ζ[1]1,x1sinζ[1]1+x32x2cosζ[1]1+x32).

Die zugehörige Parametrierung der Systemgrößen hat die Form

x=Fx(y1,y2,,y[2]1,y[1]2)u¯=Fu¯(y1,y2,,y[3]1,y[2]2).

Durch Einsetzen dieser Parametrierung in die Inverse

u1=u¯1T(u¯2x3)sinu¯2x3u2=2T(u¯2x3)

der zu Beginn benutzten Stellgrößentransformation ergibt sich die Parametrierung der ursprünglichen Stellgrößen

u=Fu(y1,y2,,y[3]1,y[2]2).

Für T0 gilt ζ[1]1=x[1]3x3 und der flache Ausgang (33) des zeitdiskreten Systems (32) geht über in den flachen Ausgang

(34)y=(x3,x1sin(x3)x2cos(x3))

des zeitkontinuierlichen Systems (30).

Abb. 1 Vorsteuerung basierend auf zeitkontinuierlichem System.

Abb. 1

Vorsteuerung basierend auf zeitkontinuierlichem System.

Abb. 2 Vorsteuerung basierend auf exakt diskretisiertem System.

Abb. 2

Vorsteuerung basierend auf exakt diskretisiertem System.

Um zu verdeutlichen, dass ein Entwurf basierend auf einem diskretisierten System vorteilhaft sein kann, wurde für das zeitkontinuierliche System (30) und das exakt diskretisierte System (32) mithilfe der flachen Ausgänge (34) und (33) jeweils eine Trajektorienplanung durchgeführt. Die Abtastzeit wurde dabei wie in [21] mit T=0.5s festgelegt. Die resultierenden Vorsteuerungen wurden in einer Simulation auf das zeitkontinuierliche System (30) aufgeschaltet, wobei die zeitkontinuierlich berechnete Vorsteuerung u(t) nur zu den Abtastzeitpunkten t=kT ausgewertet und dazwischen konstant gehalten wurde. Die Ergebnisse sind in Abb. 1 und Abb. 2 dargestellt und zeigen die Trajektorie des mobilen Roboters in der Ebene. Während es durch den Effekt des Abtastens und Haltens mit der zeitkontinuierlich berechneten Vorsteuerung zu einer deutlichen Abweichung von der Solltrajektorie kommt, ist mit der zeitdiskret berechneten Vorsteuerung durch die exakte Diskretisierung erwartungsgemäß keine Abweichung erkennbar.

Funding source: Austrian Science Fund

Award Identifier / Grant number: P 29964

Award Identifier / Grant number: P 32151

Funding statement: Die Arbeit wurde durch den österreichischen Wissenschaftsfonds (FWF) im Rahmen der Projekte P 29964 und P 32151 unterstützt.

Literatur

1. E. Aranda-Bricaire and C. H. Moog. Linearization of discrete-time systems by exogenous dynamic feedback. Automatica, 44(7):1707–1717, 2008.Search in Google Scholar

2. J. Chiasson. A new approach to dynamic feedback linearization control of an induction motor. IEEE Transactions on Automatic Control, 43:391–397, 1998.Search in Google Scholar

3. E. Delaleau and J. Rudolph. Control of flat systems by quasi-static feedback of generalized states. International Journal of Control, 71(5):745–765, 1998.Search in Google Scholar

4. J. Diwold, B. Kolar and M. Schöberl. A normal form for two-input forward-flat nonlinear discrete-time systems. International Journal of Systems Science, 2021, accepted.Search in Google Scholar

5. J. Diwold, B. Kolar and M. Schöberl. A trajectory-based approach to discrete-time flatness. IEEE Control Systems Letters, 2021, accepted.Search in Google Scholar

6. M. Fliess, J. Lévine, P. Martin and P. Rouchon. Sur les systèmes non linéaires différentiellement plats. Comptes rendus de l’Académie des sciences. Série I, Mathématique, 315:619–624, 1992.Search in Google Scholar

7. M. Fliess, J. Lévine, P. Martin and P. Rouchon. Flatness and defect of non-linear systems: introductory theory and examples. International Journal of Control, 61(6):1327–1361, 1995.Search in Google Scholar

8. M. Fliess, J. Lévine, P. Martin and P. Rouchon. A Lie-Bäcklund approach to equivalence and flatness of nonlinear systems. IEEE Transactions on Automatic Control, 44(5):922–937, 1999.Search in Google Scholar

9. J. W. Grizzle. Feedback linearization of discrete-time systems. In A. Bensoussan and J. L. Lions, editors, Analysis and Optimization of Systems, volume 83 of Lecture Notes in Control and Information Sciences, pages 273–281. Springer, Berlin, 1986.Search in Google Scholar

10. P. Guillot and G. Millérioux. Flatness and submersivity of discrete-time dynamical systems. IEEE Control Systems Letters, 4(2):337–342, 2020.Search in Google Scholar

11. A. Kaldmäe and Ü. Kotta. On flatness of discrete-time nonlinear systems. In Proceedings 9th IFAC Symposium on Nonlinear Control Systems (NOLCOS), pages 588–593, 2013.Search in Google Scholar

12. B. Kolar, J. Diwold and M. Schöberl. Necessary and sufficient conditions for difference flatness. arXiv e-prints, 2019. arXiv:1909.02868 [math.OC].Search in Google Scholar

13. B. Kolar, A. Kaldmäe, M. Schöberl, Ü. Kotta and K. Schlacher. Construction of flat outputs of nonlinear discrete-time systems in a geometric and an algebraic framework. IFAC-PapersOnLine, 49(18):796–801, 2016.Search in Google Scholar

14. B. Kolar, M. Schöberl and J. Diwold. Differential-geometric decomposition of flat nonlinear discrete-time systems. arXiv e-prints, 2019. arXiv:1907.00596 [math.OC].Search in Google Scholar

15. A. Kugi and T. Kiefer. Nichtlineare Trajektorienfolgeregelung für einen Laborhelikopter. e&i Elektrotechnik und Informationstechnik, 122(9):300–307, 2005.Search in Google Scholar

16. P. Martin and P. Rouchon. Flatness and sampling control of induction motors. In Proceedings 13th IFAC World Congress, pages 2786–2791, 1996.Search in Google Scholar

17. T. Mullari and K. Schlacher. Geometric control for a nonlinear sampled data system. In Proceedings 21st International Symposium on Mathematical Theory of Networks and Systems (MTNS), pages 54–61, 2014.Search in Google Scholar

18. S. Nair, U. Rosolia and F. Borrelli. Output-lifted learning model predictive control for flat systems. arXiv e-prints, 2020. arXiv:2004.05173 [math.OC].Search in Google Scholar

19. F. Nicolau and W. Respondek. Multi-input control-affine systems linearizable via one-fold prolongation and their flatness. In Proceedings 52nd IEEE Conference on Decision and Control (CDC), pages 3249–3254, 2013.Search in Google Scholar

20. H. Nijmeijer and A. J. van der Schaft. Nonlinear Dynamical Control Systems. Springer, New York, 1990.Search in Google Scholar

21. R. Orosco-Guerrero, M. Velasco-Villa and E. Aranda-Bricaire. Discrete-time controller for a wheeled mobile robot. In Proceedings XI congreso latinoamericano de control automatico, 2004.Search in Google Scholar

22. R. Rothfuß, J. Rudolph and M. Zeitz. Flachheit: Ein neuer Zugang zur Steuerung und Regelung nichtlinearer Systeme. at – Automatisierungstechnik, 45:517–525, 1997.Search in Google Scholar

23. J. Rudolph. Beiträge zur flachheitsbasierten Folgeregelung linearer und nichtlinearer Systeme endlicher und unendlicher Dimension. Shaker Verlag, Aachen, 2003.Search in Google Scholar

24. J. Rudolph. Flachheit: Eine nützliche Eigenschaft auch für Systeme mit Totzeiten. at – Automatisierungstechnik, 53:178–188, 2005.Search in Google Scholar

25. J. Rudolph, F. Woittennek and J. von Löwis. Zur Regelung einer elektromagnetisch gelagerten Spindel. at – Automatisierungstechnik, 48(3):132–139, 2000.Search in Google Scholar

26. K. Schlacher. Flat sampled data systems, an algorithmic approach. arXiv e-prints, 2019. arXiv:1909.00555 [math.DS].Search in Google Scholar

27. H. Sira-Ramirez and S. K. Agrawal. Differentially Flat Systems. Marcel Dekker, New York, 2004.Search in Google Scholar

28. H. Sira-Ramirez and P. Rouchon. Exact delayed reconstructors in nonlinear discrete-time systems control. In A. Zinober and D. Owens, editors, Nonlinear and Adaptive Control, volume 281 of Lecture Notes in Control and Information Sciences, pages 351–360. Springer, Berlin, 2003.Search in Google Scholar

Erhalten: 2021-01-25
Angenommen: 2021-04-26
Online erschienen: 2021-06-30
Erschienen im Druck: 2021-07-27

© 2021 Kolar et al., publiziert von De Gruyter

Dieses Werk ist lizensiert unter einer Creative Commons Namensnennung 4.0 International Lizenz.