LINE AIRE UNE INTRODUCTION A LA 'FHÉOR~ GENEWALE DE L'APPROXIMATION QUADRATIQUE D'UNE APPLICATION. JEAN-JACQUES TÉ c HEN É (PAU, FRANCE)

Description
PROBABILITY AND MATHEMATKAL STATISTICS Vol. 15 (1995), pp UNE INTRODUCTION A LA 'FHÉOR~ GENEWALE DE L'APPROXIMATION QUADRATIQUE D'UNE APPLICATION LINE AIRE PAR JEAN-JACQUES TÉ c HEN É (PAU, FRANCE)

Please download to get full document.

View again

of 24
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Information
Category:

Sheet Music

Publish on:

Views: 19 | Pages: 24

Extension: PDF | Download: 0

Share
Transcript
PROBABILITY AND MATHEMATKAL STATISTICS Vol. 15 (1995), pp UNE INTRODUCTION A LA 'FHÉOR~ GENEWALE DE L'APPROXIMATION QUADRATIQUE D'UNE APPLICATION LINE AIRE PAR JEAN-JACQUES TÉ c HEN É (PAU, FRANCE) - Abstruct. The linear statistical inference constitutes one of the more usual frameworks for quadratic approximation of linear map pings. Generally, the set of observations is a Euclidean and the selected risk lunction is the trace of expectation of a quadratic loss function. ln fact, most common notions which one can manipulate there (Gauss-Markov's estimation for exarnple) are totally independent of al1 but linear structures on the space E of the observations. We would like to introduce here the general problem of the quadratic approximation of a linear mapping of a fmite-dimensional vector space E into another limite-dimensional vector space F, including that of the admissibility of solutions, without any other hypothesis other than the spaces E and F each being placed in separate duality with another vector space. We show how the positivity of the considered operators and the provision of a Euclidean structure on the image space F is sometimes necessary to assure the non-ernptiness of the set of solutions. We would like to end by giving, within this general framework, a proof of an extension of a fundamenta1 L. R. LaMotte [5] theorem based on the Hahn-Banach theorem Notations. Etant donnés une application T d'un ensemble E dans un ensemble F et une application S de F dans un autre ensemble G, l'application composée de T par S qui a tout u de E associe l'élément S(Tu) de F sera notée S O T et l'image T(E) de Im T Lorsque E et F sont deux espaces vectoriels sur un même corps (ici R), nous noterons 9(E, F) [resp. l'espace des applications linéaires de E dans F [resp. a. Pour chaque TE Y(E, F), nous désignerons par Ker T le noyau T-'((O}) de T 1.1. Sous-espaces affies d'un espace vectoriel. Nous nommero'm d'un espace vectoriel (ici réel) E i'image L par une translation d'un sous-espace vectoriel unique Z de E, appelé direction de L. Si v est le vecteur de 470 J.4. Téchené cette translation, on a donc L = {u) +Z, ce que l'on note plus simplement L = v + 2. Cette écriture ne dépend pas du choix de v dans L. On sait que deux sous-espaces &es de E, L = v + Z et L: = v' + Z',de directions respectives Z et Z', ont un point commun si, et seulement si, v- v' E Z+ Z', et que leur intersection est alors un sous-espace affine de E de direction ZnZ'. Soulignons en outre la propriété caractéristique suivante: pour qu'un sous-ensemble non vide L de E soit un sous-espace affiie de E, il faut et il suffit que, quels que soient les points distincts u et v de JL, la droite joignant u et v soit contenue dans L, autrement dit que?. (VAEK)(V(u, v) L2) Au+(~-A)uEL Fosmes aiilinéiéakes et dualité. Soient (E, E') un couple d'espaces vectoriels réels et q une forme bilinéaire sur E x E'. Nous dirons alors que E et E' sont en dualité relativement à y ou que ip est une dualiti sur E x E'. Lorsque E' = E, nous dirons plus simplement que y est une dualité sur E. Rappelons que toute forme bilinéaire cp sur E se décompose d'une maniere unique en ip = cp, + cp,, ou cp, est symétrique et 9, antisymétrique. Toute application q de E dans R telle qu'il existe une forme bilinéaire symétrique rp sur E vérifiant, pour chaque XEE, q(x) = V(X, x), est appelée forme quadratique sur E. La dualité sur E.définie par Y) = 4Cq(x+~)-q(x)-qI~ll est nommée forme polaire de q, et l'identité 2$(x, Y) = q(x+y)-q(x)-q(~), identité de polarisation. Nous dirons que deux espaces vectoriels réels E et E' sont en dualité sépamnte relativement à une forme bilinéaire cp (sur E x E') si y est non dégénérée, autrement dit si, pour tout x non nul de E, il existe y~ E' tel que cp(x, y) # O et si, pour tout y non nul de Et, il existe XE E tel que cp(x, y) # O. Pour tout espace vectoriel réel E, de dual E* (espace des formes linéaires sur E), le couple (E*, E) est clairement en duaiité séparante relativement à la forme bilinéaire canonique sur E* x E, notée (-,*), qui à tout (y*, x) de E* x E associe le réel (y*, x) = y*(x). Evidemment, un espace vectoriel réel de dimensionfinie ne-peut être en dualité séparante qu'avec un espace vectoriel E' de même dimension et E' est alors canoniquement isomorphe à E*. Dans ce cas, nous dirons que (E, E') est un système duue (sans autre précision) et noterons, si aucune confusion n'est à craindre, par (x, y} la valeur en (x, y) de la forme bilinéaire cp sur E x E', et donc logiquement par Z' [resp. Z ] l'orthogonal dans E' [resp. dans -j de toute partie Z [resp. Zl de E Iresp. E']. Lorsque E' est l'espace E*, il est entendu que la forme biiinéaire alors mise en jeu est la forme bilinéaire canonique sur Ex E*. Soient (E, E') et (F, Fr) deux systèmes duaux et $ une forme bilinéaire sur E x F. Pour tout x E E, l'application $(A-,-): y -, $(x, y) est une forme linéaire sur F et donc il existe un élément unique ZEF' tel que $(x, y) = (x, z) pour tout y EF. Il est immédiat que M: x + z est l'unique application linéaire de E Lapproximation quadradique d'une application linéaire 47 1 dans Fr telle que, pour chaque {x, y) de E x F, $(x, y) = (y, Mx) et que l'application I) + M est un isomorphisme de l'espace vectoriel W(E x F) des formes bilinéaires sur E x F sur l'espace vectoriel Y (E, F'). Nous identifierons l'espace B(E, F) i l'espace 9(E, F') et chaque forme bilinéaire $ sur Ex F' à son application linéaire associée M. Pour tout système dual (E, Er), cette identification nous améne à appeler tenseur sur E toute application linéaire M de E dans E', à dire que M est symétrique si nous avons (x, My) = (y, Mx) pour tout (x, y)s~', positg [resp. strictement positlfl sur un sous-espace vectoriel Z de E si (x, Mx) 2 O 1 pour tout X-EZ [resp. O pour tout x de Z\(O)] et à confondre légitimement les notions de forme quadratique et de tenseur symétrique sur E. Nous définirions de même un tenseur sur Ef. Nous désignerons respectivement par 9,(E, E') et YS (E, E') l'ensemble des tenseurs symétriques sur E et l'ensemble des tenseurs symétriques et positifs sur E. Considérons maintenant deux systèmes duaux (E, Er) et {F, Fr) (nous noterons indistinctement (., *) les deux dualités associées) et T une application linéaire de E dans F. L'application cp de E x F' dans R qui à tout couple (x, y) associe le réel (Tx, y) est une forme bilinéaire sur Ex P, de transposée tq: (y, x) + (î3, y). Il existe ainsi une application linéaire et une seule de F' dans E', notée 'T et appelée transposée de I: telle que, pour chaque (x, y) E E x Fr, ( Tx, y) = (x, ' Ty . Quand E' = E* et Fr = F*, la transposée de T n'est autre que l'application qui à tout y* E F* associe l'élément y* 0 Tde E*. Nous supposons connues les propriétés fondamentales de la transposition, notamment le théorème de Farkas: pour toutes parties C et D de E et F respectivement, nous avons i l'égalité ayant lieu, en particulier, si D est un sous-espace vectoriel de F (et donc Im 'T = (Ker T)') Produits tensoriels en diniension finie. Considérons un système dual (E, Er), un espace vectoriel réel F et un couple (2, W) de sous-espaces vectoriels de E' et F respectivement. Pour tout élément {u, y) de E' x F, soient l'application linéaire élémentaire x -i (x, u)y de E dans F et le sous-espace vectoriel de 9(E, F) engendré par y: (u, y) E Z x W). L'application cp qui à (u, y) associe est une application bilinéaire de Z x W dans ZO W et (ZO W, cp) est un couple universel dans le sens ou rp(z x W) engendre linéairement W et où, pour toutes bases {ui: i s I] de Z et {y,: ja 1) de tt: {cp(u,, yj): (i, 3 E I x J) est une base de l'espace W (vérification laissée au lecteur). Pour tout espace vectoriel réel H et toute application bilinéaire $ de Z x W dans H, il existe donc une seule application linéaire T de W dans H telle que I) = TO cp, d'où il résulte que W apparaît comme un produit tensoriel de Z par W (cf. [2] par exemple). C'est pourquoi, nous nommerons ~ 472 J.-J. Téçhené produit tensoriel de Z par et noterons Z8W le sous-espace vectoriel de 9(E, F) engendré par l'ensemble (u, y) E Z x W}. Les éiéments de W de la forme seront dits décomposabks. Etant donnes quatre systèmes duaux (E, E'), (F, F'j, (G, G') et (H, H'), les règles opératoires de ces produits tensoriels (laissées à la diligence du lecteur) sont les suivantes: (i) Quels que soient les sous-espaces vectoriels Z et 2' de E', W et W' de F, W') = (ZQ W). (ii) Quel que soit {u, y j E' ~ x F, = y8u. (iii) Quels que soient (A, 3) E 2P(Et, H') x Y(F, G) et (u, y) E E' x F, PROWSITI~N 1.1. Etant donnés un système duai (E, Er) de dimension finie et un.espace uectoriei réel F, on a 9(E, F) = E'QF et, plus généralement, pour tout sous-ensemble L de E et tout sous-espace vectoriel W de F: {TE$P(E, F): L c Ker T et Im T c W) = Preuve. Soient T une application linéaire de E dans F, { f,,..., S,} une base de Im T et, pour tout j~ (1,..., q), ujs la forme linéaire sur E qui i chaque XE E associe la composante du vecteur Tx sur R'. Il suit clairement (Vxs E) Tx = 2 uf(x)ft = 2 {x, uj}fi, j= 1 j= 1 où uj est l'unique élément de E' tel que uj*(x) = {x, uj) pour tout XE E; il en découle que Y(E, F) = E'QF, car E étant de dimension fmie, l'ensemble des applications linéaires de rang fini de E dans F coïncide avec Y(E, F). Maintenant, pour chaque (u, x K il est immédiat que appartient à l'ensemble A = {TE Y(E, F): L c Ker T et Im T c W) et donc que W c A. Réciproquement, soit T= z;=l un élément de A, ou (f,,..., f,} est une famille libre de P (la preuve de la relation Y (E, F) = montre clairement que toute application linéaire de E dans F peut s'écrire ainsi). L'indépendance linéaire des vecteurs f,,...,f, entraîne alors que, quel que soit XEL, la relation Tx = O équivaut à (x, uj = O pour tout je{l,..., q); on en déduit que: L ckerte(vj~(1,..., q)) uj k et Ia propriété cherchée en résulte immédiatement. i Exprimant que chaque vecteur f, d'une base de Im T s'écrit comme combinaison linéaire unique de vecteurs de toute base de K on obtient plus précisément le Eapproximation quadratique d'une application linéaire 473 COROLLAIRE 1.2. POUT toute base {yj: JE J) de W chaque élément T de ZQ Ws'écrit d'une maniire et d'une seule sous la fomze T = CjsJ oei uj Z pour tout ~ EJ. Considérons maintenant trois systémes duaux (E, E'}, (F, F') et (G, G'). Compte tenu de la proposition 1.1 préckdente, le théorème de factorisation des applications linéaires (121, p. 13) conduit alors aussitôt aux résultats suivants: COROLLAIRE 1.3. Soit Z un sous-espace vectoriel de E'. Pour toute application linéaire R de E dans G telle que Ker R = z', on cl Z6 F = (S OR: SE S(G, F)). COROLLAIRE 1.4. Soient T et A deux applications linéaires de G dans E et de G dans F telles que Ker T c Ker A. Alors l'ensemble r = {X E 9 (E, F}: X 0 T = A) est un sous-espace ubne de 3(E, F) de direction A = En effet, A est l'ensemble des X de 9(E, F) tels que Tm T c Ker X, d'ou le résultat d'après le corollaire 1.3, car (Im T)' = Ker tt. Enfin, la démonstration de la proposition suivante n'est qu'une simple vérification laissée au lecteur: PROPOSITION 1.5. Soient (E, Er) et (F, P') deux systémes duaux. Les espaces vectoriels PIE, F) et $P(E', F') sont alors en dualité séparante relativement u Ia forme bilidaire 'P déjinie [sz~r une famille génératrice de 9(E, F) x Y (E', Ff)] Par 'Y(uOy, = (x, u) (Y, v pour tous couples (u, x) et (u, y) respectivement de E' x E et Ff x F. De plus, pour chaque couple (2, W) de sous-espaces vectoriels de Ef et F respectivement, E'orthogonal de W relativement a Y dans L?(E', F') est WL. Les éléments des espaces 9(E, et Y(Er, F') étant notés par les lettres latines majuscules, ou par un produit tensoriel de vecteurs s'il s'agit d'éléments décomposables, nous noterons, sans risque de confusion possible, (A, B) la valeur en (A, B) de la forme bilinéaire Y. Etant donné un système dual (E, E'J, la relation 9(E) = montre qu'il existe une forme linéaire et une seule sur $p(e), appelée trace et notée tr, telle que: (V(u, x)~e'x E) = (x, u). Comme, pour tout (u, x) et (v, y) de E' x E, O (vq y) = (y, u) y, il est clair que l'on a = dont il résulte aussitôt que, d'une part, pour tout couple (A, B) d'endomorphismes de E, on a tr(a OB) = tr(b O A) et tr fl = tr A, et d'autre part, que si F' = F, la dualité Y sur Y(E, F) x Y(E', F) définie par la proposition 1.5 n'est autre 474 J.4. Téchené que la forme bilinéaire telle que: (V(S, T)EY(E, F)xY(Ef, F)) (S, T) = tr(sott) = tr(tors). Entin Ipropriété bien connue laissée au lecteur), si E est euclidien, la restriction de la trace à i'ensemble Y;(E) des tenseurs symétriques et positifs sur E est injective La génémti~n des c6nes convexes. Rappellons que l'on dit qu'une partie C d'un espace vectoriel réel E est un cône lorsque C est stable pour toutes les homothéties vectorielles de rapport strictement positif. Si l'origine O appartient à C, le cône C est dit pointé. Un cône convexe saillant est un cône convexe pointé qui ne contient aucune droite vectorielle. 0iï sait que, pour qu'une partie C de E soit un cône convexe, il faut et il suffit que l'on ait C + C c C et AC c C pour tout L 4 et que, si C est un cône convexe, l'ensemble C-C est le sous-espace vectoriel de E engendré par C. Le cône convexe engendré par une partie A de E est donc l'ensemble des combinaisons linéaires ~if,aix,, où {xi: ~ E I est } une famille finie non vide quelconque d'éléments de A, et où Ai O pour tout i~l. Par ailleurs, si C est un cône convexe pointé de E, le plus grand sous-espace vectoriel de E contenu dans C est i'ensemble (non vide) V = Cn (- C): en effet, ÂV = V pour tout réel A # O, et de plus ce qui montre que Vest un sous-espace vectoriel de E, qui contient à l'évidence tout sous-espace vectoriel de E inclus dans C. Il s'ensuit qu'un cône convexe C est saillant si, et seulement si, Cn(-C) = {O). Nous appellerons base d'un cône convexe pointé C toute partie convexe B de E, s'il en existe, ne contenant pas l'origine O et telle que C = R+ B = (Lx: Â E R+, x E B). NOUS laissons au lecteur le soin de vérifier que, si un cône convexe pointé C admet une base B, alors C n'est autre que le cône convexe engendré par B au sens où C est l'ensemble des combinaisons linéaires positives x,aixi, où {xi: i~ 1) est une famille finie non vide quelconque d'éléments de B et où Ai 2 O pour tout i~ I. Le résultat suivant a été démontré par L. R. LaMotte dans un cadre plus restreint ([SI, p. 248): PROPOSI~ON 1.6. Soit E un espace vectoriel réel topologique séparé de dimension $nie. Alors: (i) Tout cône convexe femé saillant de E admet une base compacte. (ii) Pour tout cône convexe fermé C de E, il existe une partie convexe compacte A ne contenant pas l'origine 0, appelée socle de C, telle que C=R'A+V et R+AnV=(O}, où V est le plus grand sous-espace vectoriel de E contenu dans C. ~pproximution quadratique d'une application linéaire 475 Preuve. (i) On sait que l'unique topologie vectorielle séparée sur un espace vectoriel réel de dimension finie E (dite canonique) peut être définie par une norme arbitraire \I.II sur E (cf. [l]). Soit C un cdne convexe fermé saillant de E et considérons la sphère-unité S de E. Alors l'ensemble A = CnS est un fermé de S et donc, comme S, un compact de E. Son enveloppe convexe %?(A) est donc aussi compacte dans E. De plus, l'origine O n'appartient pas a %'(A). zy=, En effet, si l'origine appartenait a $?(A), il existerait une combinaison convexe aixi d'au moins deux points x,, x,,..., x, de A (car O & A) qui serait nulle, et on aurait (en supposant par exemple que A, # 0) n Xi = -( c nixi)/n1. i=2 Autrement dit, comme x, E A et que 0 4 A, Rx, P (O} et -x, appartiendrait également au sous-ensemble A, d'oc l'on déduirait que Rx, c C, car C est un cône convexe de E (et donc C + C c C et AC c C). Ii en résulterait que C, côlne convexe saillant par hypothèse, contiendrait un sous-espace vectoriel de E autre que {O), ce qui est impossible car Cm(- C) = {O). De plus, pour tout x non nul de C, on a Ilxll -lx A et donc C est contenu dans le cone convexe fermé engendré par %(A). Comme C est un cône convexe contenant %(A), on a l'inclusion opposée, et par suite %'(A) est bien une base compacte de C. (ii) Soit C un cône convexe fermé de E. Remarquous que, pour tout supplémentaire W de V = Cn(- C) dans E, on a C = Cri W + E En effet, pour tout x de C, on peut écrire x = v + w avec v E V et w E W, comme alors w=x-vec+v et que C+VcC+Cc C, il vient WEC~W et donc C c Cn W + V L'inclusion opposée est triviale. L'application de (i) au cône convexe fermé saillant CnW donne alors immédiatement (ii). A noter que cette proposition est généralement fausse en dimension infinie car sa démonstration repose sur la compacité de la boule-unité. 2. ORTHOGONALITÉ ET PROJECTION RELATIVEMENT A UN TENSEUR SYMÉTRIQUE 2.1. L'orthogonalité relativement à un tenseur symétrique. Nous considèrons une fois pour toutes, dans ce paragraphe, un système dual (E, E'). Etant donnés un tenseur symétrique M sur E et un sous-ensemble A de E, il est immédiat que [M(A)IL est l'orthogonal de A dans E relativement au tenseur M (c'est-à-dire relativement à la forme bilinéaire sur E qui à tout (x, y) associe (x, My)). Comme M est symétrique, alors en vertu du théorème de Farkas (9 1.1), [M(A)IL est identique à M-l(A1). Afin de distinguer cette orthogonalité de ceîle relative à la dualité (., *) sur Ex E', nous dirons que [M(A)IL est le sous-espace (vectoriel) M-orthogonal de A dans E; nous le noterons ALM. Lorsque M est un tenseur symétrique sur E', il est clair que 476 J.-J. Téchené l'on peut définir de la même maniére le sous-espace M-orthogonal d'un sous-ensemble A' de E'. PROPOSITION 2.1. Soient M un tenseur symétrique sur E et Z un sous-espace vectoriel de E. Si M est positif sur Z, les relations suivantes sont équiualentes et vér$ées: (i) ZL n M(Z) = (O), (ii) E = Z+ZLM, (iii) ImMcZ1+M(;o). Preuve. Soit M, la restriction de M au sous-espace S. Comme M est positif sur Z, l'inégalité de Cauchy-Schwarz entraîne aussit8t que KerM, = (~ 2: {u, Mu) = 0). Il suit que tout u = MZE ZLnM(Z), avec z E Z, est tel que 0 = {z, u) = (z, Mz), donc nécessairement nul, car alors.ze KerM,, ce qui prouve (i). L'équivalence entre (i) et (ii) s'obtient immédiatement par passage aux orthogonaux, étant donné que ZLM = [M(2)I1. Par ailleurs, la relation M -'[M(Z)] = Z + Ker M implique que: ZLnM(Z) = (O)~Z~M-~(Z')C KerM, où M-'(ZL) = [M(Z)I1. L'équivalence entre (i) et (iii) s'en déduit par passage aux orthogonaux. i On notera que la relation (iii) entraîne que ZL +Im M c ZL + M(Z), dont on déduit aussitôt que Zi + Im M = ZL + M(Z), et par suite que ZnKer M = ZnZLM. D'où également la PROPOSITION 2.2. Pour tout sous-espace vectoriel Z de E et tout tenseur symétrique M sür E, positif sur Z, on a: (i) ZL+ImM = (ii) ZnKerA4 = ZnZLM, (iii) Z' + Im M = E, si M est strictement positif sur Z Projection relativement à an tenseur symétrique. Soient Z un sous-espace vectoriel de E, M un tenseur symétrique sur E, R une application d'un ensemble d dans E' et D une application de d dans E. Pour chaque v E 8, considérons le programme quadratique: THÉORÈME 2.3. Pour que le programme (Po) admette au moins une solution pour chaque v E 8, il faut et il suit que M soit positif sur Z et que Im(M 0 D - R) soit contenu dans ZL+ Im M. L'ensemble des solutions de (P,) est alors un sous-espace affe de E de direction ZnKer M. Z:approximation quadratique d'une application linéaire 477 Preuve. Pour tout DE&, le gradient en ~ E de E l'application q: u (u, Mu - 2Rv) est Vq(a) = 2(Ma - Ru). Donc, pour que 3 est une solution de (B,), il faut et il sat qu'il existe x E Z tel que l'on ait à la fois ü = x + Dv et MC- RU E ZL. La condition est donc nécessaire pour que (P,) admette une solution pour chaque if&. Par ailleurs, l'identité de polarisation (5 1.1) appliquée au tenseur M conduit, pour tout (u, Z) E E x E, a l'identité:... (1) (u+z, M(u+z)-2Rv)-{u, Mu-2Rv) = 2(z, Mu-Rv)+(z,
Related Search
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks