Cauchy-Schwarz : une clé fondamentale des inégalités et des espaces vectoriels

Introduction à l’inégalité de Cauchy-Schwarz et ses usages essentiels
L’inégalité de Cauchy-Schwarz, aussi connue sous le nom d’inégalité de Schwarz ou, dans certaines variantes, de l’inégalité de Cauchy-Bunyakovsky-Schwarz, est l’un des instruments les plus polyvalents de l’analyse mathématique. Elle lie, de manière élégante et puissante, la mesure d’un vecteur et celle d’un second vecteur au sein d’un espace vectoriel muni d’un produit scalaire. En termes simples, elle propose que le produit scalaire entre deux vecteurs ne puisse jamais surpasser le produit de leurs normes respectives. Cette relation provoque des conséquences profondes dans des domaines aussi variés que l’algèbre linéaire, l’analyse réelle, l’analyse complexe, les probabilités, l’optimisation et même la physique.
Le présent article se propose d’explorer, pas à pas, toutes les facettes de Cauchy-Schwarz : son énoncé clair, ses preuves élémentaires, ses cas d’égalité, ses différentes variantes et généralisations, ainsi que ses applications concrètes. On abordera aussi les versions pour les espaces de fonctions et les espaces de dimensions infinies, qui jouent un rôle central en analyse fonctionnelle et en théorie des mesures. Enfin, nous proposerons des exemples illustratifs et des conseils intuitifs pour comprendre pourquoi cette inégalité est si omniprésente dans les mathématiques et ses applications.
Origines, histoire et contexte mathématique
Le contexte mathématique et les précurseurs
L’inégalité de Cauchy-Schwarz puise ses racines dans des idées simples sur le produit scalaire et la Norme. Dès le XVIIe et le XVIIIe siècle, les mathématiciens ont commencé à étudier les relations entre les longueurs et les angles dans les espaces vectoriels. Cependant, ce n’est qu’au XIXe siècle que deux noms se sont imposés pour formaliser la relation qui porte aujourd’hui leur nom: Augustin-Louis Cauchy et Hermann Schwarz. Leurs travaux ont abouti à une formulation qui s’applique à des vecteurs réels ou complexes, dans des espaces à dimension finie, puis à des espaces fonctionnels beaucoup plus généraux.
L’inégalité porte aujourd’hui le nom de Cauchy-Schwarz, mais on la retrouve aussi sous les appellations – parfois interchangeables – d’inégalité de Schwarz ou inégalité de Cauchy-Bunyakovsky-Schwarz. Cette diversité de nomenclature reflète l’histoire riche et les contributions de plusieurs mathématiciens qui ont chacun apporté une pierre à l’édifice.
Une inégalité simple, mais d’une portée inouïe
L’idée centrale est intuitive: pour tout couple de vecteurs, le alignement entre eux ne peut dépasser le produit des longueurs. Autrement dit, le degré d’alignement ne peut pas être plus important que ce que permet l’étendue respective des deux vecteurs. Cette observation simple se traduit par des inégalités strictes qui s’appliquent dans des contextes très variés : sommes finies, intégrales, espaces de fonctions, et même matrices et opérateurs.
Énoncé classique et formulations variées
L’énoncé typique pour les vecteurs réels est le suivant : pour tout vecteur a = (a1, a2, …, an) et b = (b1, b2, …, bn) dans R^n, on a
(a1 b1 + a2 b2 + … + an bn)² ≤ (a1² + a2² + … + an²) (b1² + b2² + … + bn²).
En introduisant le produit scalaire ⟨a, b⟩ = ∑ ai bi et les normes associées ||a|| = sqrt(⟨a, a⟩), l’énoncé prend une forme plus générale :
⟨a, b⟩² ≤ ||a||² ||b||².
Dans les espaces complexes, la définition du produit scalaire prend généralement la forme ⟨a, b⟩ = ∑ ai conj(bi), et la même inégalité demeure valable, mais avec le module de ⟨a, b⟩ au lieu du carré pour insister sur les valeurs réelles. Cela souligne une autre importance de Cauchy-Schwarz : elle s’adapte harmonieusement à l’analyse réelle et à l’analyse complexe.
D’autres formulations utiles incluent l’égalité des angles: l’inégalité de Cauchy-Schwarz équivaut à dire que l’angle θ entre a et b satisfait cos θ ≤ 1, et que l’angle est défini par cos θ = ⟨a, b⟩ /(||a|| ||b||). Si l’un des vecteurs est nul, l’inégalité est triviale et l’angle est indéterminé; sinon, elle propage une notion d’alignement qui peut être interprétée géométriquement comme le fait que la projection d’un vecteur sur l’autre ne peut excéder la longueur des vecteurs pris séparément.
Preuves et idées essentielles
Preuve standard par la non-négativité d’un carré
Considérons trois nombres réels et la polygénéité classique : pour tout réel t, on a
0 ≤ ||a − t b||² = ⟨a − t b, a − t b⟩ = ||a||² − 2t ⟨a, b⟩ + t² ||b||².
En tant que polynôme en t, ce membre est borné en dessous par zéro, donc son discriminant doit être négatif ou nul. Le discriminant vaut D = 4 ⟨a, b⟩² − 4 ||a||² ||b||². Or, D ≤ 0 équivaut à ⟨a, b⟩² ≤ ||a||² ||b||², ce qui établit l’inégalité. Cette démonstration est directe et met en évidence le lien entre la projection et la distance dans l’espace.
Preuve par l’inégalité de Minkowski et les combinaisons linéaires
Une autre approche consiste à considérer les combinaisons linéaires de vecteurs et à exploiter la positivité de certaines sommes. En particulier, on peut étudier la somme ∑ (λ ai − μ bi)² pour des scalaires λ et μ et optimiser par rapport à ces paramètres pour obtenir l’inégalité. Cette méthode éclaire la nature de l’inégalité comme une contrainte géométrique sur les projections et les longueurs.
Preuve via le Gram et les déterminants
Dans un cadre linéaire, l’inégalité peut être formulée avec le déterminant du Gram. Pour des vecteurs a1, a2, …, ak et b1, b2, …, bk, le déterminant du Gram reste non négatif. Cette perspective lie directement Cauchy-Schwarz à la positivité des matrices de Gram et à la condition d’indépendance linéaire des vecteurs.
Cas d’égalité et interprétation géométrique
L’inégalité de Cauchy-Schwarz devient une égalité si et seulement si les vecteurs sont alignés, c’est-à-dire l’un est proportionnel à l’autre. En termes simples, il existe une constante α telle que a = α b (ou b = 0 ou a = 0). Cette caractéristique est extrêmement utile en analyse, car elle permet de reconnaître les cas où les projections ne réduisent pas l’information et, par extension, d’identifier les directions propres ou les directions optimales dans des problèmes d’optimisation.
Les cas d’égalité apparaissent aussi fréquemment dans les démonstrations d’inégalités associées et dans les critères d’orthogonalité. Par exemple, dans l’espace vectoriel réel, si ⟨a, b⟩ = ||a|| ||b||, alors a et b pointent dans la même direction. Si ⟨a, b⟩ = −||a|| ||b||, alors ils pointent dans des directions opposées. Lorsque l’un des vecteurs est nul, l’égalité est triviale mais utile comme repère de référence.
Extensions et variantes importantes
Version généralisée et espaces complexes
Dans les espaces complexes, l’inégalité prend en compte le conjugé complexe dans le produit scalaire. Pour tout a et b dans un espace complexe avec produit scalaire conjugué, on a
|⟨a, b⟩|² ≤ ⟨a, a⟩ ⟨b, b⟩.
Cette version est essentielle pour les applications en analyse de Fourier, en théorie des opérateurs et en physique quantique, où les amplitudes et les phases requièrent une manipulation soignée des conjugués.
Inutilité et variantes pour les intégrales et fonctions
L’inégalité s’étend naturellement aux espaces de fonctions: pour f et g dans L²(a, b), on a
|∫ f(x) g(x) dx|² ≤ ∫ |f(x)|² dx · ∫ |g(x)|² dx.
Cette version, cruciale en analyse fonctionnelle, permet d’évaluer des corrélations, des covariances ou des amplitudes lorsqu’on travaille avec des fonctions continues ou des fonctions mesurables. Elle est aussi un élément clé dans les preuves relatives à la convergence des séries et des intégrales, et elle apparait dans les démonstrations de l’ampleur de la moyenne et de la variance.
Version probabiliste et statistiques
Dans le cadre des probabilités, l’inégalité de Cauchy-Schwarz s’applique à des variables aléatoires X et Y avec des espérances finies :
|E[XY]| ≤ sqrt(E[X²] E[Y²]).
Cette forme est enseignée très tôt en statistiques et en théorie des probabilités car elle permet d’obtenir des bornes sur les corrélations et de justifier des estimations dans les modèles stochastiques. Elle est à la base des techniques d’analyse de régression et d’inférence où l’indépendance est absente ou difficile à démontrer.
Version pour les matrices et le vecteur propre
Pour des colonnes de vecteurs et des matrices positives, Cauchy-Schwarz se relie étroitement à la notion de Gram et d’indépendance linéaire. Le domaine des matrices symétriques positives dégage des inégalités utiles comme celles qui lient les valeurs propres et les produits scalaires. Cette perspective est utile pour l’analyse numérique, l’optimisation et les méthodes d’échantillonnage.
Forme et interprétation géométrique avancées
En géométrie, l’inégalité de Cauchy-Schwarz se traduit par une borne sur la longueur d’un vecteur projeté sur un autre vecteur. Si l’on projette a sur b, la longueur de la projection est donnée par |⟨a, b⟩| / ||b||, et l’inégalité garantit que cette longueur ne dépasse pas ||a||. Cette idée éclaire les notions d’angle et de proximité dans les espaces vectoriels et sous-tend les méthodes de réduction de dimension, telles que la décomposition en composantes principales (PCA) ou les procédures d’orthogonalisation.
Forme matricielle et déterminant de Gram
Le cadre matriciel révèle une autre facette de Cauchy-Schwarz via la matrice de Gram G = [⟨vi, vj⟩], où {vi} est une famille de vecteurs. Le déterminant de Gram est non négatif et nul exactement lorsque les vecteurs sont linéairement dépendants. Cette observation met en évidence le lien profond entre l’inégalité et la positivité de Gram, et elle est centrale dans les tests d’indépendance linéaire et dans l’analyse des espaces de Fonctions.
De plus, la preuve de l’inégalité peut être reformulée comme un énoncé sur le rang et sur les combinaisons linéaires des vecteurs. Cela donne des outils pratiques pour évaluer rapidement les bornes d’innombrables quantities dans des systèmes multi-variés.
Applications pratiques et domaines d’utilisation
Géométrie et angles entre vecteurs
L’inégalité de Cauchy-Schwarz est un pilier lorsqu’il s’agit de mesurer des angles entre vecteurs. En pratique, elle permet de donner des critères rigoureux pour décider si deux vecteurs sont proches d’être colinéaires, et elle fournit une base solide pour estimer l’angle arccos(⟨a, b⟩ / (||a|| ||b||)). Dans les méthodes numériques, cela aide à la stabilisation des algorithmes et à l’évaluation de la condition numérique des systèmes linéaires.
Analyse de données et statistiques
Dans le domaine des statistiques, Cauchy-Schwarz permet d’estimer des covariances et des corrélations sans faire appel à l’indépendance stricte. Par exemple, la corrélation entre deux grandeurs mesurées peut être bornée par la racine du produit des variances, ce qui donne des bornes robustes pour des modèles réels souvent sujets au bruit et aux dépendances partielles.
Physique et mécanique
En physique, l’inégalité de Cauchy-Schwarz se retrouve dans les formulations des états quantiques et dans l’étude des opérateurs. Le produit scalaire représente l’amplitude de projection d’un état sur un autre, et la borne assure que les amplitudes restent contraintes par l’énergie et par la normalisation des états. Cette structure mathématique est reconnue comme un outil de base pour la démonstration d’inégalités énergétiques et pour l’analyse des incertitudes.
Informatique, apprentissage automatique et traitement du signal
Dans l’apprentissage automatique et le traitement du signal, Cauchy-Schwarz est souvent utilisé dans les étapes d’optimisation, pour contrôler la stabilité des algorithmes et pour évaluer la similarité entre vecteurs de caractéristiques. Dans les méthodes de régression ou de classification, cette inégalité sous-tend des bornes sur les erreurs et sur la convergence des algorithmes itératifs lorsque les données sont projetées sur des sous-espaces orthogonaux.
Version probabiliste et analyse des variables aléatoires
Lorsque l’on travaille avec des variables aléatoires X et Y, l’inégalité de Cauchy-Schwarz fondée sur les espérances donne des bornes pratiques pour les covariances et les corrélations. Concrètement, si E[X²] et E[Y²] existent et sont finies, alors
|E[XY]| ≤ sqrt(E[X²] E[Y²]).
Cette version est utile pour évaluer rapidement la dépendance linéaire et pour justifier des inégalités de concentration ou de performance dans les modèles probabilistes. Elle est utilisée en théorie des moindres carrés, en estimation et en analyses de données expérimentales où les mesures sont bruitées.
Applications en analyse fonctionnelle et espaces de fonctions
Intégrales et L²
Dans les espaces de fonctions, l’inégalité demeure une brique fondamentale. Pour f et g appartenant à L²(a, b), elle se réécrit comme suit :
|∫_a^b f(x) g(x) dx| ≤ (∫_a^b |f(x)|² dx)^{1/2} (∫_a^b |g(x)|² dx)^{1/2}.
Cette version est le cœur des méthodes d’approximation, des expansions en séries orthogonales et des théorèmes de projection. Elle permet d’évaluer la manière dont deux signaux peuvent coexister sans se brouiller et permet d’analyser les coefficients de Fourier et les bases orthonormées.
Espaces de fonctions et orthogonalité
L’inégalité est aussi le socle pour la notion d’orthogonalité: deux fonctions sont orthogonales si leur produit scalaire est nul. Dans les espaces de fonctions, cela se traduit par des propriétés spectrales et par la décomposition de signaux en combinaisons linéaires de fonctions de base. C’est une philosophie centrale dans l’analyse spectrale et dans les méthodes d’approximation par les séries de Fourier et les polynômes orthogonaux.
Exemples concrets et démonstrations guidées
Exemple 1 : estimation d’un produit scalaire
Soit a = (3, 4) et b = (2, 1). Calculons les quantités
⟨a, b⟩ = 3×2 + 4×1 = 6 + 4 = 10, et ||a|| = sqrt(3² + 4²) = 5, ||b|| = sqrt(2² + 1²) = sqrt(5).
Alors ⟨a, b⟩² = 100 et ||a||² ||b||² = 25 × 5 = 125. Comme 100 ≤ 125, l’inégalité est vérifiée, et on peut interpréter que l’angle entre a et b est modérément aigu.
Exemple 2 : version L² avec fonctions
Considérons f(x) = x et g(x) = x² sur l’intervalle [0, 1]. Alors
∫_0^1 f(x) g(x) dx = ∫_0^1 x³ dx = 1/4, et ∫_0^1 f(x)² dx = ∫_0^1 x² dx = 1/3, ∫_0^1 g(x)² dx = ∫_0^1 x⁴ dx = 1/5.
Ainsi |1/4| ≤ sqrt((1/3)(1/5)) = sqrt(1/15) ≈ 0.258. Or 1/4 = 0.25, ce qui est bien inférieur à 0.258, illustrant l’inégalité pour des fonctions continues sur un domaine fini.
Conclusion et perspectives
L’inégalité de Cauchy-Schwarz, ou Cauchy–Schwarz, est bien plus qu’un résultat isolé. C’est une idée omniprésente, qui façonne la façon dont nous mesurons les distances, les angles et les corrélations dans une infinité de contextes. Son pouvoir ne réside pas seulement dans l’étendue d’un énoncé, mais dans sa capacité à s’appliquer à des structures très différentes, des vecteurs dans R^n aux fonctions dans des espaces de dimension infinie, jusqu’aux objets aléatoires et opérateurs qui modélisent le monde réel.
En mathématiques appliquées, Cauchy-Schwarz continue de guider les méthodes d’analyse numérique, les démonstrations d’inégalités optimales et les preuves d’estimations robustes. En théorie pure, elle s’emboîte avec d’autres résultats fondamentaux comme l’inégalité de triangle, l’inégalité de Jensen ou les théorèmes de projection et d’orthogonalité. C’est une pierre angulaire qui unifie l’algèbre linéaire, l’analyse et les probabilités, tout en restant accessible et puissante pour une large communauté de lecteurs et de chercheurs.