Pense-bête |
Notions mathématiques
Rappel concernant les mathématiques élémentaires
– et
– Si alors où la multiplication est répétée fois.
– Le logarithme en base satisfait .
– On a .
– On a .
– On a aussi .
– La somme d’une séquence est notée .
– Le produit d’une séquence est noté .
– Le logarithme d’un produit est une somme : .
– L’exponentielle d’une somme est un produit : .
– La fonction est monotone croissante (respectivement décroissante) si lorsque .
– Le symbole est l’infini. Nous savons que , mais n’est pas défini.
– Le logarithme est défini pour les nombres supérieurs à zéro, avec la convention que . C’est une fonction monotone croissante.
– La factorielle est définie par . La factorielle de 1 est 1 ().
– Un élément appartient à un ensemble : .
– Si est un nombre, alors est sa valeur absolue : si et si .
– Si est un ensemble, alors est la cardinalité de l’ensemble (le nombre d’éléments).
– L’ensemble vide est noté .
– En logique booléenne, VRAI ET VRAI est VRAI, VRAI ET FAUX est FAUX, FAUX ET VRAI est FAUX, FAUX ET FAUX est FAUX. VRAI OU VRAI est VRAI, VRAI OU FAUX est VRAI, FAUX OU VRAI est VRAI, FAUX OU FAUX est FAUX.
Vecteurs et matrices
Ensemble
L’ensemble des nombres réels (incluant les nombres à virgule flottante) est noté .
L’ensemble des entiers est noté .
Valeur absolue
Étant donné ou , alors si et si .
Nombres complexes
Les nombres complexes sont notés , avec , et .
Vecteur
Un vecteur est un tableau à une dimension. Le nombre de cellules du tableau est le nombre de composantes du vecteur.
Exemple :
On note la composante du vecteur . Dans notre exemple, .
Matrice
Une matrice est un tableau à deux dimensions ayant rangées et colonnes comme dans cet exemple :
On note la valeur se situant à la rangée et à la colonne de la matrice . Dans l’exemple précédent, vaut 2 alors que vaut 3.
Multiplication d’un vecteur ou d’une matrice par un scalaire
Si les composantes du vecteur ou de la matrice sont des entiers ou des nombres réels, on peut les multiplier par un entier ou un nombre réel (un scalaire).
La multiplication se fait alors sur chaque composante comme dans cet exemple :
Multiplication de vecteurs et de matrices
Étant donné une matrice ayant rangées et colonnes et un vecteur ayant composantes, la multiplication de et de , notée , est un vecteur ayant composantes et défini comme :
Voici un exemple :
Multiplication de matrices avec d’autres matrices
Étant donné une matrice ayant rangées et colonnes et une autre matrice ayant rangées et colonnes, la multiplication de et de , notée est un vecteur ayant rangées et colonnes définies comme :
Voici un exemple :
Transposée d’une matrice
La transposée d’une matrice est notée et est tout simplement une réécriture de la matrice où les colonnes deviennent des rangées et vice versa : . On peut montrer que .
Matrice normale
Une matrice carrée est dite normale si elle commute avec sa transposée : .
Matrice diagonale et matrice identité
Une matrice carrée est diagonale si seules les composantes sur la diagonale sont différentes de zéro : lorsque . (le différent de j ne s’affiche pas...)
Une matrice diagonale est égale à sa transposée : . Une matrice diagonale est nécessairement normale.
Lorsque la matrice est diagonale et que toutes les valeurs différentes de zéro sont égales à 1, on dit qu’il s’agit d’une matrice identité (notée ).
La multiplication d’une matrice par la matrice identité la laisse inchangée : .
Matrices inverses
Si et sont deux matrices carrées telles que , alors ; on dit que les matrices sont inverses l’une de l’autre et on note ainsi que . Cependant, toutes les matrices n’ont pas un inverse.
Une matrice qui n’est pas carrée peut néanmoins avoir un inverse par la gauche ou par la droite : si n’est pas carrée, il peut exister
tel que ou (mais pas les deux).
On utilise souvent la matrice inverse pour résoudre des équations linéaires. Ainsi, étant donné un matrice et un vecteur , si on a , alors . Cependant, il est possible que le problème ait une solution même si n’est pas inversible.
Toutes les matrices, même les matrices qui ne sont pas carrées ou qui n’ont pas d’inverse, ont une matrice pseudo-inverse qui permet de trouver la meilleure solution (au sens des moindres carrés) pour l’équation . On peut calculer la matrice pseudo-inverse en utilisant la décomposition en valeurs singulières.
Matrice diagonalisable
Une matrice carrée est diagonalisable s’il existe une matrice telle que est une matrice diagonale. Toutes les matrices normales sont diagonalisables, mais toutes les matrices ne sont pas diagonalisables. Les valeurs trouvées sur la diagonale sont appelées les valeurs propres de la matrice et sont toujours les mêmes, même si le choix de n’est pas toujours unique.
Normes
La norme d’un vecteur ou d’une matrice est « une mesure de longueur » notée .
La norme euclidienne est la racine carrée de la somme des composantes au carré : . Étant donné un vecteur , la norme est . À moins de mention contraire, nous utilisons toujours la norme euclidienne.
Dans le cas d’une matrice, la norme euclidienne prend le nom de la norme de Frobenius :
Voici un exemple :
Produit scalaire
Le produit scalaire entre deux vecteurs est la somme du produit de leurs composantes une à une :
Pour pouvoir calculer le produit scalaire de deux vecteurs, il faut qu’ils aient le même nombre de composantes.
Voici un exemple :
On peut vérifier que . De plus, le vecteur est unitaire, c’est-à-dire qu’il a une norme de 1 : .
Le cosinus entre deux vecteurs est donné par
Vecteurs orthogonaux
Les vecteurs , et sont orthogonaux si le produit scalaire entre les vecteurs est nul : , et . On dit qu’ils sont orthonormaux si en plus d’être orthogonaux, leurs normes sont unitaires : , et .
Matrice orthonormale
Les colonnes d’une matrice peuvent être vues comme des vecteurs. Si l’ensemble de ces vecteurs sont orthogonaux, alors la matrice est orthonormale [1]. Une matrice orthonormale satisfait , c’est-à-dire
que sa transposée est son inverse par la droite. Une matrice orthonormale n’est pas nécessairement carrée.
Attention de ne pas confondre les matrices orthonormales avec les matrices normales ! Par exemple, une matrice qui n’est pas carrée ne peut être normale, mais elle peut être orthonormale. Par contre, une matrice carrée orthonormale est nécessairement normale.
Décomposition en valeurs singulières
Toutes les matrices peuvent s’écrire sous la forme où et sont orthonormales, et est une matrice diagonale [2].
Notation grand-O
Définition. Soit le nombre d’opérations effectuées par un algorithme ; on dit que le temps mis par l’algorithme est (ou bien ) s’il existe deux nombres et tels que pour .
Les grandes classes importantes pour ce cours sont (de la plus rapide à la plus lente) : .
Probabilités
La moyenne
La moyenne d’un vecteur est la somme de ses composantes divisée par le nombre de composantes ; elle est notée .
La corrélation
Étant donné deux vecteurs de même taille, on peut calculer la corrélation de Pearson entre les deux vecteurs comme étant :
La corrélation de Pearson est une valeur entre -1 et 1. Le carré de la corrélation de Pearson donne le pourcentage de corrélation.
La fréquence
La fréquence est le nombre de fois qu’une instance ou objet se manifeste. Par exemple, la fréquence du mot rue dans le journal est le nombre de fois que le mot rue est utilisé dans les textes du journal.
La distribution
Dans le cadre de ce cours, la distribution est une fonction qui, pour chaque instance possible, nous donne la probabilité correspondante. La somme de toutes les probabilités doit être 1.
Le rang
Étant donné une distribution, l’instance la plus probable occupe le premier rang, la deuxième instance la plus probable occupe le second rang et ainsi de suite.
Les lois de Zipf et Mandelbrot : origine et définition
Selon la loi de Zipf, si est le mot le plus fréquent dans un texte, alors il doit avoir la fréquence où est une constante (indépendante de ).
La théorie de l’information
Si un mot apparaît fois dans un texte de longueur , la probabilité de choisir le mot par hasard dans le texte est . On dit que la quantité d’informations associée au mot est de . Ainsi, si est très petit, la quantité est très grande alors que si est très grand, la quantité est presque nulle. La moyenne de la quantité d’informations dans les mots d’un texte est donnée par et la quantité d’informations dans un texte est mesurée comme étant .
La probabilité
La probabilité est toujours une valeur entre 0 (un événement impossible) et 1 (un événement certain).
On note la probabilité que l’événement se produise par et la probabilité qu’il ne se produise pas, par . Nous avons .
est la probabilité que et se produisent.
Les événements et sont indépendants si et seulement si .
La probabilité conditionnelle et la vraisemblance
La probabilité conditionnelle est la probabilité étant donné un fait connu. On note la probabilité conditionnelle avec la barre verticale, comme ceci (), probabilité de sachant .
Formellement, on définit la probabilité conditionnelle () comme
.
Nous avons . En général, ; cependant, on peut calculer l’une des valeurs à partir de l’autre en utilisant le théorème de Bayes.
Le théorème de Bayes stipule que .
La vraisemblance est définie comme .
Expressions régulières
Métacaractères : caractères spéciaux (comme *).
Caractères littéraux ou caractères normaux : tous les caractères qui ne sont pas spéciaux.
-i : option d’egrep pour ignorer la casse.
- E : utilisation d’expressions régulières non triviales.
- S : recherche dans les sous-répertoires du répertoire courant.
Les métacaractères d’egrep
Éléments pour reconnaître un caractère unique
– . : N’importe quel caractère.
– [...] : Classe de caractères : un caractère au choix parmi ceux énumérés ;
– [^...] : Tout caractère non énuméré.
– [ - ] : Dans une classe de caractères, indique un intervalle de caractères (exemple : [1-6]).
– \car : Caractère échappé.
Éléments ajoutés pour « compter » : les quantificateurs
– ? : Élément autorisé mais optionnel.
– * : N’importe quel nombre autorisé mais optionnel.
– + : Un élément requis, éléments supplémentaires optionnels autorisés.
– min max entre accolades : Intervalle spécifique : minimum requis, maximum autorisé.
Éléments qui reconnaissent des positions
– ^ : Début d’une ligne de texte.
– $ : Fin d’une ligne de texte.
– < : Début de mot.
– > : Fin de mot.
Autres éléments
– | : Alternative (ou).
– (...) : Limite la portée de l’alternative.
– \1, \2, ... : Référence arrière : reconnaît un texte déjà reconnu précédemment.
Autres éléments (pas nécessairement supportés par egrep)
– \w : Caractère alphanumérique (équivalent à [a-zA-Z0-9] + les accents).
– \W : Contraire de \w.
– \s : Espace.
– \d : Caractère numérique (équivalent de [0-9]).
– \D : Contraire de \d, c’est-à-dire caractère non numérique.
– \b : Limite d’un mot.
– (?=...) : Test avant/arrière (exemple : \w( ?=f) qui sélectionne les caractères précédant la lettre f et ( ?<=f)\w trouve tous les caractères qui suivent la lettre f).
– (?!...) : Élément qui teste l’absence (par exemple, pour trouver toutes les lettres qui ne sont pas suivies de la lettre f, on fait « \w( ?!f) » et pour trouver toutes les lettres qui ne suivent pas la lettre f, il faut faire « ( ?< !f)\w »).
– ( ?>...) : Groupement atomique.
[1] Certains auteurs appellent de telles matrices des matrices orthogonales, mais d’autres réservent cette appellation aux matrices carrées. D’autres auteurs, encore, exigent que les rangées de la matrice, plutôt que les colonnes, soient des vecteurs orthogonaux.
[2] L’énoncé exact de la définition peut varier d’un auteur à l’autre, mais toutes les définitions devraient être équivalentes.