Présentation de la semaine |
Les modèles probabilistes et les modèles de la langue
Nous avons analysé, la semaine passée, les modèles de base en recherche d’informations : le modèle booléen et les modèles vectoriels. Du modèle vectoriel, il faut surtout retenir la fréquence du terme (tf) et la fréquence inverse dans les documents (idf) qui nous permettent de réduire la recherche de documents au calcul du cosinus entre deux vecteurs.
L’ensemble des sujets traités nous permettra de bien comprendre l’application des modèles probabilistes en recherche d’informations.
Ce ne sera pas une semaine facile. Dans certains cas, je m’attends à ce que vous compreniez vraiment les sujets traités seulement après avoir lu tous les textes et fait les activités d’autoévaluation. Il est normal de ne pas tout comprendre après une première lecture !