Autoévaluation |
Question 1
Si j’effectue une recherche avec deux termes, l’un se trouvant dans 50 % des documents et l’autre dans 25 %, quelle est la pondération idf des deux termes ?
Question 2
Dans un modèle vectoriel avec pondération tf.idf, si je fais une recherche sur un terme X et qu’un des documents ne contient que ce seul terme, le terme X répété 10 fois, est-ce que je suis assuré que ce document arrive en tête de liste des recommandations du moteur de recherche ? Qu’est-ce qui se passe si je change le modèle tf.idf pour un modèle log(tf).idf ?
Question 3
Quel est le nom de la technique utilisée en recherche d’informations pour compenser le problème des variantes orthographiques ?
Question 4
Comment appelle-t-on la substitution du mot membre par bras dans un texte ?
Question 5
(Vrai ou faux.) Dans le modèle vectoriel, tous les vecteurs ont la même longueur.
Question 6
Le modèle booléen fournit un classement des documents recherchés selon leur pertinence.
Question 7
(Vrai ou faux.) Le modèle booléen offre une bonne performance lorsqu’il est utilisé par le grand public.
Question 8
(Vrai ou faux.) Dans un modèle vectoriel utilisant la similarité par cosinus, il est nécessaire de normaliser les documents selon leur longueur.
Question 9
(Vrai ou faux.) Le modèle Latent Semantic Indexing est basé sur une diagonalisation de la matrice d’occurrences.
Question 10
« Sabot », « pantoufle », et « sandale » sont des...
Question 11
« Ville » et « vil » sont des...
Question 12
(Vrai ou faux.) Les mots « cité » dans « la grande cité » et « il m’a cité » sont des homonymes.
Question 13
Les modèles vectoriels sont très utilisés. Conceptuellement, est-ce que vous pouvez présenter, en quelques lignes, au moins deux inconvénients de ces modèles ?
Question 14
L’utilisation faite par les journalistes canadiens de l’expression « colline parlementaire » est un exemple de...
Question 15
J’ai trois documents, D1=« Pierre est un homme », D2=« Jean est un homme » et D3=« Jeanne est une femme ».
Quels documents sont sélectionnés par les requêtes « homme ET est » et « homme OU est ».