Accueil  / Semaine 6 / Autoévaluation

Autoévaluation

Question 1

Si j’effectue une recherche avec deux termes, l’un se trouvant dans 50 % des documents et l’autre dans 25 %, quelle est la pondération idf des deux termes ?

Question 2

Dans un modèle vectoriel avec pondération tf.idf, si je fais une recherche sur un terme X et qu’un des documents ne contient que ce seul terme, le terme X répété 10 fois, est-ce que je suis assuré que ce document arrive en tête de liste des recommandations du moteur de recherche ? Qu’est-ce qui se passe si je change le modèle tf.idf pour un modèle log(tf).idf ?

Question 3

Quel est le nom de la technique utilisée en recherche d’informations pour compenser le problème des variantes orthographiques ?

Question 4

Comment appelle-t-on la substitution du mot membre par bras dans un texte ?

Question 5

(Vrai ou faux.) Dans le modèle vectoriel, tous les vecteurs ont la même longueur.

Question 6

Le modèle booléen fournit un classement des documents recherchés selon leur pertinence.

Question 7

(Vrai ou faux.) Le modèle booléen offre une bonne performance lorsqu’il est utilisé par le grand public.

Question 8

(Vrai ou faux.) Dans un modèle vectoriel utilisant la similarité par cosinus, il est nécessaire de normaliser les documents selon leur longueur.

Question 9

(Vrai ou faux.) Le modèle Latent Semantic Indexing est basé sur une diagonalisation de la matrice d’occurrences.

Question 10

« Sabot », « pantoufle », et « sandale » sont des...

Question 11

« Ville » et « vil » sont des...

Question 12

(Vrai ou faux.) Les mots « cité » dans « la grande cité » et « il m’a cité » sont des homonymes.

Question 13

Les modèles vectoriels sont très utilisés. Conceptuellement, est-ce que vous pouvez présenter, en quelques lignes, au moins deux inconvénients de ces modèles ?

Question 14

L’utilisation faite par les journalistes canadiens de l’expression « colline parlementaire » est un exemple de...

Question 15

J’ai trois documents, D1=« Pierre est un homme », D2=« Jean est un homme » et D3=« Jeanne est une femme ».

Quels documents sont sélectionnés par les requêtes « homme ET est » et « homme OU est ».