Accueil  / Semaine 2 / Autoévaluation

Autoévaluation

Question 1

Quel type d’information un fichier musical MP3 contient-il principalement ? (information non structurée, semi-structurée ou structurée)

Question 2

Quel type d’information une page web typique contient-elle principalement ? (information non structurée, semi-structurée ou structurée)

Question 3

Quel type d’information un document de chiffrier électronique contient-il principalement ? (information non structurée, semi-structurée ou structurée)

Question 4

Quel type d’information un document de traitement de texte comme Microsoft Word ou un document de présentation comme Microsoft PowerPoint contient-il principalement ? (informations non structurée, semi-structurée ou structurée)

Question 5

Quel est le type d’information contenue dans les fichiers de configuration de votre système d’exploitation ? (information non structurée, semi-structurée ou structurée)

Question 6

Quel est le type d’information contenue dans un courriel ? (information non structurée, semi-structurée ou structurée)

Question 7

La recherche d’informations, en tant que domaine particulier de l’informatique, date-t-elle
 (a) du début du web (1992)
 (b) de l’invention des ordinateurs (1950)
 (c) de l’arrivée de Google (2001) ?

Question 8

Combien de serveurs le web comptait-il en 2004 ? (Choisissez la réponse la plus plausible) :
 (a) 10 000
 (b) 100 000
 (c) 1 million
 (d) 5 millions
 (e) 20 millions
 (f) 100 millions

Question 9

Qu’est-ce qui progresse le plus rapidement ?
 (a) la capacité de stockage des disques rigides
 (b) la capacité de la mémoire
 (c) le taux de transfert des disques rigides
 (d) le taux de transfert de la mémoire
 (e) le temps d’accès des disques rigides
 (f) le temps d’accès de la mémoire

Question 10

Qu’est-ce qui progresse le moins rapidement ?
 (a) la capacité de stockage des disques rigides
 (b) la capacité de la mémoire
 (c) le taux de transfert des disques rigides
 (d) le taux de transfert de la mémoire
 (e) le temps d’accès des disques rigides
 (f) le temps d’accès de la mémoire

Question 11

À l’aide d’un service Internet « haute vitesse » (1 Mo/s), combien de temps faudrait-il pour transmettre le contenu entier d’un disque de 100 Go ?
 (a) une heure
 (b) un jour
 (c) une semaine
 (d) un mois
 (e) un an

Question 12

Étant donné une base de données faisant environ 20 Go, combien de temps faudra-t-il à un PC typique pour trier les éléments de données (par exemple, mettre les numéros de série en ordre alphabétique) ?
 (a) moins d’une seconde
 (b) quinze minutes
 (c) 10 heures

Question 13

Combien de bigrammes de caractères distincts trouve-t-on dans la phrase « Ce chant est amusant. » ?

Question 14

Vous travaillez pour les magasins VentouPasCher. VentouPasCher offre 1000 produits différents, mais tous à un prix unitaire de 1 $. Le chiffre d’affaires mensuel de la compagnie est de 15 000 $ et elle fait 0,50 $ de profit sur chaque article vendu. Vous observez que la fréquence des ventes suit une loi de Zipf : l’article le plus fréquemment acheté est deux fois plus populaire que le deuxième et ainsi de suite. Si vous décidiez de ne vendre que les 10 articles les plus populaires, vous épargneriez 3000 $ en frais d’entrepôt. Décidez-vous de réduire l’éventail des produits vendus ?

Indices :
 \sum_{i=1,\ldots,1000}1/i\approx 7.485
 \sum_{i=11,\ldots,1000}1/i\approx 4.5565

Question 15

Deux groupes d’extraterrestres, les Moufions et les Fionmous, arrivent sur la Terre en soucoupe volante : ils furent nommés d’après les astronomes Moufi et Fion respectivement. Leurs vaisseaux sont identiques, mais leurs langues diffèrent. Les Moufions envoient le message suivant : « gdhdhg ». Les Fionmous envoient le message : « dghghd ». Personne ne sait comment les traduire. Les deux vaisseaux redécollent. Plusieurs mois passent... puis un vaisseau identique aux deux premiers se présente et envoie ce message : « ghddgh ». En s’appuyant sur un analyse par bigrammes, dites s’il s’agit d’un vaisseau Moufion ou d’un vaisseau Fionmou ?

Question 16

Exprimez en Dublin Core l’affirmation suivante : « La page http://www.ledevoir.com/article.html a comme titre "Dieu est mort" et fut écrite le 15 septembre 2005. Il s’agit d’un article sur la ville de Montréal. »

Question 17

Corrigez le document suivant et dites combien d’éléments il compte :

<?xml version="1.0" ?>
<htm>
<body>
<pre>
x < y
</pre>
</body>
</htm>

Question 18

Supposons que j’ai un texte comportant 3 mots distincts et qu’il se comporte exactement selon la loi de Zipf ; prouvez que la longueur du texte doit être divisible par 11.

Question 19

Si le 5e mot le plus fréquent d’un texte assez long apparaît 10 000 fois, quelle est la longueur approximative du texte en nombre de mots ? Combien y a-t-il de mots distincts dans le texte ? (Nous supposons que la loi de Zipf s’applique.)

Question 20

Si j’ai la séquence de fréquences suivantes pour les 5 mots d’un texte : 25, 6, 3, 2, 1, trouvez une loi de Mandelbrot qui s’applique approximativement.

Question 21

Si un texte contient 5 mots, avec les fréquences respectives de 10, 12, 15, 20 et 25, et que je stocke ce texte sur un disque en le compressant dans une archive zip, quelle est la taille minimale que peut prendre mon fichier, peu importe l’efficacité de mon logiciel de compression ?

Question 22

La complexité de Kolmogorov est mesurée par le programme le plus court permettant de reproduire une certaine information. En utilisant Java, quelle est la complexité de Kolmogorov de la chaîne de caractères « La vie est belleLa vie est belleLa vie est belle » ?

Question 23

Si on applique la compression Lempel-Ziv sur la chaîne « aanantantiantipantipo » en traitant les données caractère par caractère, quel sera le dictionnaire à la fin du traitement ? Croyez-vous que Lempel-Ziv pourrait compresser une telle chaîne de caractères ?

Question 24

Les fournisseurs Internet préfèrent souvent utiliser comme unité le mégabit plutôt que le mégaoctet. Combien y a-t-il de mégaoctets dans 8 mégabits ?

Question 25

Si un disque portable de 1 To coûte 569 $, combien coûterait l’enregistrement intégral de tout ce qu’un humain pourrait voir dans sa vie ?

Question 26

Nommez 5 verbes (ou prédicats) faisant partie des métadonnées du Dublin Core.

Question 27

Soit la chaîne de caractères « abcdab ». On peut la considérer comme une chaîne de bigrammes, « ab,bc,cd,da,ab ». La fréquence relative du bigramme ab est alors de 2/5.
Quelle est la quantité d’information contenue dans la chaîne « abcdab » ? Quelle est l’entropie liée à cette information ? Quelle est la contribution de chaque bigramme à la quantité d’information ? N’utilisez pas les chaînes de Markov !

Question 28

En 2006, combien de courriels comptait-on par habitant sur terre ?
 (a) moins d’un centième de courriel
 (b) moins d’un dixième de courriel
 (c) environ un courriel
 (d) plus de 5 courriels par personne

Question 29

Si 3 éléments A, B, C suivent une distribution de Zipf, quelles sont les fréquences des 3 éléments si la somme des fréquences est 55. Quelle est l’entropie de Shannon de cette distribution ? Selon la théorie de Shannon, combien faut-il de bits au minimum pour stocker un texte dont les caractères ont ces fréquences ?

Question 30

Quels sont les 3-grammes de la chaîne de caractères « Jojolala » ?