Accueil  / Semaine 2 / Présentation de la semaine

Présentation de la semaine

Quelles informations recherche-t-on ?

La recherche d’informations, mais de quelles informations ? Nous nous pencherons cette semaine sur l’information non structurée en général qui, finalement, constitue l’objet du cours, sur sa quantité et sa croissance par rapport à nos capacités de traitement. Le cours se termine cette semaine avec une introduction au XML et aux métadonnées que l’on utilise souvent avec les informations non structurées dont on ne peut ou ne veut traiter le contenu.

Notre cours porte sur la recherche d’informations, mais sur quels types d’information au juste ? C’est ce que nous verrons cette semaine.

La recherche d’informations vise à trouver du texte, des images, des extraits sonores, ou d’autres données diverses en cherchant dans des documents, dans des métadonnées, dans des bases de données, dans des fichiers de données provenant d’applications diverses ou dans des réseaux d’hyperliens comme les intranets ou Internet. Telle que traitée dans ce cours, la recherche d’informations est un domaine de l’informatique qui date de l’invention des ordinateurs, dans les années 1950. Outre l’informatique, d’autres disciplines telles la psychologie, la linguistique, l’ingénierie, la géographie, les statistiques et la bibliothéconomie interviennent en recherche d’informations. C’est donc un sujet essentiellement multidisciplinaire.

La recherche d’informations ne se limite pas aux recherches par mots-clés dans des sites web comme Google, et ce, même si c’est un exemple très connu de recherche d’informations.
La recherche d’informations peut devoir tenir compte de facteurs tels la géographie et la topologie comme dans les systèmes d’information géographique (Geographic information system ou GIS en anglais). La recherche d’informations passe aussi parfois par la classification des documents et par les techniques de l’intelligence artificielle. Les applications sont très variées, de la recherche bibliographique à la robotique. En somme, dans ce cours, nous considérons que partout où il y a de l’information non structurée, et c’est pratiquement partout, la recherche d’informations s’applique.

Parcours de la semaine

Cette semaine, nous allons étudier plus particulièrement l’information non structurée et sa problématique dans le contexte de la gestion des informations en informatique. Le première leçon définit cet objet et le situe dans le contexte de la surcharge d’information telle que prévue par Toffler. Nous présenterons aussi la théorie de Zipf, comme exemple de loi scientifique en recherche d’informations, ce qui nous servira de prétexte pour revoir la théorie de la probabilité. Nous étudierons les fondements de la théorie de l’information qui répond aux questions : qu’est-ce que l’information ? et comment pouvons-nous la mesurer ? Ces premières lectures seront complétées par une entrevue avec des experts reconnus. L’entrevue sera commentée par le professeur.

La seconde leçon porte sur l’utilisation des métadonnées pour la gestion des informations. Nous y définissons le XML, ce métalangage très utilisé sur le web tant pour véhiculer l’information structurée ou semi-structurée que pour décrire l’information non structurée.

Comme ce sera pratiquement toujours le cas, la semaine se terminera par une activité d’autoévaluation que nous vous encourageons vivement à faire ! À l’examen sous surveillance à la fin du cours, il sera tenu pour acquis que vous avez fait les activités d’autoévaluation.

Lectures complémentaires

Le professeur Jian-Yun Nie de l’Université de Montréal a mis en ligne du matériel pour un cours sur la recherche d’informations que nous avons utilisé pour la conception du nôtre. La première semaine de son cours porte justement sur la problématique de la recherche d’informations.