Ergonomie en recherche d’informations

1. Introduction

La communication est omniprésente dans de nombreux domaines (politique, éducation et même loisir). Et le développement du web tant par le nombre de sites (plus de 42 millions en juillet 2003, contre 35,7 en 2002 et 21,2 en 2000 [1] ) que par le nombre de ses utilisateurs (724,9 millions en 2004, contre 565,7 en 2002 et 384 en 2000 [2]) traduit cette nécessité d’échanger de l’information. De plus, les utilisateurs se diversifient : ce ne sont plus uniquement les experts (chercheurs, professionnels de l’information) qui recherchent de l’information sur le web ; ils sont rejoints par une multitude d’autres acteurs (ingénieurs, techniciens ou citoyens) (Paganelli, 2002). Les besoins des utilisateurs sont donc eux aussi modifiés. Les outils permettant de chercher de l’information et, idéalement, de trouver l’information recherchée doivent être accessibles à l’ensemble des groupes d’utilisateurs. De plus, l’activité de recherche d’informations en elle-même évolue : il y a toujours la collecte d’informations, mais aussi son traitement et, surtout, la gestion des informations recueillies. Cela implique qu’il est essentiel d’adapter les outils de recherche d’informations sur le web, d’une part aux différents groupes d’utilisateurs, d’autre part aux différentes tâches qu’ils voudront effectuer.

Les utilisateurs sont aussi de plus en plus exigeants ; ils veulent avoir accès à des outils simples et performants. Mais comment proposer des outils de recherche d’informations adaptés à divers groupes d’utilisateurs (ayant chacun leurs caractéristiques et leurs besoins) ? L’ingénierie cognitive ne suffit pas pour créer des outils de recherche d’informations performants ; il faut l’expertise de différents domaines de recherche : sciences de l’information, linguistique, informatique et ergonomie cognitive. La pluridisciplinarité est donc essentielle pour la création d’outils de recherche d’informations performants sur le web.

Ce texte vise à présenter certaines problématiques ergonomiques du domaine de la recherche d’informations sur le web. Nous allons, dans un premier temps, analyser la tâche de recherche d’informations du point de vue de l’utilisateur. Nous regarderons ensuite, brièvement, de quoi est constitué un système de recherche d’informations et quelles sont les interactions qui existent dans ce système et entre le système et l’utilisateur. Nous finirons par une analyse des avantages et des inconvénients des différentes interfaces existantes pour la recherche d’informations sur Internet.

2. La tâche de recherche d’informations du point de vue de l’utilisateur

La tâche de recherche d’informations est motivée par un besoin d’information de l’utilisateur. La problématique de la recherche d’informations est de faire correspondre ce besoin d’information avec l’information disponible. Le système de recherche d’informations doit trouver des réponses mais surtout des réponses satisfaisantes pour l’utilisateur. Pour cela, il est essentiel de connaître l’utilisateur (ses besoins, ses attentes, sa tâche de recherche d’informations, etc.). Nous allons donc définir dans cette partie le besoin d’information de l’utilisateur et analyser la tâche de recherche d’informations en fonction de la manière que celui-ci l’effectue.

2.1 Le besoin d’information de l’utilisateur

Le besoin d’information initial de l’utilisateur est le point de départ de toute recherche d’informations. Nous allons étudier comment naît ce besoin et comment il est exprimé lors d’une requête dans un système de recherche d’informations.

2.1.1 Formation du besoin et types de besoin

La formation du besoin chez l’utilisateur est indépendante du système de recherche d’informations utilisé. Elle dépend de l’état cognitif de l’utilisateur.

Dachelet (1990) cite les trois types de besoins des utilisateurs de Pedersen (1987) :
– besoin de vérification : « l’utilisateur veut vérifier ou retrouver de l’information sur des éléments d’information aux caractéristiques connues » ;
– besoins conscients concernant un sujet : « l’utilisateur veut clarifier, passer en revue ou approfondir certains aspects d’un sujet bien connu » ;
– besoins flous concernant un sujet : « l’utilisateur veut explorer de nouveaux concepts sur des sujets non connus ».

Ces différents types de besoins dépendent des connaissances et des expériences de l’utilisateur par rapport au domaine de la recherche. Par exemple, le fait que l’utilisateur soit un expert ou un novice (dans le domaine de la recherche) influence la formulation de la demande et la compréhension des réponses et détermine donc la pertinence des réponses données (Chevalet et Nigay, 2002).

De plus, d’après Ingwersen (1996), ce besoin d’information est dynamique, car il met en jeu toutes les structures cognitives de l’utilisateur qui sont dynamiques et variables. Il peut évoluer aussi bien au niveau du domaine de recherche (centre d’intérêt de la recherche) qu’au niveau de la précision de l’information recherchée. Il peut aussi être stable si l’utilisateur cherche une information déjà connue (pour vérification ou localisation).

Le contexte du besoin de recherche d’informations a aussi son importance. Le besoin s’inscrit en effet dans un contexte social où l’information est recherchée pour une utilisation précise. De plus, une interaction humain-humain de questionnement concernant un domaine complexe n’est jamais constituée d’une simple question. Le questionnant décrit plus ou moins longuement le contexte dans lequel s’inscrit sa question (Karsenty et Brézillon, 1995). Même si nous nous situons ici dans un contexte d’interaction humain-machine, le contexte influencera également la pertinence de l’information trouvée.

2.1.2 Expression d’entrée dans un système de recherche d’informations

La formulation d’une expression d’entrée (requête) peut s’appuyer sur des critères subjectifs ou objectifs. Par exemple, « Quelles sont les villes proches de Montréal ? » est une question subjective car proche peut vouloir dire 5 km ou 20 km. Par contre, la question « Quelles sont les villes se situant à 10 km autour de Montréal ? » est objective.

Elle peut aussi être spécifique ou générique, c’est-à-dire qu’une question peut porter sur un objet précis (par exemple, « Quel est le dernier livre de Philip Roth ? » ou porter sur un ensemble d’objets (par exemple, « Je cherche le titre d’un livre de Philip Roth »). Dans le premier cas, une seule réponse est possible alors que dans le deuxième cas, plusieurs réponses sont valables.

La formulation des questions dépend aussi de la connaissance qu’a l’utilisateur du système de recherche d’informations (Chevalet et Nigay, 2002). Si l’utilisateur connaît le fonctionnement du système, il adaptera sa requête afin d’obtenir des réponses pertinentes à son besoin d’information.

2.2 Analyse de la tâche de recherche d’informations

Selon Ballico et al. (2000), le processus de recherche d’informations se compose de trois phases :
– la formulation de la requête par l’utilisateur,
– le traitement de la requête par le système,
– l’affichage des résultats.

L’analyse de la tâche de recherche d’informations de Chevalet et Nigay (2002) se base sur la théorie de l’action de Norman. La figure 1 représente les sept étapes de la théorie de Norman adaptée à la tâche de recherche d’informations.

**Étapes dans l’accomplissement d’une tâche de recherche d’informations (figure tirée de Paganelli, 2002)**

La formulation du besoin et l’évaluation des résultats par rapport au besoin sont des étapes qui ne dépendent pas de l’interface humain-machine du système de recherche d’informations (en tout cas, idéalement, la formulation ne devrait pas dépendre de l’interface, mais ce n’est pas toujours le cas). Par contre, l’exécution des actions et la perception des résultats dépendent de l’interface.

Nous verrons plus loin les différentes interfaces existantes pour supporter la tâche de recherche d’informations de l’utilisateur. Mais avant cela, regardons brièvement de quoi est constitué un système de recherche d’informations et quelles sont les interactions qu’il subit.

3. Les systèmes de recherche d’informations (SRI)

Ballico et al. (2000) présentent les trois acteurs interagissant lors d’une recherche d’informations : l’utilisateur, le moteur de recherche et la base de données. Le système de recherche d’informations est constitué du moteur de recherche et de la base de données. La figure 2 représente le SRI.

**Représentation du système de recherche d’informations**

Dachelet (1990) distingue deux thèmes principaux à aborder : la représentation du contenu des documents et l’accès à l’information (appariement d’une requête à un ensemble de documents). Ces deux thèmes se retrouvent dans le modèle de représentation et de correspondance et dans le modèle d’interprétation des documents et des requêtes présentés par Chevalet et Nigay (2002). Nous n’entrerons pas ici dans les détails de ces modèles, car notre préoccupation est l’ergonomie des systèmes de recherche d’informations. Nous voulons seulement citer les approches qui existent afin que le lecteur puisse appréhender le domaine de la recherche d’informations dans sa globalité.

3.1 La représentation du contenu des documents

Nous avons identifié dans la littérature trois approches différentes pour la représentation des documents. D’abord, Dachelet (1990) présente deux approches traditionnelles pour la représentation des documents : statistique et linguistico-conceptuelle. La différence entre ces deux approches est l’opposition entre sens et valeur. L’analyse que proposent Chevalet et Nigay (2002) se fonde quant à elle sur la théorie des ensembles. Nous voyons donc qu’il existe différentes approches dans le domaine de la recherche d’informations.

3.2 L’appariement requête-documents

Cette étape, contrairement à la précédente (représentation du contenu des documents), est dynamique puisqu’elle représente le processus de résolution de la requête. Cette étape se charge de « traduire » la requête de l’utilisateur dans le langage compris par le système, c’est-à-dire celui de la représentation des documents. Il devrait donc y avoir une totale indépendance entre la représentation du contenu des documents et l’appariement requête-documents. Pourtant, l’analyse du langage naturel étant encore difficile, les utilisateurs préfèrent parfois que leur requête se rapproche le plus possible de la forme interne du système, car ils ont alors l’impression de mieux le contrôler. Dans ce cas, la formulation du besoin dépend du fonctionnement du système de recherche d’informations et donc de son interface.

Chevalet et Nigay (2002) recensent différentes techniques pour franchir cette étape : algébrique, statistique, statistico-linguistique et ostensible.

**Interactions en recherche d’informations**

Ballico et al. (2000) identifient trois problématiques reliées à ces interactions.

La première problématique consiste à obtenir le meilleur « recouvrement » possible entre l’ensemble des informations pertinentes et les résultats. Ce problème a deux origines :
– le passage du besoin réel d’information à sa représentation mentale ;
– le passage de la représentation mentale du besoin à la requête.

La deuxième problématique tient aux réponses du système. Celles-ci doivent être en adéquation avec la requête et présentées le plus simplement possible à l’utilisateur. La troisième problématique concerne la satisfaction de l’utilisateur par rapport aux réponses fournies par le système. L’utilisateur est seul à savoir si les réponses qu’il obtient sont pertinentes pour sa recherche d’informations. L’objectif est de créer un SRI résolvant au maximum ces trois problématiques.

Il est important, pour pouvoir créer une bonne interface de système de recherche d’informations, de connaître les choix techniques qui ont été faits concernant son fonctionnement. En effet, les choix techniques auront une incidence sur la manière dont fonctionne le système et donc sur la manière dont on peut et doit l’interroger. Et la manière d’interroger le système aura une grande influence sur son interface.

Voyons maintenant quels types d’interfaces existent pour permettre au système de recherche d’informations d’être adapté à l’utilisateur et de répondre à son besoin d’information.

4. Interfaces humain-machine pour la recherche d’informations

Maintenant que nous savons ce qu’est un besoin d’information, comment se fait la tâche de recherche d’informations et quelles sont les interactions du système de recherche d’informations avec l’utilisateur, voyons quelles interfaces existent pour faire le lien entre ces éléments. Les interfaces pour la recherche d’informations que nous allons examiner sont les suivantes : la navigation hypertexte, les requêtes textuelles, les requêtes graphiques et les requêtes textuelles et graphiques.

4.1 La navigation hypertexte

Les interfaces permettant d’utiliser cette méthode de recherche d’informations sont dites « interfaces faire » par Chevalet et Nigay (2002), qui se distinguent des autres types d’interfaces qui sont dites « interfaces faire-faire ». « Interfaces faire » parce que l’utilisateur agit directement sur les documents et « interfaces faire-faire » parce que l’utilisateur écrit une requête à un système de recherche d’informations qui cherche des résultats pour lui.

Beaucoup de systèmes « demandent » d’abord une requête à l’utilisateur avant de lui permettre de naviguer à travers les résultats. On peut alors dire qu’ils présentent une combinaison des deux types d’interface : « faire-faire » puis « faire ».

L’information présente dans les systèmes supportant ce type d’interface doit être organisée de façon claire, afin de permettre à l’utilisateur de trouver l’information qu’il recherche. Par exemple, l’utilisateur peut naviguer dans des catégories pouvant être hiérarchiques, avant de naviguer dans les documents eux-mêmes. Cette méthode de recherche d’informations permet aux utilisateurs qui n’ont pas une idée assez précise de ce qu’ils cherchent, de pouvoir formuler une requête pour trouver tout de même des solutions ou des pistes de solutions pour rédiger une requête (Dachelet, 1990).

La principale limite de ces interfaces est que l’utilisateur est obligé de naviguer à travers une structure déjà établie. Même s’il peut exister différents chemins pour arriver à un même document, l’utilisateur devra passer par un de ces chemins. Ces interfaces ne permettent donc pas à l’utilisateur d’interagir directement avec le système. Celui-ci contient de l’information et l’utilisateur y accède par des chemins prédéfinis ; mais le système ne construit rien à partir d’une entrée de l’utilisateur [3]. Comme nous le disions, ce type d’interface peut être bénéfique pour les recherches peu précises ou pour la première étape d’une recherche d’informations dans un domaine peu connu de l’utilisateur.

Voir CREDO : (http://credo.fub.it/About.html).

4.2 Les requêtes textuelles

4.2.1 Requête formelle

Ce type de requête découle des langages d’interrogation des bases de données informatiques dont la norme est le langage SQL (Structural Query Language). Le principal problème de ce langage est sa complexité. Il nécessite un long apprentissage de la part de l’utilisateur, tant pour sa syntaxe que pour l’algèbre de Boole sur lesquelles il repose. À titre d’illustration, nous donnons deux exemples de requête.

Requête simple :
SELECT NOM, PRENOM
FROM ETUDIANT
WHERE VILLE = ’Montréal’
Cette requête signifie : Quels sont les noms et prénoms des étudiants habitant à Montréal ?

Requête complexe :
SELECT NOM, PRENOM
FROM ETUDIANT, COURS
WHERE ETUDIANT.ID = COURS.ETUDIANTID
AND COURS.NOM = ’Étude de cas en ergonomie’
Cette requête signifie : Quels sont les noms et prénoms des étudiants inscrits au cours Étude de cas en ergonomie ?

Ces exemples laissent présager à l’utilisateur la complexité du langage et, surtout, son lourd coût d’apprentissage. De plus, pour être capable d’interroger une base de données avec ce type de langage, l’utilisateur doit savoir comment est organisée l’information.

Par contre, l’avantage de ce type d’interface est que la requête est très proche du langage compris par le système. Ainsi, la problématique soulevée plus haut concernant la difficulté de faire correspondre la requête avec l’ensemble de l’information pertinente contenue dans la base de données est partiellement résolue ici. En effet, l’utilisateur interroge le système dans un langage proche du langage machine : il y a donc peu d’interprétation possible, ce qui contribuera aussi à augmenter la satisfaction de l’utilisateur en lien avec son besoin d’information.

4.2.2 Requête par mots-clés

Ce type de requête est très répandu sur Internet. C’est ce type que proposent la plupart des moteurs de recherche (Google, Altavista, Yahoo, etc.). De nombreux sites proposent aussi un mode de recherche avancée dans lequel l’utilisateur peut employer un langage se rapprochant du langage machine, généralement à l’aide d’opérateurs booléens (+, - ou encore ET, OU...).

4.2.3 Requête en langue naturelle

Les interfaces qui permettent de faire des requêtes en langue naturelle présentent un avantage certain en ce qui concerne l’accès à l’information. Quoi de plus simple que de questionner un système en langue naturelle ? Familière à l’utilisateur et ne nécessitant aucun apprentissage, cette approche simplifie le problème identifié par Ballico et al. (2000) concernant la difficulté du passage de la représentation mentale du besoin d’information à la requête.

Par contre, la difficulté réside ici dans l’interprétation par le système de la requête de l’utilisateur. Les interfaces offrant la possibilité d’une interrogation en langue naturelle doivent disposer d’un système capable de « comprendre » la langue naturelle.

Il existe pour ce type d’interface des modèles d’interaction humain-machine comme, par exemple, celui de Jonsson (1995). Il existe aussi de nombreuses études linguistiques sur le traitement de la langue naturelle : Berard-Dugourd, Fargues, Landau, et Rogala (1989) ; Dupont, Vuillaume, Victorri, Enjalbert, Mahet et Malandain (2002) ; Grau, Sabah et Vilnat (1994).

4.3 Les requêtes graphiques

Les interfaces qui offrent la possibilité de faire des requêtes graphiques permettent à l’utilisateur de schématiser graphiquement la formulation de son besoin d’information. Il existe de nombreux exemples de ce type d’interface. Ce qui nous intéresse surtout, ici, c’est le fait que le SRI influencera grandement ce type d’interface. En effet, l’organisation des informations et la manière dont elles sont traitées (comment est cherchée l’information) auront une incidence sur la représentation graphique que peuvent avoir les concepts manipulés. Il faut aussi noter que ce type d’interface peut être particulièrement pertinent pour certains domaines, comme par exemple, la géographie et l’architecture.

4.4 Les requêtes textuelles et graphiques

Ce type d’interfaces, multimodales, permet à l’utilisateur d’exprimer sa requête en langue naturelle, ou sous forme de graphique, ou bien dans les deux formes. L’utilisateur peut, par exemple, créer des entités graphiques et utiliser la langue naturelle pour spécifier ces entités par des étiquettes. Encore peu présentes, ces interfaces semblent offrir de grandes opportunités pour le domaine de l’interaction humain-machine en recherche d’informations.

Bibliographie

Ballico, L., Ben-Ali, S., Ponton, C., et Puchot, S., Apport de la génération automatique de textes en langue naturelle à la recherche d’information, ACSI 2000 Association Canadienne des Sciences de l’Information, Travaux du 28^e congrès annuel, 2000.

Chevallet, J.P., et Nigay, L., Les interfaces pour la recherche d’information (chapitre 2), dans Interaction homme-machine et recherche d’information. Paris, Lavoisier, (Traité des sciences et techniques de l’information), 2002.

Dachelet, R., État de l’art de la recherche en informatique documentaire : la représentation des documents et l’accès à l’information. Rapports de recherche de l’INRIA, Rocquencour (France), 1990.

Jonsson, A., Dialogue actions for natural language interfaces, Proceedings of IJCAI-95, Montréal, 1995, p. 1405-1413.

Karsenty, L., et Brézillon, P., Coopération homme-machine et explication. Le travail humain, tome 58, n^o 4, 1995, p. 289-310.

Paganelli, C., Interaction homme-machine et recherche d’information, Paris, Lavoisier, (Traité des sciences et techniques de l’information), 2002.

Autoévaluation

Question 1

À quelles étapes de la tâche de recherche d’informations l’ergonomie peut-elle intervenir ?

Question 2

La formulation du besoin est-elle une étape difficile ?

[1] Source : Netcraft.

[2] Source : eMarketer, International Telecom Union.

[3] Il y a cependant des propositions de systèmes hybrides dans lesquels un espace de recherche personnalisé est produit pour permettre un raffinement de requête telle que CREDO.

Semaine 8