Moteurs de recherche : Vos pilotes sur le net

0

Ce sont des logiciels qui aident à trouver les informations désirées.

L’Internet doit en partie sa popularitĂ© Ă  faciliter de la recherche et l’accĂšs facile Ă  la l’information et Ă  la documentation. Pour faire des recherches nous utilisons les moteurs de recherche qui sont devenus des outils indispensables sur la Toile mondiale. Un moteur de recherche est un programme informatique conçu pour effectuer des recherches dans une base de donnĂ©es. Du point de vue du client, un moteur de recherche est un site web qui lui permet de trouver des adresses d’autres sites web. Notons que les rĂ©pertoires comme Yahoo ! ou La Toile du QuĂ©bec ne sont pas des moteurs de recherche, mais disposent pourtant de ce dispositif. Il est convenu de faire une distinction entre les rĂ©pertoires et les moteurs de recherche, car leur mode de fonctionnement est basĂ© sur des principes fort diffĂ©rents.

Les vrais moteurs de recherche, comme AltaVista, Google, Fast, HotBot, Lycos, Northern Light, Voila, ou Excite collectent l’information sur les sites web avec des programmes informatiques appelĂ©s spiders, robots, ou crawlers. Chaque moteur de recherche dispose de formules diffĂ©rentes pour indexer les pages. Ces programmes hautement sophistiquĂ©s sont logĂ©s sur des serveurs ultra-performants des moteurs de recherche. Leurs spiders naviguent sur Internet au hasard, d’un lien Ă  l’autre, et enregistrent l’information chemin faisant.

Les moteurs de recherches disposent d’algorithmes basĂ©s sur un ensemble de critĂšres : certains moteurs de recherche mettent plus d’importance sur la popularitĂ© des liens d’un site, tandis que d’autres prĂ©conisent sur la densitĂ© et la proximitĂ© des mots-clĂ©s. La plupart des moteurs de recherche utilisent une combinaison de facteurs pour composer leurs formules. C’est Ă  dire que chaque moteur de recherche dispose de ses propres critĂšres dĂ©terminant la mĂ©thode de recherche et l’ordre dans lequel seront triĂ©s les rĂ©sultats. Aucun moteur de recherche n’est pareil.

La plupart des moteurs de recherches sont constituĂ©s de cinq composantes logicielles que sont : le spider, le crawler, l’indexeur, la base de donnĂ©es et l’interrogateur. Le spider est un logiciel robotique qui tĂ©lĂ©charge le code source des pages d’un site web. Le crawler est lui un robot qui suit et collecte les liens trouvĂ©s sur les pages tĂ©lĂ©chargĂ©es par le spider. L’indexeur est un programme qui fragmente et analyse les pages avant de les indexer. Pour la base de donnĂ©es, il s’agit d’un entrepĂŽt oĂč sont conservĂ©s les textes indexĂ©s des pages retenues. Enfin l’interrogateur est un programme qui puise les pages Ă  partir de la base de donnĂ©es en fonction de la requĂȘte du client L’interrogateur (ou Search Engine Results Engine) est l’élĂ©ment qui intĂ©resse le plus le rĂ©fĂ©renceur. C’est le coeur de la bĂȘte. Sa fonction est de dĂ©cider quelle page correspond Ă  la requĂȘte du client et dans quel ordre elles lui seront prĂ©sentĂ©es.

Les critĂšres de sĂ©lection que l’interrogateur utilise sont appelĂ©s algorithmes. C’est le travail constant du spĂ©cialiste en rĂ©fĂ©rencement qui permet d’analyser et de dĂ©coder les algorithmes des divers moteurs de recherche. Ainsi, ils peuvent amĂ©liorer le positionnement d’un site web sur un moteur de recherche donnĂ© en ajustant les facteurs internes et externes considĂ©rĂ©s par son algorithme. Un moteur de recherche possĂšde donc un robot qui parcourt Web. Les robots vont de liens en liens et stockent le contenu des pages qu’ils visitent dans un index. Le moteur offre une interface d’interrogation qui permet Ă  l’usager de saisir des termes de recherche. Le moteur va ensuite rechercher dans son index les pages contenant ces termes de recherche. Il les classe ensuite en fonction de certains critĂšres de pertinence (occurrence des mots dans la page, prĂ©sence des mots dans le titre de la page.

RESTITUER L’INFORMATION. En termes explicites, un moteur de recherche est un logiciel disponible via internet pour t’aider Ă  trouver les informations que tu cherches. Pour utiliser un moteur de recherche, tu dois entrer un mot (ou des mots) que tu t’attends Ă  retrouver dans les pages que tu cherches. Une fois la recherche lancĂ©e, le moteur de recherche parcourt l’ensemble des documents qu’il a en mĂ©moire pour trouver les pages Web contenant ces « mots clĂ©s ». Un moteur de recherche indexe donc toutes les pages du web, grĂące Ă  des robots, et restitue l’information brute aux internautes. Par ailleurs, les moteurs de recherche peuvent ĂȘtre utilisĂ©s pour trouver des pages Web en plusieurs langues Quelle est la diffĂ©rence entre un moteur de recherche, un annuaire et un portail ? Un moteur de recherche indexe toutes les pages du web, grĂące Ă  des robots. Il restitue l’information brute aux internautes. L’annuaire est un site qui propose un plan de classement selon des thĂ©matiques gĂ©nĂ©rales des diffĂ©rentes pages proposĂ©s.

C’est le cas de www.voila.fr, le rĂ©fĂ©rencement Ă©tant fait « à la main ». Tandis que le portail propose un plan de classement sur une thĂ©matique prĂ©cise, comme par exemple www.yahoo.fr ou www.msn.fr qui couple leur portail avec un moteur de recherches. Pour faire des recherches sur un moteur de recherche, il faut utiliser des mots clĂ©s et savoir comment choisir. Un mot clĂ© est un terme qui est spĂ©cifique au sujet de votre recherche. Pour cette raison, il est important d’ĂȘtre aussi prĂ©cis que possible. Rappelez-vous que certains mots ont plus d’une signification. Par exemple, « programme » peut faire rĂ©fĂ©rence aussi bien Ă  des logiciels informatiques qu’à un calendrier d’évĂ©nements. L’utilisation de plusieurs mots-clĂ©s vous donnera souvent de meilleurs rĂ©sultats et prĂ©cisera votre recherche. Plusieurs moteurs de recherche ignorent l’ordre des mots que vous entrez. Chaque mot est traitĂ© distinctement Ă  moins que vous les ayez placĂ©s entre guillemets. Une fois que vous aurez maĂźtrisĂ© le choix de mots clĂ©s appropriĂ©s, vous pouvez utiliser les nombreuses options de recherches afin d’amĂ©liorer les rĂ©sultats. Aussi, le moteur de recherche que vous choisirez dĂ©pendra de ce que vous voulez trouver. Au fur et Ă  mesure de vos recherches, vous prendrez l’habitude d’utiliser certains moteurs plus que d’autres. Certains moteurs de recherche cherchent « intelligemment ».

Le rĂ©sultat de la recherche affichera automatiquement les documents contenant des mots apparentĂ©s Ă  vos mots clĂ©s. Par exemple, le mot clĂ© « chevaux » donnera comme rĂ©sultat des documents contenant le mot « chevaux » ainsi que ceux contenant « cheval » Comment ça fonctionne ? Le fonctionnement d’un moteur de recherche se dĂ©compose en trois Ă©tapes principales : En lançant votre recherche sur l’exploration ou crawl le web est systĂ©matiquement explorĂ© par des robots, encore appelĂ©s, qui parcourent les sites web Ă  intervalles rĂ©guliers et de façon automatique (sans intervention humaine, ce qui les distingue des annuaires) pour dĂ©couvrir de nouvelles adresses (URL). Ils suivent les liens hypertextes (qui relient les pages les unes aux autres) rencontrĂ©s sur chaque page atteinte. Ensuite, Ă  partir de l’indexation chaque page identifiĂ©e est alors indexĂ©e dans une base de donnĂ©es, accessible ensuite par les internautes Ă  partir de mots-clĂ©s qu’ils saisissent. Enfin c’est la recherche proprement dite qui correspond Ă  la partie requĂȘtes du moteur. Elle restitue les rĂ©sultats, grĂące Ă  un algorithme, une formule mathĂ©matique qui tient compte de votre mot-clĂ©. Notons qu’il existe des moteurs de recherche gĂ©nĂ©ralistes, ou encore spĂ©cialisĂ©s par domaine.

PARTAGER