Méthodologie de recherche : comment tirer parti des pages de liens

Lorsque l'on cherche sur Internet la réponse à une question – quelle qu'elle soit –, notre premier réflexe est généralement d'utiliser Google avec quelques mots-clés, puis d'analyser les premières pages de résultats du moteur.
Mais il arrive que les réponses fournies par Google ne soient pas satisfaisantes. C'est le cas notamment lorsqu'il s'agit de répertorier une liste de sites, que ce soit pour une réaliser une "webographie" sur un sujet en indiquant les sites incontournables, ou pour recenser des entreprises ou des organisations dédiées à un domaine donné et/ou situées dans un pays donné.

Nous avons présenté dans l'article "Quand et comment utiliser les "Pages en langue étrangère traduites" de Google" une méthode qui s'est avérée très efficace, pour localiser des associations dans le domaine de l'énergie en Espagne.

Nous présenterons dans cet article une autre méthode d'investigation, qui consiste à tirer parti des nombreuses "pages de liens" qui existent sur le Web, pour tenter d'identifier cette fois-ci des associations dans le domaine du textile, en Allemagne.


Une requête sur Google avec les mots associations textile allemagne montre très vite les limites du moteur.
Les premiers résultats proposent ainsi plusieurs documents PDF contenant des informations économiques sur le marché du textile en France avec quelques chiffres concernant l'Allemagne, ou alors des annonces de salons dans le domaine, des articles sur le textile en général... Au final, si l'on peut découvrir le nom d'une association au hasard des pages, leur recensement s'annonce long et fastidieux.




Dans un cas comme celui-ci, il peut être intéressant de tenter d'identifier spécifiquement des pages de liens, ou signets.
Créées le plus souvent par des experts ou des passionnés d'un domaine, ou proposées par des organismes (associations, fédérations...) sur leur site, ces pages de liens peuvent rassembler des listes impressionnantes de ressources sur un sujet, sélectionnées par un professionnel pour leur intérêt.

Dans un domaine comme celui du textile, il est légitime de penser que des pages de liens recensant les organisations du domaine ont déjà été créées.

Une astuce pour identifier les pages de liens

Pour identifier ces pages de liens, nous avons élaboré une méthode (ou plutôt une astuce) qui s'appuie sur une constatation : les pages de liens proposées sur les sites sont très souvent incluses dans une rubrique intitulée simplement "Liens utiles", "Sites du domaine", etc. Un clic sur cette rubrique affiche la page en question et il arrive alors que celle-ci contiennent, dans son titre ou son URL, le mot liens ou sites, bookmark, etc.
Bien évidemment, la présence du mot "liens" dans le titre ou dans l'URL n'est pas obligatoire. Il se trouve simplement que de nombreux éditeurs choisissent ce mot comme titre de leur page ou que le chaînage de navigation dans leur site explique la présence du terme dans l'URL.

Partant de cette constatation, on utilisera les fonctions avancées du moteur pour rechercher les pages qui contiennent précisément le ou les termes de la requête ET le mot liens (ou sites, bookmark...) dans le titre OU dans l'URL. Si l'on souhaite identifier des pages en anglais, on pensera à utiliser les mots links (ou bookmark, sites...) en complément des mots-clés.

Dans notre cas, cela revient à chercher sur Google les pages qui contiennent à la fois :
- un mot lié au pays (allemagne OR germany)
- un terme relatif au domaine (textile OR habillement OR clothing...)
- un mot relatif au type d'organisme recherché (association OR institut OR syndicat OR fédération...)
- et le mot liens (ou links, sites...) dans le titre ou dans l'URL.

Pour que la requête soit posée à la fois sur les pages en français ou en anglais, on pourra écrire :

german OR germany OR allemagne association OR fédération OR institut textile OR clothing OR habillement intitle:liens OR intitle:links OR inurl:liens OR inurl:links

On prendra particulièrement garde à bien saisir un OR entre les synonymes, et à bien avoir un espace (donc un AND implicite) entre les groupes de mots désignant le pays, le domaine, le type d'organisme, et les mots recherchés dans le titre ou l'URL.

D'autre part, la saisie des différents synonymes dans le titre et l'URL étant fastidieuse (il faut répéter à chaque fois l'opérateur intitle: ou inurl: devant chaque mot), on préférera l'usage de l'opérateur "|" (prononcer "pipe") à OR, ce qui permet de poser la requête sous la forme :

german OR germany OR allemagne association OR fédération OR institut textile OR clothing OR habillement intitle:liens|links OR inurl:liens|links


Les résultats proposent de nombreuses pages de liens, dont plusieurs recensent les associations du domaine en Europe, voire dans le monde.
Un rapide survol des résultats permettra d'affiner le cas échéant la requête, en ajoutant par exemple d'autres synonymes, que ce soit pour les organisations (confédération, syndicat...), le mot "liens"...


Encore une fois, cette méthode n'est qu'une astuce. Toutes les pages identifiées ne seront pas des pages de liens (certaines n'en offriront qu'un ou deux) et toutes les pages de liens ne seront pas identifiées.

Mais en l'état, cette stratégie augmente notablement les probabilités de localiser rapidement quelques signets utiles.

Et vous, utilisez-vous les pages de liens, et connaissez-vous d'autres astuces pour les identifier  ?

2 commentaires:

  1. Bonjour Béatrice,

    Merci pour ce partage.

    Le seul problème, c'est que la source n° 1 des pages de liens sur Internet sont les annuaires ("directories").

    Or, les annuaires de sites ont entamé depuis longtemps leur recul (en 2005, ce recul était déjà en cours http://www.precisement.org/blog/article.php3?id_article=34). Par exemple, la suppression en 2011 de celui de Google http://forum.webrankinfo.com/annuaire-google-est-mort-rip-google-directory-t145251.html suite notamment au lent endormissement de sa source DMOZ. Même les annuaires de liens spécialisés sont moins bien entretenus qu'auparavant.

    Reste quoi ? Les blogrolls ?

    RépondreSupprimer
  2. Bonjour Emmanuel,
    Je suis d'accord avec toi sur une partie de ton commentaire.
    Les annuaires généralistes sont effectivement en voie de disparition. J'avais déjà parlé ici de l'abandon de Dmoz par Google (http://bfr.li/QAz1aB).
    Les répertoires sélectifs ne vont guère mieux, et des outils comme Intute ne sont plus mis à jour (http://bfr.li/Si5rmW)...

    En revanche, les annuaires thématiques se portent bien, et il en existe dans tous les domaines. Certains sont toujours très actifs, comme par exemple Cismef.org, pour la médecine...

    Quant aux pages de liens, elles existent depuis longtemps et sont toujours proposées par de nombreux sites institutionnels par exemple.
    Je pense que justement, elles pallient en quelque sorte la disparition des annuaires. Mais pour moi, elles sont plus proches des annuaires thématiques que des annuaires généralistes. Car elles couvrent des domaines très pointus. Et ceux qui les réalisent (que ce soient des passionnés, des experts ou des institutions...), n'ont pas besoin d'un annuaire généraliste pour connaître les liens de leur domaine...
    En revanche, leur point faible est souvent (comme pour les annuaires) leur fréquence de mise à jour, qui laisse quelquefois à désirer.

    En fait, je présente généralement cette méthodologie lors des formations que j'anime (http://bfr.li/QweZhB), et les participants qui testent la méthode sur leur domaine sont le plus souvent enthousiasmés par les résultats qui les concernent... (Surtout ceux qui lancent une recherche avec intitle:juridique intitle:liens|sites OR inurl:liens|sites et qui découvrent en premier résultat... Precisement.org bien sûr :-)))

    RépondreSupprimer