jeudi 24 octobre 2013

Quelles alternatives à Google dans le domaine scientifique - 26èmes Journées du RNDH

Créé en 1991, le RNDH – Réseau national des documentalistes hospitaliers – organisait les 17 et 18 octobre derniers ses 26èmes "Journées", sur le thème "Documentation numérique : outils de recherche et actualité juridique au service de la documentation hospitalière".

Organisées tous les ans, ces journées sont un moment fort de rencontre entre les membres du réseau, qui ont l'occasion d'assister à plusieurs conférences et ateliers, et de découvrir les actualités proposées sur les stands de quelques sponsors.

Comme l'an passé, j'ai eu le grand plaisir d'intervenir lors d'une conférence, qui avait cette fois-ci pour thème "Recherche éveillée sur Internet : quelles alternatives à Google dans le domaine scientifique".
 


Il existe sur le Web de très nombreux outils de recherche dédiés à l'information scientifique.
Ces outils sont extrêmement diversifiés, sur le plan de leur "fonctionnement" d'abord (moteur de recherche, moteur personnalisable, métamoteur...), mais aussi sur celui du type de ressources indexées (articles, thèses, etc.) et de l'accès à ces ressources.

Eu égard au temps de parole dont je disposais (60 mn), j'ai choisi de restreindre ma présentation aux outils de recherche accessibles gratuitement et offrant une part importante d'informations scientifiques en accès libre.

J'ai donc présenté, devant un aréopage de professionnels de l'information scientifique, un certain nombre d'alternatives à Google Search, classées dans différentes familles d'outils. On en trouvera ci-après une rapide description.


RNDH : un auditoire attentif, réactif, et souriant :-)


1. Les moteurs de recherche de littérature scientifique
(multidisciplinaires / multiressources)

On trouve dans cette famille des moteurs de recherche en accès libre, qui indexent spécifiquement la littérature scientifique et académique, dans tous les domaines : sites universitaires, archives ouvertes, mais aussi banques de données reconnues (Refdoc…). L'accès aux références bibliographiques est en accès libre, mais le document primaire est gratuit ou payant, selon les sources.

A.  Scirus (www.scirus.com)
Créé en 2001 par Elsevier. Indexe plus de 575 millions de documents de contenu scientifique, issus du Web ouvert (sites universitaires, gouvernementaux...) et de banques de données (LexisNexis, ScienceDirect…). Nombreuses possibilités de recherche
Ce moteur va malheureusement être abandonné en janvier 2014

B.  Google Scholar (http://scholar.google.fr)
Créé par Google en 2004 ; interfaces dans + 40 langues. L'un des principaux points d'accès à l'IST française. Indexe des sources du Web ouvert et des bdd payantes (RefDoc…). Nombreux partenariats avec des éditeurs ; accords avec des bibliothèques de nombreux pays… Recherche de documents dans une langue donnée ; notion de "citation" ; Abonnement fil RSS/requête.
Mais opacité de la couverture, de l'antériorité, du volume…

C.   Microsoft Academic Search (//academic.research.microsoft.com) 
Lancé fin 2009 par Microsoft. Indexe près de 50 millions de publications dans le domaine scientifique et technique, issues de sources en open access ou de bases de données sur abonnement (Elsevier, Springer…). Indique les relations-clés entre les sujets, le contenu et les auteurs. Nombreuses options de cartographie (relations entre auteurs...). Abonnement fil RSS/requête


2. Les portails scientifiques multidisciplinaires

Ces outils proposent une recherche fédérée (en temps réel) sur différentes sources et banques de données (portails…). La visualisation des références en accès libre. Selon les sources interrogées, l'accès au document primaire est offerte en ligne ou non (ou via paiement)

A. Science.gov (http://www.science.gov)
Lancé en 2002 par Science.gov Alliance (organisations scientifiques américaines), à l'initiative du US Department of Energy. Portail d'accès aux ressources scientifiques officielles américaines. Recherche par arborescence (agriculture, santé…) + recherche fédérée par mots sur le contenu de 55 banques de données et de 2100 sites scientifiques, offrant 200 millions de pages. Nombreux filtres de recherche + filtre "visual". Alertes par mail/RSS.... Participe au portail WorldWideScience.

B.  ScienceResearch.com (www.scienceresearch.com)
Moteur de recherche libre lancé par Deep Web Technologies en 2005 ; nouvelle version en 2009. Interroge plus de 400 "collections" de sources dans le domaine des sciences et technologies (PubMed, IngentaConnect, Cochrane Library…) ainsi que des portails de recherche sur la science, comme Science.gov, Mednar.com,  WorldWideScience.org. 

C.  WorldWideScience (http://worldwidescience.org)
Portail mondial et multilingue d'accès à l'information scientifique, créé en 2007 par la WorldWideScience Alliance ; s'est largement développé depuis son lancement. Permet d'interroger simultanément plus de 80 banques de données et portails scientifiques de différentes langues dans +70 pays, grâce à sa recherche fédérée (Deep Web Technologies) et sa technologie de traduction (Microsoft). Présentation identique à ScienceGov (y compris le filtre "visuel"). 
Parmi les membres de l'Alliance : US DOE, British Library, Inist… Alertes par mail, RSS…



 3. Les moteurs de recherche multidisciplinaires /
ressources en open access

On trouve à la fois, dans cette large famille :
 • des moteurs personnalisables, réalisés le plus souvent avec l'application Google CSE (Google Custom Search Engine), et qui interrogent en fait un "sous-ensemble" de Google (dans notre cas : des serveurs d'archives ouvertes).
On peut alors utiliser la syntaxe de Google. Mais l'affichage des résultats est limité aux 100 premières réponses.  

A.   OpenDOAR (Directory of Open Access Repositories) (http://www.opendoar.org)

OpenDoar est avant tout un annuaire des serveurs d'archives ouvertes dans le monde (+2 200), réalisé par le Centre for Research Communications (Royaume-Uni). 
Il s'est enrichi par la suite d'un moteur (Google CSE) permettant d'interroger le contenu des serveurs recensés.


B.   ROAR (Registry of Open Access Repositories) (http://roar.eprints.org)

Annuaire des serveurs d'archives ouvertes dans le monde, créé par l'Université de Southampton. Recense +3 400 serveurs, et permet de lancer une recherche sur leur contenu grâce à l'outil Google CSE.


Ces deux outils peuvent aussi permettre d’identifier des "repositories" dédiés au domaine biomédical


C.  FreeFullPDF (www.freefullpdf.com)

Moteur développé par la société française KnowMade, avec Google CSE. Interroge plus de 80 millions de documents PDF issus de 15 000 sources scientifiques (sciences de la vie, sciences physiques…). Depuis la liste des résultats : possibilité de trier les documents par type : articles, brevets, posters, thèses.


D.  JURN (www.jurn.org )

Moteur réalisé en 2009 par l'enseignant David Haden, avec Google CSE. Permet de lancer une recherche sur plus de 4500 revues académiques en open access, dans le domaine des arts et humanités (le domaine biomédical est néanmoins relativement bien couvert).

des "moissonneurs OAI", qui interrogent les serveurs d'archives ouvertes selon le protocole OAI-PMH (Open Archive Initiative Protocol for Metadata Harvesting) :  

A.   BASE (Bielefeld Academic Search Engine) (http://www.base-search.net) 
Moteur de recherche dédié aux ressources académiques, géré par la bibliothèque de l'université de Bielefeld. Donne accès à plus de 51,7 millions de documents issus de + 2700 sources. Indexe les métadonnées des documents. 
Dispose de nombreuses possibilités de recherche (document entier, titre, auteur, type de document, année…) et de nombreux filtres (auteur, sujet, date de publication…). 
Interface en français. Alerte par fil RSS. 

B.   OAISTER (http://oaister.worldcat.org) 
Créé en 2009 par l'université du Michigan avec le soutien de l'OCLC. Donne accès à plus de 30 millions de documents, issus de plus de 1500 archives ouvertes. Les données de OAIster sont incluses dans WorldCat. Interface multilingue.

C.  DOAJ (Directory of Open Access Journals) (www.doaj.org)

A l'origine : annuaire créé par la bibliothèque de l'université de Lund (Suède), recensant près de 
10 000 revues en open access. Possibilité de lancer une recherche par mots sur le contenu de 5 600 d'entre elles. Accès à plus de 1,5 million d'articles. Interface en français.


D.  SOAJ (Science Open Access Journal) (www.osti.gov/soaj)

Interroge simultanément des sources comme Biomed Central, Europe PubMed Central, DOAJ, Scientific Electronic Library Online…
Technologie Deep Web Technologies. Présentation identique à WorldWideScience.


4. Des outils de recherche dédiés au large domaine de la santé

Il ne s'agit ici que d'une petite sélection de l'offre (abondante), destinée à illustrer la diversité des outils qui existent... 

A.  Europe PubMedCentral (http://europepmc.org)
PubMed permet d'interroger gratuitement la base bibliographique Medline (NCBI /NLM). PubMedCentral quant à lui contient les articles dont le texte intégral est en accès libre. 
Lancé en 2012, Europe PMC a pris la suite de UKPMC (lancé en 2007), qui était à l'origine un site miroir de PubMed Central. Il donne accès à 28 millions d'articles avec résumé et 2,6 millions avec texte intégral (dont 570 000 en open access), à des brevets, etc. 

B.   BioMed Central (http://www.biomedcentral.com) 
Maison d'édition spécialisée dans le domaine scientifique, technologique et médical. Publie plus de 250 revues "peer-reviewed" en libre accès. Les articles sont en ligne gratuitement dès leur publication. Hébergé sur la plateforme SpringerOpen. 

C.  Quertle (www.quertle.com)

Moteur biomedical en accès libre lancé en 2009, utilisant la sémantique dans ses algorithmes pour une meilleure pertinence. Permet une recherche en langage naturel. Quertle utilise le contenu de PubMed/Medline, ainsi que des articles en texte intégral issus de Biomed Central, de banque de données comme Toxline… En réponse à une requête, Quertle propose les concepts clés, etc.


D.  MedNar.com (www.mednar.com)

Permet d'interroger simultanément de nombreuses sources, bdd et portails dans le domaine biomédical (ClinicalTrials, NLM, PubMed…). Réalisé par Deep Web Technologies. Depuis la page de résultats : nombreux filtres par topics, auteurs, publications, date… + filtre "visuel". Alerte par mail ou RSS.

E.  CiSMeF (www.cismef.org) 
Catalogue et Index des Sites Médicaux Francophones du CHU de Rouen, lancé en 1995. Propose l'essentiel de la documentation biomédicale francophone en ligne. Offre une recherche par mots sur la base (Doc'CiSMeF), des recommendations de Bonnes Pratiques (CiSMeF BP), des ressources pour l'enseignement (Doc'UMVF), et des ressources pour les patients (CiSMeF Patients). 

F.  BioText Search Engine (http://biosearch.berkeley.edu) 
Lancé par l'université de Californie en 2007. Permet d'interroger le contenu de plus de 300 revues en open access. 

G.  SEARCH MEDICA (www.searchmedica.com)
Lancé en 2006 à l'initiative de Pulse, une revue anglaise. Interroge une sélection de sites, choisis par un groupe d'experts, médecins et cliniciens. Permet d'affiner selon le type de résultat : research/reviews, practice guidelines, patient education, etc. 

H.  ISIDORE (www.rechercheisidore.fr)
Plateforme de recherche réalisée par Huma-Num et le CCSD du CNRS. Donne accès à plus de 2,8 millions de documents (majoritairement en accès libre) issus de plus de 2150 sources en sciences humaines et sociales (parmi lesquelles HAL, Hypotheses.org, Persee…) regroupées en 88 collections. Peut néanmoins fournir de nombreuses réponses à des questions biomédicales. 


5. Les moteurs de questions-réponses

En guise de conclusion à ce panorama, j'ai ajouté à ces différentes familles un type d'outil trop souvent oublié, à savoir les moteurs de questions-réponses. Certains en effet sont réalisés par des professionnels de l'information, et sont susceptibles de fournir des résultats et des méthodologies de recherche pertinentes.
Le service Questions-Santé de la Cité des Science, dont les archives remontent à octobre 2008, peut ainsi s'avérer utile pour certaines questions scientifiques.

Sur ce sujet, on conseillera la lecture de l'article "Sqrpro.fr : un moteur de questions/réponses sur le monde de l'infodoc", paru dans la lettre Netsources et offert en accès libre sur le site Bibliobsession.


Lors de ce rapide tour d'horizon, le temps manquait pour présenter dans le détail les différents outils. Pour mettre en avant leur caractéristiques, j'ai choisi de comparer systématiquement pour chaque outil les résultats d'une même requête, pour laquelle Google Search n'est clairement pas adapté, à savoir "obtenir des données scientifiques/médicales concernant la Spiruline / Spirulina" ...

On trouvera dans le support ci-dessous les copies d'écran de chacun des outils, en réponse à cette question.
Ce support n'a pas été utilisé lors de la conférence car je lui préfère le "direct live", mais il permettra à ceux qui n'étaient pas là de voir les points qui ont été abordés, et à ceux qui y étaient d'en avoir un rappel. Il ne prétend pas toutefois à l'exhaustivité des sources...
Pour découvrir d'autres outils de recherche, on conseillera la consultation de la liste "50 outils de recherche pour l'information scientifique", proposée par l'Urfist de Rennes.

Et vous, quelles alternatives à Google utilisez-vous lors de recherches scientifiques ?



6 commentaires:

  1. Je pense que les scientifiques qui connaissent d'autres alternatives à part google pour rechercher sur internet sont encore peu nombreux. Et il faut bien les comprendre, ils ne sont pas des spécialistes du web mais de la médecine.
    Merci donc pour cette liste qui aide plus d'un.

    RépondreSupprimer
  2. Pas mal de scientifique ne connaissent d'autres moyens de recherche sur le net outre google, et il faut bien les comprendre, car leur domaine d'intervention c'est surtout le médecine non l'internet.
    Donc, je suis sûre que cette liste aidera plus d'un. Merci.

    RépondreSupprimer
  3. c'est un sujet qu'il fallait absolument aborder, les informations sur Google (santé, science) sont certes nombreuses mais des moteurs de recherches plus spécifiques sont plus sûres et plus complètes.

    RépondreSupprimer
  4. Excellent article... Je comprends qu'il n'ait pas la prétention d'être exhaustif mais, en matière scientifique, ne faudrait-il pas tout de même mentionner les moteurs de recherches dédiés aux brevets ?
    http://patft.uspto.gov/
    http://www.freepatentsonline.com/

    RépondreSupprimer
  5. Bonjour,
    Merci de votre commentaire.
    Je comprends votre remarque et j'aurais bien sûr mentionné les bases brevets, si j'avais tenté de réaliser un "panorama" des outils de recherche scientifique.
    Mais cet article est le compte-rendu d'une conférence qui s'adressait aux professionnels de la santé, et tentait de répondre (dans un temps imparti !) à la question "quelles alternatives à Google (Search)".
    Il m'aurait fallu beaucoup plus de temps pour couvrir les alternatives aux différents modules de Google (dont Google Patents), et parler par exemple des outils dédiés aux brevets, aux thèses, etc.
    Une autre fois peut-être ;-)

    RépondreSupprimer
  6. J'ai apporté des modifications à JURN, pour le rendre beaucoup plus utile à la santé et biomédicale.

    RépondreSupprimer