Les meilleurs annuaires d'outils de recherche et de bases de données web
Les meileurs outils de recherche généraliste
LES MEILLEURS ANNUAIRES D'OUTILS DE RECHERCHE ET DE BASES DE DONNEES WEB
- -- Infomine / Bibliothèques de l'Université de Californie : annuaire/répertoire de liens : sources universitaires et bases de données du Web invisible ; classement thématique et moteur de recherche interne efficace ; très utile
- -- Lycos Directory : Reference : version Lycos de l'Open Directory : annuaire/répertoire sélectif de sources d'information de référence, classées par types de sources et/ou par thèmes, et comprenant notamment des sources académiques et plus de 10 000 bases de données faisant partie du Web invisible (ces dernières sélectionnées par Intelliseek), la société éditrice du logiciel métamoteur BullsEye Pro ; très utile
- -- The InvisibleWeb / Intelliseek : annuaire très sélectif, très américain et bien commenté des sites les plus riches en information
- -- The Invisible Web Directory / Chris Sherman, Gary Price : répertoire thématique sélectif de liens décrits vers des bases de données et catalogues à contenu de valeur (web invisible) extraits du livre "The Invisible Web : Finding Hidden Internet Resources Search Engines Can't See" des mêmes auteurs ; attention : ce répertoire est très partiel, notamment il se limite au monde anglo-saxon et ignore quantité de ressources, se limitant à environ 1000 sites, ce qui est peu vu l'ampleur du sujet
- -- Search.com (réseau CNet) : annuaire/répertoire thématique et métamoteur de sites du Web invisible ; on peut limiter la recherche à un domaine particulier ou sélectionner chacune des sources ; également une focntionnalité métamoteur de moteurs généralistes peu pertinente (Yahoo!, Direct Hit, Lycos, Inktomi, GoTo)
- -- Complete Planet : deux outils pour chercher sur le Web invisible (non indexable par les moteurs de recherche) : un annuaire de plus de 17 000 bases de données gratuites disponibles sur le Web et un logiciel, Lexibot, téléchargeable gratuitement
- -- Searchability / Paula Dragutsky : guide bien commenté des guides et listes d'outils de recherche, classés par types : guides spécialisés, guides d'outils universitaires, guides d'outils régionaux, métamoteurs spécialisés ... ; très américain néanmoins et peu sévère dans ses commentaires (Assez bien)
- -- Refdesk / Bob Drudge : annuaire/répertoire thématique listant des sites de référence sélectionnés (et souvent brièvement décrits) dans tous les domaines, essentiellement pour les Américains ; les sites sont fortement sélectionnés, ce qui fait gagner du temps dans la recherche de sources fiables, mais les choix sont souvent critiquables ; parmi les catégories : presse, y compris les journaux du monde entier, biographies, etc. (Assez bien)
- -- Pac-Info Search Systems / Pacific Information Systems : annuaire de plus de 4000 bases de données publiques gratuites en matière criminelle, d'état civil (naissances, mariages, décès) et universitaires, essentiellement américaines et canadiennes ; servent à l'identification de personnes ; classement géographique
LES COMPILATIONS DE LIENS DE GARY PRICE
- -- Direct search / Gary Price, bibliothécaire documentaliste à la Gelman Library, George Washington University, et formateur à la recherche sur Internet : une très riche compilation de liens classés sommairement vers les bases de données du Web invisible les meilleures et les plus diverses ; une sélection majoritairement anglo-saxonne ; cette page offre un moteur de recherche interne pour l'ensemble des pages de Gary Price ; n'est plus tenu à jour depuis le 26/06/2002
- -- NewsCenter / Gary Price, bibliothécaire documentaliste à la Gelman Library, George Washington University, et formateur à la recherche sur Internet : une compilation de liens classés vers de très nombreuses sources de presse : agences de presse, journaux en ligne et moteurs de recherche d'articles ; n'est plus tenu à jour depuis le 22/05/2002
- -- Price's List of Lists / Gary Price, bibliothécaire documentaliste à la Gelman Library, George Washington University, et formateur à la recherche sur Internet : riche compilation de liens vers les classements d'entreprises, organisations, personnes, ..., classés par thème et par secteurs économique ; depuis 2002, la LOL est maintenue par Specialissues.com
- -- Fast Facts : Almanacs/Factbooks/Statistical Reports & Related Reference Tools / Gary Price, bibliothécaire documentaliste à la Gelman Library, George Washington University, et formateur à la recherche sur Internet : riche compilation de liens classés par sujet vers des recueils statistiques et de données, majoritairement anglo-saxons
- -- The Virtual Acquisition Shelf & News Desk / Gary Price, bibliothécaire documentaliste à la Gelman Library, George Washington University, et formateur à la recherche sur Internet : associé à une liste de diffusion, ce site décrit les nouveaux sites ou pages web riches en contenu, majoritairement anglo-saxons, rencontrés par Gary Price
LES MEILLEURS OUTILS DE RECHERCHE GENERALISTES
LES MEILLEURS REPERTOIRES GENERALISTES
- -- Google Directory : version Google de l'annuaire Open Directory : les liens sont triés par ordre de pertinence selon Google
- -- Open Directory Project (ex-DMOZ) : répertoire thématique commenté majoritairement anglo-saxon, tenu par environ 20 000 éditeurs bénévoles responsables chacun d'une rubrique ; très riche en pages Web originales car seul grand répertoire généraliste à pratiquer le "deep linking" ; sélection de qualité inégale selon les rubriques ; c'est l'annuaire de Netscape (Directory of Mozilla), d'AOL, de Google et d'Altavista ; il est libre de droits et est interrogé par tous les grands moteurs de recherches généralistes
- -- Lycos Directory : Reference : version Lycos de l'Open Directory : annuaire/répertoire sélectif de sources d'information de référence, classées par types de sources et/ou par thèmes, et comprenant notamment des sources académiques et plus de 10 000 bases de données faisant partie du Web invisible (ces dernières sélectionnées par Intelliseek), la société éditrice du logiciel métamoteur BullsEye Pro ; très utile
- -- Yahoo! : répertoire de sites, à dominante américaine ; référencement payant dans les catégories pour sociétés, ailleurs possibilité de soumission payante prioritaire ; utilise Google comme robot/base de données pour compléter ses résultats si insuffisants
- -- The World Wide Web Virtual Library : répertoire thématique et sélectif de liens vers des ressources de valeur, essentiellement académiques, universitaires et scientifiques ; encyclopédique et tenu par des universitaires spécialistes de leur matière (chacun est responsable de son sujet et le tient indépendamment des autres), ce répertoire décentralisé est considéré comme une autorité sur Internet ; certains sujets sont toutefois moins bien traités et la mise à jour peut prendre du temps
LES MEILLEURS MOTEURS DE RECHERCHE GENERALISTES
Rappel : Inktomi fournit de nombreux moteurs de recherche et annuaires avec une partie, voire la totalité de sa base de données ; Inktomi pratique fortement le référencement payant (possibilité d'être référencé contre paiement)
- -- Google : moteur de recherche rapide, puissant et très pertinent ; les résultats sont présentés en 4 onglets : Web, Groups (forums de discussion, depuis 1981), Images et Directory (version Google de l'annuaire Open Directory : les liens sont triés par ordre de pertinence selon l'algorithme de Google) ; les fichiers trouvés sont mis en cache par Google, avec les critères de recherche surlignés (une page cachée "dure" environ 1 mois) ; Google indexe quotidiennement les sites d'actualité et indexe les fichiers PDF issus de fichiers Word (le fichier caché est alors une copie texte au format HTML du fichier Acrobat, ce qui rend accélère nettement sa consultation), et également les fichiers Word, RTF, Excel, PowerPoint et PostScript ; son classement par pertinence utilise le nombre et la qualité des liens vers les pages web et les mots des pages ; sous chaque résultat s'affiche la classe pertinente du répertoire thématique Google Directory ; les opérateurs booléens sont disponibles (sauf le SAUF, et pas les parenthèses) et le mode d'emploi (FAQ) est clair et détaillé ; possibilité de positionnement payant
- -- Google Advanced Search : mode expert de Google : recherche par le titre ou l'URL, opérateurs booléens, recherche par expression, recherche des pages ayant un lien vers une page donnée (comme AltaVista) et recherche de pages similaires à une page donnée ; également recherche dans les forums de discussion (newsgroups)
- -- Wisenut : moteur de recherche généraliste très pertinent ; à la Google mais avec des différences : classe les résultats selon la popularité et les mots de la page et des liens, mais insiste plus sur le contexte sémantique défini par les mots des pages "liantes" et offre un classement par catégories ad hoc à la Northern Light ; le mode expert n'offre pas le OU logique
- -- Teoma : moteur de recherche généraliste en version de test (au 10/06/2001) donnant trois types de résultats : en haut, des répertoires classant des réponses par catégories ad hoc (à la Northern Light), dans la colonne de gauche, des pages tirées de sites de référence (à la Google), et dans la colonne de droite des sites dits "Expert links", en fait des suggestions de sites qui peuvent compléter les réponses principales ; pertinence approchant celle de Google sans l'atteindre tout à fait ; un outil complémentaire en tout cas, puisque ses résultats diffèrent de ceux de Google dès la 15e réponse ; acheté par Ask Jeeves, Teoma continue à fonctionner en solo
- -- All the Web / Fast : moteur de recherche très puissant sur la recherche en texte intégral et très rapide ; idéal pour des recherches très pointues ; manque parfois (rarement) de pertinence sur les recherches larges ; de plus, il présente en tête de la liste des résultats des catégories pertinentes tirées de l'Open Directory (comme Google) ou, sinon, bâties automatiquement, ad hoc, à la Northern Light ; sous ces catégories, il présente des résultats tirés de sources d'actualité ("news") anglo-saxonnes, mais pas françaises ; logiciel/base de données : Fast Search ; offre un référencement payant
- -- Lycos : moteur de recherche et répertoire ; base de données : Fast Search (base de données principale), DirectHit et Overture (ex-GoTo) ; source pour l'annuaire : Open Directory ; possibilité de positionnement payant
- -- Lycos : Advanced Search Filters : le mode expert de ce moteur de recherche alimenté par les bases Fast, ODP, DirectHit et Overture offre la recherche par les champs/filtres titre, URL, liens et langue ; il est également possible de limiter la recherche à une seule des bases alimentant Lycos mais dans ce cas les champs ne fonctionnent pas
- -- AltaVista : moteur de recherche peu pertinent même si on utilise le mode expert avec les champs et les opérateurs booléens ; enrichit ses résultats avec la base de l'annuaire LookSmart qui fournit le contenu de l'AltaVista Directory ; résultats très anglo-saxons ; offre un référencement payant
- -- AltaVista Advanced Search : mode expert de AltaVista ; vaut essentiellement pour la richesse sans rivale de ses options de recherche booléenne et des champs de recherche offerts (exemple : dernier moteur de recherche à offrir un opérateur de proximité (NEAR) ; logiciel/basede données : Inktomi ; possibilité de référencement et de positionnement payants
- -- AltaVista : Text-Only Search : (ex-Raging Search) : moteur de recherche basé sur le même principe que Google mais d'une puissance et d'un degré de pertinence inférieurs ; sa base de données étant celle d'AltaVista, les résultats sont différents, donc complémentaires, de ceux de Google (Assez bien)
LES MEILLEURS META-MOTEURS EN LIGNE (interrogent plusieurs moteurs de recherche en même temps)
- -- Ixquick : métamoteur pertinent ; ne prend que les 10 premiers résultats des moteurs sélectionnés ; accepte les opérateurs booléens ; possibilité de choisir les moteurs parmi ceux proposés : Yahoo, MSN, AOL, FAST, AltaVista, GoTo, HotBot, Webcrawler, LookSmart ; ses performances et celles de son concurrent Vivisimo sont équivalentes
- -- Vivisimo : métamoteur pertinent ; son mode expert offre les opérateurs booléens et tous les champs de recherche classiques (link, domain, host, etc.) ; classe les réponses par catégories ("clustering") entièrement ad hoc mais moins efficace que celui de Northern Light ; interroge : Yahoo, MSN, AltaVista, FAST, Open Directory, DirectHit, LookSmart (on ne peut pas sélectionner seulement certains) ; ses performances et celles de son concurrent Ixquick sont équivalentes
- -- Query Server / LeadingSide : métamoteur de grands moteurs généralistes et de bases de données (Invisible Web) ; interroge notamment : Northern Light, Google, AltaVista, Yahoo!, Hotbot, Lycos ainsi que Medline, la FDA, CNNfn, Edgar Online...) ; nombre de résultats limité à 40 par moteur ; le classement des résultats peut se faire par concepts, sur le modèle de Northern Light ; très pertinent
OUTILS DE RECHERCHE SPECIALISES
OUTILS DE RECHERCHE DANS LES ARCHIVES DE L'INTERNET
- -- The Internet Archive : archives sélectives du Web (plus de 100 terra-octets de données au 30/10/2001) cherchables par l'URL d'une page (WayBack Machine); sur certains thèmes ou événements, des dossiers ont été constitués
- -- Google : moteur de recherche rapide, puissant et très pertinent ; les résultats sont présentés en 4 onglets : Web, Groups (forums de discussion, depuis 1981), Images et Directory (version Google de l'annuaire Open Directory : les liens sont triés par ordre de pertinence selon l'algorithme de Google) ; les fichiers trouvés sont mis en cache par Google, avec les critères de recherche surlignés (une page cachée "dure" environ 1 mois) ; Google indexe quotidiennement les sites d'actualité et indexe les fichiers PDF issus de fichiers Word (le fichier caché est alors une copie texte au format HTML du fichier Acrobat, ce qui rend accélère nettement sa consultation), et également les fichiers Word, RTF, Excel, PowerPoint et PostScript ; son classement par pertinence utilise le nombre et la qualité des liens vers les pages web et les mots des pages ; sous chaque résultat s'affiche la classe pertinente du répertoire thématique Google Directory ; les opérateurs booléens sont disponibles (sauf le SAUF, et pas les parenthèses) et le mode d'emploi (FAQ) est clair et détaillé ; possibilité de positionnement payant
- -- Google Groups : recherche de et dans les groupes/forums de discussion (Usenet newsgroups) depuis 1981 ; également une version Usenet Advanced Search ; Google Groups a repris les archives de Deja.com (ex-DejaNews)
OUTILS DE RECHERCHE DE ET DANS LES FORUMS DE DISCUSSION (Usenet ou newsgroups) ET LISTES DE DIFFUSION (mailing lists)
- -- ATTENTION ! : Certains moteurs de recherche généralistes (AltaVista, HotBot) peuvent aussi chercher sur Usenet
- -- Google Groups : recherche de et dans les groupes/forums de discussion (Usenet newsgroups) depuis 1981 ; également une version Usenet Advanced Search ; Google Groups a repris les archives de Deja.com (ex-DejaNews)
OUTILS DE RECHERCHE DE PERSONNES (état civil, identité, naissances, mariages, décès, carrière, CV, ...)
- -- US Search : site web du service payant américain 1800 US SEARCH : interroge toutes les bases de données nominatives publiques américaines ("public records" : crédits, hypothèques, faillites, jugements, condamnations judiciaires, etc.) ; redoutablement efficace et indiscret
- -- Pac-Info Search Systems / Pacific Information Systems : annuaire de plus de 4000 bases de données publiques gratuites en matière criminelle, d'état civil (naissances, mariages, décès) et universitaires, essentiellement américaines et canadiennes ; servent à l'identification de personnes ; classement géographique
LES MEILLEURS GUIDES SUR LES OUTILS DE RECHERCHE
- -- Tool Kit for the Expert Web Searcher / Pat Ensor, bibliothécaire documentaliste, directrice de la W. I. Dykes Library, University of Houston-Downtown, et chair du Top Technology Trends Committee, LITA : liste de liens commentés vers les outils de recherche les plus efficaces pour les documentalistes, y compris sur le Web invisible
- -- Search Engines Showdown / Greg Notess, bibliothécaire à la Montana State University Bozeman Library : actualité et évaluation détaillée des principaux annuaires, moteurs de recherche et services de recherche d'articles de presse ; newsletter gratuite
- -- Search Engine Watch / Dany Sullivan, Chris Sherman : tout sur les moteurs de recherches et le référencement ; newsletter Search Engine Report et Search Day gratuites
- -- Search Engine World / Brett Tabke : guide sur les outils de recherche (annuaires et moteurs de recherche), avec un angle d'attaque spécifique : référencement, robots (spiders) et indexes et non recherche pure ; newsletter trimestrielle gratuite Search Engine World Quarterly
Site parrainé par GestionDeLaPaie.Com : L'actualité de la paye et du droit social par des gestionnaires de paye et des contributeurs.