Precisement.org > Internet documentaire

Formation d'assistants bibliothécaires documentalistes - FABDOC Cours 2003

L'Internet documentaire

Plan de cours et points clés

04/12/2003

 

Introduction rapide

1. Un peu d'histoire : les origines de l'Internet actuel
1.1. Une (r)évolution technologique
1.2. Un état d'esprit

2. Economie de l'Internet
2.1. Gérer Internet : les acteurs d'Internet et leurs luttes de pouvoir
2.2. Financements et rentabilité du réseau et des sites web
2.3. Quelles leçons les documentalistes peuvent-ils tirer de l'évolution actuelle d'Internet ?

3. Internet documentaire : nouvelles techniques et vieilles recettes
3.1. Les sources d'information sur Internet
3.2. Les outils de recherche sur Internet
3.3. Méthode d'utilisation des outils de recherche
3.4. La veille
3.5. La gestion documentaire modifiée elle aussi par Internet

4. La sécurité sur Internet
4.1. Les enjeux sécurité des matériels, programmes et données
4.2. Les procédures à suivre

Conclusion

Notes

 

Introduction rapide

  • Pourquoi ce cours ?
    • donner les clés, les logiques, les constantes et des pistes de découverte. Mais c'est à vous de découvrir
    • avant d'aborder la recherche documentaire sur Internet, il est plus qu'utile de définir Internet et son mode de fonctionnement, ainsi que sa place dans l'économie
  • NB : merci de prendre le minimum de notes : écoutez et cherchez à comprendre d'abord. Notez ce qui vous surprend, ce sur quoi vous voudrez poser des questions. Vous retrouverez les adresses Web des sites web cités en interrogeant le moteur de recherche Google http://www.google.com avec pour mot-clé le nom du site

 

1. Un peu d'histoire : les origines de l'Internet actuel

  • 1.1. Une (r)évolution technologique
    • Les causes fondamentales
    • Chronologie
  • 1.2. Un état d'esprit
    • L'enfance : un réseau scientifique subventionné de chercheurs, d'informaticiens et d'initiés libertaires
    • Les erreurs de l'adolescence : volonté d'indépendance, "netéconomie" et illusion de la gratuité (1995-02/2001)
    • L'arrivée dans l'âge adulte ? : faillites des dot-com (1) (pas tout à fait finies), dégonflement de la "bulle" Internet, retour aux fondamentaux, rentabilité et vrais prix, amélioration des contenus et services payants (03/2001-...)

 

2. Economie de l'Internet

  • 2.1. Gérer Internet : les acteurs d'Internet et leurs luttes de pouvoir
    • Pouvoir économique :
      • le classement des ventes sur Internet :
        1. éditeurs et sites pornographiques (Playboy, Hustler, only10s.com, ...)
        2. matériel informatique (Dell) et logiciels/jeux (jeux Microsoft, Counter Strike, Quake, GTA, ...)
        3. voyages (pas la musique et les films, illégalement copiés en masse)
      • producteurs et propriétaires de contenu numérique et de contenant sont aux deux premières places, mais les constructeurs d'équipements informatiques (à part Dell) souffrent
      • Microsoft avec .Net c/ Sun avec Java et J2EE
    • Pouvoir politique :
      • le centre d'Internet est toujours aux Etats-Unis et chez les grands de l'informatique (normes, RFC, brevets, IETF)
      • les problèmes de l'ICANN
      • les enjeux des adresse web (nouveaux domaines commerciaux (.biz, .info), domaine .eu, IPv6)
  • 2.2. Financements et rentabilité du réseau et des sites web
    • Financer un réseau mondial de télécommunications à haut débit : Internet gratuit c'est fini, maintenant c'est Internet rapide et réseaux privés (VPN, Internet2)
    • Rentabiliser les sites web : les difficultés du passage au payant
    • Utilité d'Internet pour les sociétés : l'usage d'Internet se banalise : les sociétés utilisent Internet pour leur publicité (sites plaquettes) et surtout pour travailler en réseau (l'e-mail, première fonctionnalité de l'Internet ; intranets et extranets)
  • 2.3. Quelles leçons les documentalistes peuvent-ils tirer de l'évolution actuelle d'Internet ?
    • Internet est de plus en plus un espace marchand : environ 80 % du nombre des pages Web sont celles de sociétés ou sites payants
    • Internet, ce n'est pas du virtuel, c'est du réel

 

3. Internet documentaire : nouvelles techniques et vieilles recettes

Pour une initiation ou une formation à Internet : Un nouveau guide Internet (UNGI) / Gilles Maire : un des rares guides francophones de référence, bien qu'il commence à dater (mai 1999) et que les outils de recherche qu'il cite aient disparus ou soient peu intéressants : http://guide.ungi.net.

Internet, ce n'est pas la bibliothèque universelle, Internet ne contient pas tout le savoir humain, très loin de là, et son contenu est très mal organisé et très mal indexé. Mais il est devenu un support d'informations incountournable et un moyen de recherche indispensable. Il faut donc connaître les contenus et les outils de recherche qu'il offre dans le domaine où on travaille.

  • 3.1. Les sources d'information sur Internet
    • 3.1.1. Sources "pur Internet" :
      • listes (mailing lists) (liste Juriconnexion, motrech) et forums (Usenet groups) de discussion
      • e-zines (revues uniquement sur Internet)
      • sites de veille
      • weblogs (pages d'opinions personnelles)
    • 3.1.2. Doubles Internet de sources pré-existantes : versions web de :
      • bases de données en ligne ou sur cédérom (Medline -> PubMed, Lexis France -> Lamyline, Petites affiches)
      • ouvrages à mise à jour (ouvrages Lamy -> Lamyline, Editions législatives, Le Quid, Encyclopedia Britannica -> britannica.com)
      • journaux et revues (quotidiens nationaux, notamment américains, anglais et français, avec archives payantes)
      • dictionnaires (Trésor de la langue française -> TLFi)
  • 3.2. Les outils de recherche sur Internet
    • 3.2.1. Moteurs et répertoires (improprement dits "annuaires") :
      • définition d'un moteur : un robot parcourt les pages et les indexe mot par mot, en prenant en compte la popularité des pages
      • définition d'un annuaire : un homme sélectionne les sites importants/faisant autorité, populaires et pertinents, les classe et les décrit très sommairement
      • éviter les métamoteurs, sauf ceux cités, et les off line (agents intelligents) pour des recherches non thématiques
      • les critères précis de distinction
      • distinction et interpénétration
    • 3.2.2. Avantages et défauts des outils de recherche :
      • moteurs :
        - rapidité, couverture plus large, pour trouver une aiguille dans la meule de foin
        - c/ énormément de "bruit", peu de pertinence
      • annuaires :
        - pertinence, sélectivité, autorité
        - c/ lenteur, très faible couverture, "silence"
      • dans les deux cas :
        - absence d'évaluation, de sélection et de commentaire sérieux sauf annuaires rédigés par des spécialistes, des universitaires ou des bibliothèques
        - la neutralité recule, le payant progresse (publicité payante sur mots-clés, positionnement payant, inclusion accélérée payante, inclusion payante) et perd en visibilité
      • le mélange moteur-annuaire domine aujourd'hui les interfaces des outils de recherche (même Google). La distinction est pourtant importante et persiste en profondeur dans les sources et les résultats, mais elle perd en visibilité
    • 3.2.3. Les meilleurs outils généralistes et certains des meilleurs outils spécialisés :
      • moteurs généralistes : Google, Wisenut, All the Web / Fast Search, Teoma
      • métamoteurs en ligne : Vivisimo, Ixquick, ApocalX Search, Kartoo, QueryServer
      • annuaires généralistes : Google Directory, Open Directory Project (DMOZ), Signets de la BNF, Yahoo.com, MSN France
      • moteurs spécialisés : Net2one (presse et e-zines ; payant), NorthernLight (payant) (presse américaine et études de marché), Caducée (médical français)
      • annuaires spécialisés : SciTechResources.gov (sites scientifiques et technologiques de l'Administration fédérale américaine), CISMeF (médical français)
      • annuaires d'outils de recherche :
        - annuaire d'outils francophones : Axone, ApocalX Metaguide
        - annuaire d'outils américains et internationaux : Infomine, Lycos Directory : Reference, The InvisibleWeb / Intelliseek, The Invisible Web Directory / Chris Sherman, Gary Price
      • sites francophones : Yahoo.fr et Nomade
      • droit : droit.org, liste de liens de LegalNews.fr
      • sociétés : Indexa (sociétés domiciliées en France et ayant un site Web), societe.com (informations légales), Business.com (sociétés américaines et internationales), les Pages Jaunes
      • particuliers/numéros de téléphone : les Pages Blanches, Infobel (pas de liste rouge)
    • 3.2.4. Les agents intelligents : des outils à part
      • définition : du métamoteur logiciel aux outils d'analyse linguistique
      • avantages et limites :
        - automatisation de la recherche/veille (exemples : brevets, veille concurrentielle), traitement fin de grandes masses de documents par le sens des mots permettant d'anticiper des évolutions (à court terme), de réaliser très vite des synthèses ou de tracer des représentations graphiques ("cartes")
        - c/ inadaptation des métamoteurs offline aux recherches thématiques, coût très élevé et complexité de paramétrage des autres
      • exemples : Copernic, BullsEye Pro, Strategic Finder, Arisem DigOut4U, Trivium Umap, Acetic Tropes, Datops Pericles
    • 3.2.5. Le problème des bases de données
      • avantages et inconvénients :
        - exhaustivité, fiabilité, texte intégral, qualité, et les langages d'interrogation ne sont plus un obstacle grâce aux interfaces web
        - c/ coût élevé et pas toujours forfaitaire, connaissance précise des contenus nécessaire, nécessité d'une connexion très haut débit, contenu non indexé par les moteurs de recherche
      • comment les sélectionner : comme autrefois les banques de données en ligne : contenu, interface, tarifs
  • 3.3. Méthode d'utilisation des outils de recherche
      • maîtriser :
        • 4 outils de recherche généralistes maximum, testés comme pertinents sur votre domaine : 2 annuaires et 2 moteurs
        • les outils de recherche spécialisés de votre domaine (exemples : en droit français, Legicite, droit.org, La Porte du droit, Juridiconline, ...)
        • les grandes banques/bases de données gratuites (exemples : en droit français, Legifrance, Assemblée nationale, Sénat, Bibliothèque des rapports publics)
      • tenez-vous au courant des nouveaux outils de recherche
      • connaissez des annuaires d'outils de recherche
      • faites parler votre interlocuteur sur son sujet de recherche
      • sur papier ou - mieux - sur traitement de texte, notez les mots-clés probables
      • lancez d'abord la recherche sur les supports classiques accessibles en interne et sans coût supplémentaire (fonds documentaire interne, catalogues internes, classifications, cédéroms, bases de données en ligne à coût forfaitaire)
      • demandez-vous si ça a des chances d'être sur Internet
      • si c'est le cas, est-ce que ça ne pourait pas être sur un unique site faisant autorité sur le sujet, histoire de ne pas perdre du temps en se dispersant, et aussi pour plus de pertinence. Pour cela, regardez dans vos propres signets
      • sinon, utilisez les outils de recherche disponibles sur Internet :
        • commencez par interroger les moteurs de recherche (traduire les mots-clés en anglais si nécessaire)
        • ensuite dans les annuaires spécialisés
        • puis les annuaires généralistes
        • en cas d'échec, changez de mot-clé, puis changez de moteur
      • enfin, envisagez le recours à des bases de données payantes, notamment les bases de données de presse
      • n'oubliez pas :
        • par Internet :
          - les listes (seule solution la plupart du temps : s'y inscrire) et forums de discussion (les forums sont indexés par Google Groups)
          - l'e-mail
        • et aussi les classiques :
          - les supports classiques accessibles en interne (cf supra)
          - le téléphone
          - les contacts externes : collègues, experts (qui peuvent d'ailleurs vous recommander des ressources Internet)
          - les services de fourniture de documents à distance (par fax, courrier ou e-mail)
      • en fin de recherche, l'idéal, c'est d'avoir parcouru un cycle vertueux : on est parti de ses signets, on a trouvé d'autre sites et on enrichit son répertoire de signets avec les nouveaux sites pertinents et de valeur trouvés
      • pour aller plus loin : une méthode de recherche sur Internet développée pour des formations professionnelles.

        Hiérarchie des sources d'information

        1. votre bookmark/vos signets (répertoire interne de sites)

        2. vos collègues et les experts sur le sujet (oralement ou par téléphone, fax ou e-mail)

        3. outils de recherche généralistes

        4. méta-outils de recherche

        5. outils de recherche spécialisés

        6. sites de reférence

        7. autres sites

     

    • 3.4. La veille
      • Une tâche pour le documentaliste ?
      • Les méthodes :
        • ne pas tout surveiller, au contraire
        • attention : différences avec la documentation
      • Quelques techniques et méthodes de veille (attention : je ne suis pas un spécialiste de la veille) :
        • survol régulier de sites fédérateurs et portails spécialisés
        • listes et newsletters
        • forums de discussion
        • logiciels de "push"
    • 3.5. La gestion documentaire modifiée elle aussi par Internet
      • 3.5.1. La gestion documentaire des ressources Internet
        • catalogage
        • indexation
        • simple liste de signets, répertoire de liens classés, ou base de données de sites ?
        • évaluation :
          - critères d'évaluation
          - qui peut évaluer/critiquer et comment ?
      • 3.5.2. L'intranet et la documentation
        • enjeu : s'insérer dans un projet d'information souvent conduit par d'autres et nécessitant une forte coopération avec d'autres services de l'entreprise, dont les informaticiens
        • données numériques téléchargées/copiées : les problèmes :
          - techniques de téléchargement : par document/manuel, par bloc/automatisé et paramétré (aspirateurs)
          - problèmes liés à l'application/interface de recherche
          - critères de sélection ou exhaustivité
          - droits d'auteur, y compris dans les panoramas de presse et les revues de sommaires
          - conservation : privilégier les formats :
          . pour l'information/les données : RTF, HTML (mais avec très peu de codes), XML (l'idéal)
          . pour le respect de la mise en page et des polices de caractère (image du document d'origine) : TIFF ou PDF (débat sur le PDF propriétaire)
          . passer en base de données pour séparer le contenu/les données du contenant.
        • avantages et inconvénients :
          - recherche performante et stockage économique de l'information mais sur écran et demandant compétences informatiques
          - c/ lourdeur, coûts, confort et habitude du papier
        • compétences nécessaires au cyberdocumentaliste/cyberthécaire : un gros minimum de connaissances et de pratique informatiques, sauf si on dispose d'une équipe informatique de plusieurs personnes ou d'une société de services et d'ingénierie informatiques (SSII)
        • comment attirer vers un intranet documentaire :
          - le rendre utile, indispensable : enquête de besoins, écouter les utilisateurs, créer un (des) comité(s) intranet
          - le rendre incontournable : ne pas ou ne plus assurer certaines prestations sur papier
        • le futur proche : le XML, concrètement : une nouvelle norme qui va remplacer les normes de catalogage par les DTD et schémas XML
        • les interfaces HTML des logiciels documentaires/de bibliothèque : beaucoup (pas encore tous) ont un module de publication et d'interrogation des catalogues et bases documentaires au format HTML (exemple : Ex-Libris de Cadic), on commence à passer, surtout chez les logiciels "libres" (open source), vers du tout HTML (exemples : Koha, logiciel de gestion de bibliothèque, et les Content Management Systems (CMS) dont le français Spip qui utilise le langage PHP)

     

    4. La sécurité sur Internet

    • 4.1. Les enjeux
      • sécurité des matériels, programmes et données
      • sécurité des transactions électroniques
      • importantes pertes de temps et d'argent
      • la guerre et l'espionnage électroniques sont à prendre au sérieux : Echelon, l'espionnage commercial, la veille concurrentielle faite par les concurrents, les méga bases de données sur les habitudes de consommation, 1800usearch, Google Groups garde tous les messages échangés sur les forums de discussion
    • 4.2. Les procédures à suivre
      • règle de base : il ne peut y avoir de sécurité absolue, il faut l'adapter à l'organisme, aux utilisateurs et aux correspondants
      • éviter au maximum de parler à l'extérieur des affaires de l'organisme
      • sélectionner les personnes à qui l'on donne ses coordonnées : adresse, mais plus encore n° de téléphone et de fax et adresse e-mail
      • verrouiller l'accès à son PC en mettant un mot de passe sur son économiseur d'écran
      • sur Internet :
        • navigateur web :
          - vider quotidiennement le cache et les cookies
          - durcir les réglages de sécurité (dans Internet Explorer : Outils > Options Internet : onglet Sécurité > Internet > Personnaliser le niveau + la fin de l'onglet Avancées)
        • passer par un hébergeur de messagerie ; exemples : http://www.hotmail.com, http://www.caramail.fr, http://www.yahoo.fr
        • ne pas donner son adresse e-mail officielle en cas de doute
        • account (n° de compte), ID et mots de passe : quelques précautions impératives
        • firewall

     

    Conclusion

    • lucidité et rapidité, mais pas forcément comme les autres au sein de l'entreprise l'entendent, organiser et penser aussi au passé et au présent (conservation, archivage)
    • lucidité sur l'Internet marchand
    • lucidité sur l'avenir du métier :
      • l'automatisation, pour gagner du temps afin de renforcer ...
      • la spécialisation
      • la création de valeur ajoutée
      • la gestion de l'information

     

    Notes

    (1) Cinq mille sociétés internet ont fermé ou changé de main depuis 2000 / Estelle Dumout, ZDNet France, 20/03/2003
    http://news.zdnet.fr/story/0,,t118-s2132222,00.html

     


    © 2000-2004 Emmanuel Barthe. Tous droits réservés. Merci de me demander mon autorisation par e-mail pour toute reproduction ou diffusion autre que celle de l'adresse web (URL) et pour toute impression des pages web autre que pour une utilisation personnelle et privée. Pour plus de détails, lisez les informations légales concernant ce site.

    Site parrainé par GestionDeLaPaie.Com : L'actualité de la paye et du droit social par des gestionnaires de paye et des contributeurs.