Formation d'assistants bibliothécaires documentalistes
- FABDOC Cours 2003
L'Internet documentaire
Plan de cours et points clés
04/12/2003
Introduction rapide
1. Un peu d'histoire : les origines de l'Internet
actuel
1.1. Une (r)évolution technologique
1.2. Un état d'esprit
2. Economie de l'Internet
2.1. Gérer Internet : les acteurs d'Internet
et leurs luttes de pouvoir
2.2. Financements et rentabilité du réseau
et des sites web
2.3. Quelles leçons les documentalistes peuvent-ils
tirer de l'évolution actuelle d'Internet ?
3. Internet documentaire : nouvelles techniques
et vieilles recettes
3.1. Les sources d'information sur Internet
3.2. Les outils de recherche sur Internet
3.3. Méthode d'utilisation des outils de recherche
3.4. La veille
3.5. La gestion documentaire modifiée
elle aussi par Internet
4. La sécurité sur Internet
4.1. Les enjeux sécurité des matériels,
programmes et données
4.2. Les procédures à suivre
Conclusion
Notes
Introduction rapide
- Pourquoi ce cours ?
- donner les clés, les logiques, les constantes et des pistes
de découverte. Mais c'est à vous de découvrir
- avant d'aborder la recherche documentaire sur Internet, il est
plus qu'utile de définir Internet et son mode de fonctionnement,
ainsi que sa place dans l'économie
- NB : merci de prendre le minimum de notes : écoutez et cherchez
à comprendre d'abord. Notez ce qui vous surprend, ce sur quoi
vous voudrez poser des questions. Vous retrouverez les adresses Web
des sites web cités en interrogeant le moteur de recherche Google
http://www.google.com
avec pour mot-clé le nom du site
1. Un peu d'histoire :
les origines de l'Internet actuel
- 1.1. Une (r)évolution
technologique
- Les causes fondamentales
- Chronologie
- 1.2. Un état
d'esprit
- L'enfance : un réseau scientifique subventionné
de chercheurs, d'informaticiens et d'initiés libertaires
- Les erreurs de l'adolescence : volonté d'indépendance,
"netéconomie" et illusion de la gratuité
(1995-02/2001)
- L'arrivée dans l'âge adulte ? : faillites des dot-com
(1) (pas tout à fait finies), dégonflement de la "bulle"
Internet, retour aux fondamentaux, rentabilité et vrais prix,
amélioration des contenus et services payants (03/2001-...)
2. Economie de l'Internet
- 2.1. Gérer Internet
: les acteurs d'Internet et leurs luttes de pouvoir
- Pouvoir économique :
- le classement des ventes sur Internet :
- éditeurs et sites pornographiques (Playboy, Hustler,
only10s.com, ...)
- matériel informatique (Dell) et logiciels/jeux
(jeux Microsoft, Counter Strike, Quake, GTA, ...)
- voyages (pas la musique et les films, illégalement
copiés en masse)
- producteurs et propriétaires de contenu numérique
et de contenant sont aux deux premières places, mais
les constructeurs d'équipements informatiques (à
part Dell) souffrent
- Microsoft avec .Net c/ Sun avec Java et J2EE
- Pouvoir politique :
- le centre d'Internet est toujours aux Etats-Unis et chez les
grands de l'informatique (normes, RFC, brevets, IETF)
- les problèmes de l'ICANN
- les enjeux des adresse web (nouveaux domaines commerciaux
(.biz, .info), domaine .eu, IPv6)
- 2.2. Financements
et rentabilité du réseau et des sites web
- Financer un réseau mondial de télécommunications
à haut débit : Internet gratuit c'est fini, maintenant
c'est Internet rapide et réseaux privés (VPN, Internet2)
- Rentabiliser les sites web : les difficultés du passage
au payant
- Utilité d'Internet pour les sociétés : l'usage
d'Internet se banalise : les sociétés utilisent Internet
pour leur publicité (sites plaquettes) et surtout pour travailler
en réseau (l'e-mail, première fonctionnalité
de l'Internet ; intranets et extranets)
- 2.3. Quelles leçons
les documentalistes peuvent-ils tirer de l'évolution actuelle
d'Internet ?
- Internet est de plus en plus un espace marchand : environ 80 %
du nombre des pages Web sont celles de sociétés ou
sites payants
- Internet, ce n'est pas du virtuel, c'est du réel
3. Internet documentaire
: nouvelles techniques et vieilles recettes
Pour une initiation ou une formation à Internet : Un nouveau guide
Internet (UNGI) / Gilles Maire : un des rares guides francophones de référence,
bien qu'il commence à dater (mai 1999) et que les outils de recherche
qu'il cite aient disparus ou soient peu intéressants : http://guide.ungi.net.
Internet, ce n'est pas la bibliothèque universelle, Internet ne
contient pas tout le savoir humain, très loin de là, et
son contenu est très mal organisé et très mal indexé.
Mais il est devenu un support d'informations incountournable et un moyen
de recherche indispensable. Il faut donc connaître les contenus
et les outils de recherche qu'il offre dans le domaine où on travaille.
- 3.1. Les sources
d'information sur Internet
- 3.1.1. Sources "pur Internet"
:
- listes (mailing lists) (liste Juriconnexion, motrech) et forums
(Usenet groups) de discussion
- e-zines (revues uniquement sur Internet)
- sites de veille
- weblogs (pages d'opinions personnelles)
- 3.1.2. Doubles Internet de sources pré-existantes
: versions web de :
- bases de données en ligne ou sur cédérom
(Medline -> PubMed, Lexis France -> Lamyline, Petites
affiches)
- ouvrages à mise à jour (ouvrages Lamy ->
Lamyline, Editions législatives, Le Quid, Encyclopedia
Britannica -> britannica.com)
- journaux et revues (quotidiens nationaux, notamment américains,
anglais et français, avec archives payantes)
- dictionnaires (Trésor de la langue française
-> TLFi)
- 3.2. Les outils
de recherche sur Internet
- 3.2.1. Moteurs et répertoires
(improprement dits "annuaires") :
- définition d'un moteur : un robot parcourt les pages
et les indexe mot par mot, en prenant en compte la popularité
des pages
- définition d'un annuaire : un homme sélectionne
les sites importants/faisant autorité, populaires et
pertinents, les classe et les décrit très sommairement
- éviter les métamoteurs, sauf ceux cités,
et les off line (agents intelligents) pour des recherches non
thématiques
- les critères précis de distinction
- distinction et interpénétration
- 3.2.2. Avantages et défauts des
outils de recherche :
- moteurs :
- rapidité, couverture plus large, pour trouver une aiguille
dans la meule de foin
- c/ énormément de "bruit", peu de pertinence
- annuaires :
- pertinence, sélectivité, autorité
- c/ lenteur, très faible couverture, "silence"
- dans les deux cas :
- absence d'évaluation, de sélection et de commentaire
sérieux sauf annuaires rédigés par des
spécialistes, des universitaires ou des bibliothèques
- la neutralité recule, le payant progresse (publicité
payante sur mots-clés, positionnement payant, inclusion
accélérée payante, inclusion payante) et
perd en visibilité
- le mélange moteur-annuaire domine aujourd'hui les interfaces
des outils de recherche (même Google). La distinction
est pourtant importante et persiste en profondeur dans les sources
et les résultats, mais elle perd en visibilité
- 3.2.3. Les meilleurs outils généralistes
et certains des meilleurs outils spécialisés :
- moteurs généralistes : Google, Wisenut, All
the Web / Fast Search, Teoma
- métamoteurs en ligne : Vivisimo, Ixquick, ApocalX Search,
Kartoo, QueryServer
- annuaires généralistes : Google Directory, Open
Directory Project (DMOZ), Signets de la BNF, Yahoo.com, MSN
France
- moteurs spécialisés : Net2one (presse et e-zines
; payant), NorthernLight (payant) (presse américaine
et études de marché), Caducée (médical
français)
- annuaires spécialisés : SciTechResources.gov
(sites scientifiques et technologiques de l'Administration fédérale
américaine), CISMeF (médical français)
- annuaires d'outils de recherche :
- annuaire d'outils francophones : Axone, ApocalX Metaguide
- annuaire d'outils américains et internationaux : Infomine,
Lycos Directory : Reference, The InvisibleWeb / Intelliseek,
The Invisible Web Directory / Chris Sherman, Gary Price
- sites francophones : Yahoo.fr et Nomade
- droit : droit.org, liste de liens de LegalNews.fr
- sociétés : Indexa (sociétés domiciliées
en France et ayant un site Web), societe.com (informations légales),
Business.com (sociétés américaines et internationales),
les Pages Jaunes
- particuliers/numéros de téléphone : les
Pages Blanches, Infobel (pas de liste rouge)
- 3.2.4. Les agents intelligents : des
outils à part
- définition : du métamoteur logiciel aux outils
d'analyse linguistique
- avantages et limites :
- automatisation de la recherche/veille (exemples : brevets, veille
concurrentielle), traitement fin de grandes masses de documents
par le sens des mots permettant d'anticiper des évolutions
(à court terme), de réaliser très vite des
synthèses ou de tracer des représentations graphiques
("cartes")
- c/ inadaptation des métamoteurs offline aux recherches
thématiques, coût très élevé
et complexité de paramétrage des autres
- exemples : Copernic, BullsEye Pro, Strategic Finder, Arisem
DigOut4U, Trivium Umap, Acetic Tropes, Datops Pericles
- 3.2.5. Le problème des bases
de données
- avantages et inconvénients :
- exhaustivité, fiabilité, texte intégral,
qualité, et les langages d'interrogation ne sont plus un
obstacle grâce aux interfaces web
- c/ coût élevé et pas toujours forfaitaire,
connaissance précise des contenus nécessaire, nécessité
d'une connexion très haut débit, contenu non indexé
par les moteurs de recherche
- comment les sélectionner : comme autrefois les banques
de données en ligne : contenu, interface, tarifs
3.3. Méthode d'utilisation
des outils de recherche
- maîtriser :
- 4 outils de recherche généralistes maximum, testés
comme pertinents sur votre domaine : 2 annuaires et 2 moteurs
- les outils de recherche spécialisés de votre domaine
(exemples : en droit français, Legicite, droit.org, La
Porte du droit, Juridiconline, ...)
- les grandes banques/bases de données gratuites (exemples
: en droit français, Legifrance, Assemblée nationale,
Sénat, Bibliothèque des rapports publics)
- tenez-vous au courant des nouveaux outils de recherche
- connaissez des annuaires d'outils de recherche
- faites parler votre interlocuteur sur son sujet de recherche
- sur papier ou - mieux - sur traitement de texte, notez les mots-clés
probables
- lancez d'abord la recherche sur les supports
classiques accessibles en interne et sans coût supplémentaire
(fonds documentaire interne, catalogues internes, classifications,
cédéroms, bases de données en ligne à
coût forfaitaire)
- demandez-vous si ça a des chances d'être sur Internet
- si c'est le cas, est-ce que ça ne pourait pas être
sur un unique site faisant autorité sur le sujet, histoire
de ne pas perdre du temps en se dispersant, et aussi pour plus de
pertinence. Pour cela, regardez dans vos propres signets
- sinon, utilisez les outils de recherche disponibles sur Internet
:
- commencez par interroger les moteurs de recherche (traduire
les mots-clés en anglais si nécessaire)
- ensuite dans les annuaires spécialisés
- puis les annuaires généralistes
- en cas d'échec, changez de mot-clé, puis changez
de moteur
- enfin, envisagez le recours à des bases de données
payantes, notamment les bases de données de presse
- n'oubliez pas :
- par Internet :
- les listes (seule solution la plupart du temps : s'y inscrire)
et forums de discussion (les forums sont indexés par Google
Groups)
- l'e-mail
- et aussi les classiques :
- les supports classiques accessibles en interne (cf supra)
- le téléphone
- les contacts externes : collègues, experts (qui peuvent
d'ailleurs vous recommander des ressources Internet)
- les services de fourniture de documents à distance (par
fax, courrier ou e-mail)
- en fin de recherche, l'idéal, c'est d'avoir parcouru un
cycle vertueux : on est parti de ses signets, on a trouvé d'autre
sites et on enrichit son répertoire de signets avec les nouveaux
sites pertinents et de valeur trouvés
- pour aller plus loin : une méthode de recherche sur Internet
développée pour des formations professionnelles.
Hiérarchie des sources d'information
1. votre bookmark/vos signets (répertoire interne de sites)
2. vos collègues et les experts sur le sujet (oralement ou par
téléphone, fax ou e-mail)
3. outils de recherche généralistes
4. méta-outils de recherche
5. outils de recherche spécialisés
6. sites de reférence
7. autres sites
- Une tâche pour le documentaliste ?
- Les méthodes :
- ne pas tout surveiller, au contraire
- attention : différences avec la documentation
- Quelques techniques et méthodes de veille (attention : je
ne suis pas un spécialiste de la veille) :
- survol régulier de sites fédérateurs et
portails spécialisés
- listes et newsletters
- forums de discussion
- logiciels de "push"
- 3.5.
La gestion documentaire modifiée elle aussi par Internet
- 3.5.1. La gestion documentaire des ressources
Internet
- catalogage
- indexation
- simple liste de signets, répertoire de liens classés,
ou base de données de sites ?
- évaluation :
- critères d'évaluation
- qui peut évaluer/critiquer et comment ?
- 3.5.2. L'intranet et la documentation
- enjeu : s'insérer dans un projet d'information souvent
conduit par d'autres et nécessitant une forte coopération
avec d'autres services de l'entreprise, dont les informaticiens
- données numériques téléchargées/copiées
: les problèmes :
- techniques de téléchargement : par document/manuel,
par bloc/automatisé et paramétré (aspirateurs)
- problèmes liés à l'application/interface
de recherche
- critères de sélection ou exhaustivité
- droits d'auteur, y compris dans les panoramas de presse et
les revues de sommaires
- conservation : privilégier les formats :
. pour l'information/les données : RTF, HTML (mais avec
très peu de codes), XML (l'idéal)
. pour le respect de la mise en page et des polices de caractère
(image du document d'origine) : TIFF ou PDF (débat sur
le PDF propriétaire)
. passer en base de données pour séparer le contenu/les
données du contenant.
- avantages et inconvénients :
- recherche performante et stockage économique de l'information
mais sur écran et demandant compétences informatiques
- c/ lourdeur, coûts, confort et habitude du papier
- compétences nécessaires au cyberdocumentaliste/cyberthécaire
: un gros minimum de connaissances et de pratique informatiques,
sauf si on dispose d'une équipe informatique de plusieurs
personnes ou d'une société de services et d'ingénierie
informatiques (SSII)
- comment attirer vers un intranet documentaire :
- le rendre utile, indispensable : enquête de besoins,
écouter les utilisateurs, créer un (des) comité(s)
intranet
- le rendre incontournable : ne pas ou ne plus assurer certaines
prestations sur papier
- le futur proche : le XML, concrètement : une nouvelle
norme qui va remplacer les normes de catalogage par les DTD
et schémas XML
- les interfaces HTML des logiciels documentaires/de bibliothèque
: beaucoup (pas encore tous) ont un module de publication et
d'interrogation des catalogues et bases documentaires au format
HTML (exemple : Ex-Libris de Cadic), on commence à passer,
surtout chez les logiciels "libres" (open source),
vers du tout HTML (exemples : Koha, logiciel de gestion de bibliothèque,
et les Content Management Systems (CMS) dont le français
Spip qui utilise le langage PHP)
4. La sécurité
sur Internet
- 4.1. Les enjeux
- sécurité des matériels, programmes et données
- sécurité des transactions électroniques
- importantes pertes de temps et d'argent
- la guerre et l'espionnage électroniques sont à prendre
au sérieux : Echelon, l'espionnage commercial, la veille
concurrentielle faite par les concurrents, les méga bases
de données sur les habitudes de consommation, 1800usearch,
Google Groups garde tous les messages échangés sur
les forums de discussion
- 4.2. Les procédures
à suivre
- règle de base : il ne peut y avoir de sécurité
absolue, il faut l'adapter à l'organisme, aux utilisateurs
et aux correspondants
- éviter au maximum de parler à l'extérieur
des affaires de l'organisme
- sélectionner les personnes à qui l'on donne ses
coordonnées : adresse, mais plus encore n° de téléphone
et de fax et adresse e-mail
- verrouiller l'accès à son PC en mettant un mot de
passe sur son économiseur d'écran
- sur Internet :
- navigateur web :
- vider quotidiennement le cache et les cookies
- durcir les réglages de sécurité (dans
Internet Explorer : Outils > Options Internet : onglet Sécurité
> Internet > Personnaliser le niveau + la fin de l'onglet
Avancées)
- passer par un hébergeur de messagerie ; exemples :
http://www.hotmail.com, http://www.caramail.fr, http://www.yahoo.fr
- ne pas donner son adresse e-mail officielle en cas de doute
- account (n° de compte), ID et mots de passe : quelques
précautions impératives
- firewall
Conclusion
- lucidité et rapidité, mais pas forcément comme
les autres au sein de l'entreprise l'entendent, organiser et penser
aussi au passé et au présent (conservation, archivage)
- lucidité sur l'Internet marchand
- lucidité sur l'avenir du métier :
- l'automatisation, pour gagner du temps afin de renforcer ...
- la spécialisation
- la création de valeur ajoutée
- la gestion de l'information
Notes
(1) Cinq
mille sociétés internet ont fermé ou changé
de main depuis 2000 / Estelle Dumout, ZDNet France, 20/03/2003
http://news.zdnet.fr/story/0,,t118-s2132222,00.html
© 2000-2004 Emmanuel Barthe. Tous droits réservés. Merci de me demander mon autorisation par e-mail pour toute reproduction ou diffusion autre que celle de l'adresse web (URL) et pour toute impression des pages web autre que pour une utilisation personnelle et privée. Pour plus de détails, lisez les informations
légales concernant ce site.
Site parrainé par GestionDeLaPaie.Com
: L'actualité
de la paye et du droit social par des gestionnaires
de paye et des contributeurs.
|