Logiciels, Internet, moteurs de recherche

Dernier ajout : 5 février.

Derniers articles

BA de fin d’année de l’ARCEP et 60 Millions de consommateurs ...

La liste des annuaires téléphoniques du web à éviter

... ou croche-patte aux petits acteurs d’une web industrie en croissance ?

Jeudi 10 octobre 2013

Lire la suite »

60 Millions de consommateurs vient de publier début octobre une "liste des annuaires téléphoniques du web à éviter".

Ces sites indiquent un numéro surtaxé qui assure la mise en relation, au prix fort et alors que l’on peut trouver le véritable numéro gratuitement ailleurs (comme sur pagesjaunes.fr ou sur le site web de la personne). Le tout à l’insu de la personne/société qui possède ce numéro de téléphone.

Or, depuis le 1er juillet 2013, l’Autorité de régulation des communications électroniques et des postes (ARCEP) interdit d’affecter un numéro surtaxé « à une personne physique ou morale […] sans avoir recueilli, préalablement et de manière explicite […] son consentement pour être jointe par un tel numéro » [1].

Plus de détails : http://www.60millions-mag.com/actua...

On peut regretter de voir dépenser de l’argent pour des coordonnées disponibles ailleurs mais le web entrepreneur, consultant et homme politique Arnaud Dassier, dans les commentaires sous la liste de 60 MdC, explique non sans une certaine pertinence que :

  • « il y a une information écrite sous les numéros, écrite en gros, les numéros affichés sont des 08 (donc clairement pas des numéros directs), et un message vocal préalable à la mise en relation avertit clairement les gens que le numéro est surtaxé »
  • « les annuaires internet avec numéros surtaxés rencontrent un véritable succès depuis 2 ans. Leur trafic augmente »
  • le débat s’apparente à celui de l’opt-in/opt-out pour l’e-mail. En effet, imposer l’opt-in impose un coût de collecte beaucoup plus important aux annuaires, sociétés et marketeurs, ce qui entrave leur activité ... et favorise des concurrents étrangers. Là où son discours contient aussi du vrai, c’est quand il explique qu’un annuaire, un référencement a un coût (collecte, base de données, entretien du site) et qu’il faut bien que quelqu’un paie ce coût : le professionnel référencé ou bien le particulier qui cherche des coordonnées.

Ce qu’il ne dit pas, en revanche [2], c’est que :

  • ce fameux coût peut aussi être payé indirectement : par les publicités placées sur les annuaires téléphoniques (mais ils ne sont pas assez connus pour que les gens y aillent directement) ou les moteurs de recherche du web
  • il n’y a pas énormément de créativité ni de valeur ajoutée dans les annuaires de n° surtavés
  • des numéros de téléphone sont collectés contre la volonté de leurs titulaires
  • ces nouveaux annuaires à numéros surtaxés jouent beaucoup sur leur référencement par ce même Google qu’il redoutent comme concurrent dans sa version Google Map ...
  • les moteurs de recherche (gratuits) du Web gratuit peuvent aussi parfaitement faire ce travail de recherche à partir du moment où la personne recherchée à une quelconque page web. Mais dans ce cas, le marché échappe à ces nouveaux annuaires téléphoniques et retombe dans les mains de Pages Jaunes et Google ...

En somme, la décision de l’ARCEP favoriserait les gros acteurs du marché et c’est ce que dénonce également Arnaud Dassier.


Chercheurs, voici votre liste d’outils numériques !

Mercredi 25 septembre 2013

Lire la suite »

Elle a posé sur Twitter la question suivante : « Amis en SHS, quels sont les 3 outils numériques que vous pensez incontournables dans votre travail ? C’est pour dire à mes étudiants. »

squintar a reçu 11 réponses et les a classées sur son blog Penser/Classer pour donner ce que je qualifierais de liste idéale d’outils numériques gratuits pour les chercheurs universitaires : Quels outils numériques pour les SHS ?.

Court et remarquable.

J’aimerais reprendre ici certains des outils cités et leur présentation par squintar :

  • « Pour gérer/annoter/partager sa bibliographique :
    • Zotero, grand champion de cette consultation
  • Pour faire sa recherche bibliographique :
    • Jstor "a digital library of academic journals, books, and primary sources"
    • Gallica
    • Google Book
    • Cairn "Revues de sciences humaines et sociales en texte intégral"
    • Isidore "Accès aux données et services numériques de SHS"
    • Archive.org
    • Revues.org
    • Persée
    • Sudoc
  • Pour l’archivage :
    • HAL-SHS
  • Pour des activités non spécifiques des chercheurs
  • Prendre des notes :
    • Evernote "pour gérer mes lectures, notes en conf, notes en réunion et tout classer avec des tags"
  • Pour visualiser un réseau :
    • Gephi " interactive visualization and exploration platform for all kinds of networks and complex systems, dynamic and hierarchical graphs. Libre et gratuit
  • Pour faire de l’analyse de texte et plus encore :
    • Iramuteq : "Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires" ».


Avocats, documentalistes, attention à la confidentialité de vos recherches en ligne

Réduire la surveillance sur ses recherches et sa navigation, se débarrasser des publicités

Jeudi 25 juillet 2013

Lire la suite »

L’éthique professionnelle des documentalistes et des avocats les conduit à protéger la confidentialité de leurs recherches.

Voici donc quelques remarques sur les risques de la recherche en ligne à cet égard et des solutions.

Des risques non négligeables

Rappelons d’abord que tout site web — et donc tout moteur de recherche — sur lequel vous allez reçoit automatiquement l’adresse IP de votre ordinateur. Et la plupart des sites [3] conservent cette donnée, associée à vos mots-clés de recherche, les résultats de recherche et les pages cliqués etc. [4] Or, un simple "IP resolver" (communément et gratuitement disponible sur le Web) permet de traduire cette adresse IP dans le nom de domaine de votre entreprise [5].

De plus, des grands de l’Internet comme Google et Facebook (FB) ont, de par leurs publicités ou leurs boutons Like ou Google+, par votre connexion permanente à votre compte FB ou GG ou encore par le navigateur Chrome, la possibilité de connaître en détail votre consultation quotidienne d’Internet. Il suffit pour s’en convaincre de lire les déclarations de confidentialité, par exemple, de Bing, le moteur de Microsoft, des services Google (incluant son moteur de recherche) [6] et de Chrome.

Pour donner un exemple très concret des risques induits par la conservation des logs et adresses IP par la très grande majorité des moteurs de recherche, voici l’affaire de la "AOL users database", mise en avant par Ixquick. Fin juillet 2006, le département de recherche d’AOL, un des rares fournisseurs d’accès Internet historiques encore actif, a rendu public, pour paraît-il la communauté des chercheurs universitaires, les recherches de 658 000 de ses abonnés effectuées entre mars et mai 2006.

Sans leur demander quoi que ce soit. Mais sans leur nom.

Alors, où est le problème, direz vous ? Eh bien, plusieurs recoupements ... et le tour peut être joué : vous êtes identifié, vous, vos sujets de recherche, vos petites manies, vos goûts. Vos turpitudes aussi. Voyez l’exemple réussi par le New York Times (lien infra) : ils ont identifié sans peine (oui, facilement) une veuve de 62 ans par ses recherches.

« Le problème, comme l’explique Michael Arrington de l’excellent, très respecté et très lu blog IT TechCrunch, c’est que beaucoup de gens [identifiés ici à travers toute la base d’AOL par un numéro ...] font souvent des recherches sur leur propre nom, ou ceux de leur amis et famille, pour voir l’information disponible sur eux sur le Net. Combinez ces recherches à fort coefficient d’égo avec des requêtes pornographiques et bonjour la gêne. Combinez les avec une adresse ou un n° de sécurité sociale etc. et vous avez un vol d’identité en ligne qui n’attend que d’être commis. »

La base en question a été copiée, avant le retrait par AOL des données, par deux étudiants en informatique de l’Université de Pennsylvanie, sur AOL Search Database [7].

Autre scandale qui éclate en 2013, et qui lui aurait tendance à faire penser qu’il est inutile de prendre des précautions : Prism. En effet, Prism comprend un programme de cassage des chiffrements (Bullrun) et la création lors de leur élaboration de "backdoors" dans les logiciels, les programmes de cryptages (les backdoors ne sont pas installées, mais préexistent dans le logiciel, soit exprès, soit par l’exploitation d’une faille) et les matériels de communication américains [8]. NB : Prism est légal aux Etats-Unis.

Enfin, un système d’écoute français de l’Internet existe aussi [9].

Disons que les précautions décrites ci-dessous réduisent tout de même fortement les risques d’interception et de perte de confidentialité. Et que, une fois ces mesures prises, la perte de confidentialité ne peut plus être imputée au juriste.

Des solutions techniques

Faire ses recherches sur le Web en toute confidentialité, Le Monde 10 janvier 2008 : cet article cite Ixquick, un métamoteur qui ne garde aucune donnée (ni adresse IP, ni rien), en même temps qu’un bon métamoteur côté pertinence [10]. A noter qu’Ixquick n’est pas une société américaine : elle est la propriété d’une société néerlandaise, Surfboard Holding BV. Voir aussi la page montée par Ixquick sur les moteurs de recherche et la vie privée, elle en vaut le coup.

Ixquick n’a qu’un défaut à mes yeux : ne pas interroger Google.

Heureusement, ils sont allés plus loin en montant Startpage, un moteur qui utilise Google sans, selon eux, transmettre ni garder la moindre trace.

A part Ixquick et Startpage, il existe aussi des "proxies de moteurs recherche", qui masquent vos identifiants au moteur interrogé. En voici un : Black Box Search, signalé notamment par un anonymiseur de navigation sur le Web et réalisé par un développeur américain, Nemanja Stefanovic.

Il existe aussi des "anomymizers" : des anomymiseurs de navigation. Black Box Search est aussi un anomymiseur gratuit de navigation pour Firefox : installez d’abord GreaseMonkey — un add-on pour Firefox — puis ce script. Dès lors, votre navigation sur le Web passera par l’intermédiaire du proxy Black Box Search : les sites visités ne verront pas votre ordinateur passer chez eux mais celui de Black Box Search. Il permet d’interroger les trois meilleurs moteurs actuels : Google, Yahoo et LiveSearch de Microsoft. Un conseil : mettez le dans vos favoris et menez vos recherches "sensibles" sur le Web uniquement par lui ou Ixquick/Startpage. Cela dit, primo il faut faire confiance à l’anonymiseur (qui peut aussi être l’objet de pressions du FBI et de la NSA) ... et secundo, l’inconvénient de passer par un site "anonymizer", c’est que beaucoup sont payants et que cela ralentit plus ou moins le débit.

Sinon, utilisez la fonction navigation privée de votre navigateur. Cela semble peu pratique tant nous sommes habitués maintenant au en ligne sans restrictions. Mais imaginez que vous travailliez sur un projet de concentration ... Ca revient au même que d’effacer tout votre historique et vos cookies avant la recherche sensible mais c’est plus simple et plus pratique [11].

In fine, le risque le plus faible consiste à rester sur votre réseau d’entreprise — y compris chez vous, donc passer le poste de travail Citrix et le VPN(réseau privé crypté) [12] de l’entreprise au lieu de travailler sur sa messagerie Gmail, YahooMail ou Hotmail (ce qui est pourtant tellement plus pratique, n’est ce pas) — et de faire des recherches uniquement sur papier ou sur cédérom. Rappelons que nos fournisseurs en ligne n’ont bien souvent pas de CGU garantissant la confidentialité de nos recherches chez eux.

Pour se débarrasser des publicités

Utilisez les add-on suivants pour votre navigateur (vous pouvez les installer tous les deux sans problème) pour empêcher l’envoi d’informations de votre navigateur vers les régies publicitaires Internet :

Ces deux modules, recommandés par les spécialistes du "privacy", sont simples à utiliser et en ce qui concerne Ghostery, il est même patronné par l’industrie de la publicité Internet [13].

Et n’oubliez pas que les add-ons/apps et autres petits logiciels ajoutés à votre navigateur ont des collectes de données et des politiques de confidentialité distinctes des grands de l’Internet [14]. Les propres déclarations de confidentialité des cinq grands rappellent d’ailleurs qu’ils ne sont en rien responsables de ce que font les applications tierces. Un des moyens de bloquer l’envoi d’informations vers ces tiers est d’utiliser les bloqueurs de publicité cités infra.

Pour aller au fond des choses :

  • lire notre billet Garder ses communications Internet en dehors des grandes oreilles, surtout ses commentaires
  • Pourquoi AOL, Google, MSN et Yahoo intègrent messageries instantanées, téléphonie internet et moteurs de recherche — Un commentaire de John Battelle / Francis Pisani, sur son blog Transnets 13 septembre 2005
  • The Database of Intentions / John Battelle (journaliste américain fondateur de Wired et décrypteur des stratégies des grands acteurs du Web, particulièrement les moteurs de recherche), sur son blog BattelleMedia 13 novembre 2003
  • Google Now : the tip of a very long spear / John Battelle, 9 octobre 2013. Le but de Google Now — qui n’est pas un produit mais une fonctionnalité de "recherche prédictive" — est de deviner par géolocalisation et connexion permanente à aux produits de Google, ce qu’on va chercher dans les minutes à venir et l’afficher. Selon John Battelle, quand GG Now aura le don d’ubiquité, les questions d’accès et traitement équitable des acteurs, qui se sont posées lors de la création par Google de la recherche universelle, vont se reposer. En clair : GG Now devrait pousser encore plus les internautes à "rester chez Google" (privatisation de facto du Web). Et il devrait fortement impacter, voire éradiquer, quantité de sites concurrents mais n’appartenant pas au même groupe et non intégrés, eux. Et Battelle ne ne parle pas des enjeux de confidentialité/données personnelles ("privacy" en anglais) qui augmenteront de toute évidence avec GG Now.

Emmanuel Barthe
documentaliste juridique


Pages 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ...

Dernières brèves