Web social

…Ressources illimitées…

Accès à l’information

le 18 décembre 2012

L’ère technologique dans laquelle nous évoluons en est une marquée par la quantité d’informations impressionnante à laquelle nous avons accès. L’expression « drinking from a hose » est représentative puisque nous sommes plus que comblés en terme de quantité d’information disponible.

Il y a bien sûr deux côtés à la médaille puisque cette abondance d’information implique toutefois un travail considérable afin d’en extirper la portion qui s’avère pertinente à notre véritable recherche.

La fouille de textes, ou text mining selon Wiki, est l’action de rechercher du contenu intéressant à travers une quantité d’informations non structurées, comme le texte apparaissant sur un page Web. Cette extraction de connaissances fait partie du domaine de l’intelligence artificielle. Certains algorithmes très puissants permettent de balayer le Web en des temps record et permettent ainsi à l’humain de lui générer des résultats que lui-même n’aurait peut-être pas pu obtenir en l’espace d’une vie entière de recherche…

Si seulement tout le texte disponible était bel et bien pertinent, ce serait déjà plus facile. Hélas, quoique les moteurs de recherche soient rendus très puissants, ceux-ci peuvent être redirigés vers des liens dont la pertinence est douteuse. Certains individus ont même la passion ou un gagne-pain relié à la mission de détourner la recherche vers de fausses pages intéressantes. Cette compétition ajoute de nombreux résultats de recherche inutiles au nombre déjà assez phénoménal que nous génère notre fameux Google.

De nombreuses informations résident dans la long trail. Je persiste à croire que ce phénomène est très présent aussi dans les résultats de Google et que cela aura tendance à s’accentuer. Voici un graphique symbolisant l’importance du rang généré par Google :

traffic-by-grank
Tandis que la quantité de stockage sera quasiment infinie dans dix ans, il en est tout autrement pour le temps d’accès et la vitesse de lecture. On peut poser l’hypothèse qu’il sera de plus en plus difficile voire impossible de générer des résultats de recherche assurément pertinents. Il faudra peut-être se munir de nouveaux moteurs de recherche offrant des services plus efficaces mais désormais payants.

Cette situation poserait un grave problème en technologie de l’information puisqu’il ne serait plus possible d’accéder aussi facilement à une multitude d’informations par le biais d’Internet. Il est tellement rendu normal de vivre cette facilité d’accès à du contenu de qualité via Internet que l’on pourrait avoir de la difficulté à s’adapter. Prenons par exemple le projet Gutenberg et d’autres services comme Wikipédia offrant de l’information gratuite aux gens.

D’autant plus que certains pays plus démunis en viendront à accroître leur nombre d’internautes. Il faut donc réfléchir à tous ceux qui auront bientôt accès à Internet et qui prendront goût à partager des données via des blogues, forums, etc. Ils participeront eux aussi à alimenter ces gigantesques sources de données évoluant sur le Web. Il est intéressant de songer à la possibilité d’accéder à un tel partage mondial effervescent et à telle une diffusion de l’information mais encore faut-il parvenir à trouver ce que l’on cherche.

Étant donné que la quantité de stockage sera presque infinie, le nombre de serveurs remplis d’informations se multiplieront aussi. Il en va autrement du temps d’accès à toute cette mer de données. Le temps d’accès et de lecture n’augmentera pas au même rythme exponentiel que l’espace pour stocker ces mêmes données. Il sera donc encore plus long et fastidieux de balayer toute cette montagne d’informations.

Il sera non seulement dur de s’adapter aux efforts supplémentaires pour dénicher de l’information de qualité mais il y aura aussi d’autres répercussions. La compétition deviendra probablement encore plus tenace entre les différents concepteurs de moteurs de recherche. Il y a déjà beaucoup de controverse sur les méthodes employées par les différents engins de recherche Web et il est possible que cela s’accentue.

Une autre des conséquences majeures sera que les compagnies devront débourser davantage d’argent pour entretenir le référencement de leur site web. Toute compagnie désirant avoir un minimum de visibilité sur le Web doit s’attarder à sa position dans les résultats des moteurs de recherche. Certaines d’entre elles déboursent des montants d’argent ahurissants pour être classées dans les premiers rangs alors osez imaginer dans quelques années… ou osez imaginer l’accès à ces services se restreignant davantage pour les petites et moyennes entreprises…

Advertisements

Laisser un commentaire

Entrer les renseignements ci-dessous ou cliquer sur une icône pour ouvrir une session :

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l’aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment ce contenu :