Les données sont en train de devenir la nouvelle devise du marché et les entreprises recherchent la meilleure manière de l’exploiter.
Une récente étude d’IDC révèle que le nombre de données générées est mutliplié par deux tous les ans. D’ici à 2020, il y aura 40 000 exa octets, ce qui équivaut à 40 trillions de giga octets. C’est plus de 5 200 giga octet par personne. Le problème reste de savoir quoi faire et comment avec ces données, et pour compliquer les choses la majorité de ces données proviennent de nouvelles sources telles que les appareils mobiles, réseaux sociaux et internet des objets.
L’impact seul des réseaux sociaux est important : twitter compte 400 million de tweets par jour, Facebook 4,75 milliards de contenus partagés. D’ailleurs ce dernier héberge actuellement 250 peta octets et en recoit 0,5 chaque jour.
Pour l’internet des objets, qui est une collection unique de différents objets, chacun d’entre eux génère ses propres données. Par exemple, les moteurs de nouvelle génération GEnx produits par General Electrics, que l’on trouve dans les avions Boeing 787 et 747-8, contiennent environ 5000 données analysées toutes les secondes. Selon une étude de Wipro research, un aller simple traversant les Etats Unis génère 240 tera octets de données et un moteur de Boeing 737 en génère 10 toutes les 30 minutes de vol.
Mais toutes les données ne sont pas égales. Les données entreprises sont par nature structurées mais les données provenant de ces nouvelles sources ne le sont pas. C’est un défi pour les entrepôts de données qui sont habitués à ne consommer et gérer que des données structurées. Et puis, la valeur de ces données ont une durée de vie limitée, ce qui fait se demander quelles données conserver et pour combien de temps. Par défaut, les entreprises aujourd’hui conservent simplement toutes les données, ce qui est couteux en hébergement. Cela conduit à entretenir des masses de données dont la valeur varie.
Après le stockage, il y a la corrélation de ces données. Leur valeur viendra de leur corrélation, plus on rapproche un volume conséquent plus l’information obtenue est intéressante. Comparer des données issues des réseaux sociaux, avec des données opérationnelles et des données de transaction fournit une information à grande valeur ajoutée. Mais cette corrélation implique de nombreux défis.
Et avec la progression continue de l’adoption d’appareils et de services, les consommateurs sont prêts à générer plus de données.
La déferlante de données est un défi, mais plein de promesses. Les informations que l’on peut potentiellement générer avec ces données représente de grandes opportunités à toutes les entreprises de tous secteurs, avec des perspectives allant de l’amélioration de la productivité jusqu’à sauver des vies.