the Next Step ?

big data

Le monde des statistiques

C’est une banalité, le monde des statistiques est en pleine révolution. Les bases de données explosent. Du point de vue algorithmique, des techniques toujours plus sophistiquées nécessitent des ordinateurs de plus en plus puissants pour des temps de calcul de plus en plus longs.

Les logiciels statistiques

Pour faire face à cette évolution, on trouve dans le monde des statistiques deux types de logiciels :

  • Les logiciels métiers (R, SAS, SPSS), généralement conçus par et pour les statisticiens, sont proches des besoins des utilisateurs. Raisonnablement simples d’accès, ils proposent un grand nombre d’outils. Malheureusement, leurs performances ne sont pas toujours optimales.
  • A l’inverse, les logiciels conçus par des informaticiens (Oracle, module statistique pour C, …) ont de très bonnes performances. Ils utilisent les méthodes informatiques de pointe comme les bibliothèques de gestion du parallélisme. Mais ils ne proposent qu’une petite fraction des méthodes utilisées par les statisticiens. De plus, ils nécessitent de sérieuses compétences en programmation.

Les utilisateurs

Point important, les utilisateurs des logiciels statistiques ne sont pas des informaticiens. Certes, les ingénieurs en statistiques ont de bonnes connaissances en informatique. Mais la communauté est également composée de médecins, de psychologues, de sociologues, d’historien, de linguistes… Pour tous ces utilisateurs, les logiciels statistiques sont des outils qu’ils utilisent de temps en temps et qui doivent rester le plus simples possible.

Le projet

R++, the Next Step est un projet de développement d’un logiciel statistique permettant de concilier les différents points que nous venons de présenter :

  • R++, the Next Step est résolument orienté haute performance. Il s’appuie sur les dernières avancées aussi bien dans le champ des Big Data, du parallélisme que de l’IHM.
  • Mais il a aussi pour vocation de rester un logiciel métier, proche des besoins des utilisateurs, conforme à ce que les non-informaticiens ont l’habitude d’utiliser.

R++, theNext Step est clairement un projet ambitieux. Pour le mener à bien, trois équipes de chercheurs collaborent selon quatre axes de recherche

A suivre : Les axes de recherches