Uncategorized

Et si on parlait Hadoop ?

21 août 2025

Je suis toujours en réflexion quant au contenu d’une distribution Hadoop.
Certes presque toutes les entreprises font du bigdata mais beaucoup se posent des questions sur les futurs coûts de licences et sur l’intérêt de ce cluster.
Je suis parti de l’idée que la stack devait être beaucoup plus ouverte et permette d’autres use cases.
La plateforme vient donc avec elastic search, janus (base graphe), dataiku en mode mono licence, mongodb, cassandra, druid, postgres, cassandra, mongodb, kafka…

.
Je souhaite fournir des datasets en provenance d’open data.