Collecte et analyse de données web en temps réel

Hadoop, ElasticSearch, stockage haute performance, le Cloud au service de ma Business Intelligence

Le contexte

Belogik est une solution logicielle en mode SaaS permettant de collecter, de fouiller et d’analyser n’importe quelles données machines issues du web en temps réel.
La solution s’appuie sur la technologie Elastic Search et le language Python. L’ensemble du logiciel est pensé pour employer les API Amazon.

La problématique

Le logiciel Belogik requiert une grande quantité de ressources afin de centraliser et d’analyser l’ensemble de lignes de logs collectées sur les SI des clients. L’analyse en temps réel des flux de données nécessite la mise en œuvre d’une plateforme de calcul capable de s’adapter automatiquement à l’activité non prédictible des clients (buzz, évènementiel…).
L’autre problématique de cette activité est liée au stockage : la volumétrie, augmentant de manière exponentielle, et le besoin de performances (I/O) liés à l’activité temps réel sont conséquents.
L’investissement de départ nécessaire au montage de la plateforme en fond propre n’entrait pas dans le business model de Belogik.

La réponse Outscale

A l’origine, le logiciel Belogik a été développé sur la plateforme Amazon Web Services. Pour des questions de propriété de données, la société Belogik a souhaité localiser ses données en France.

La migration a été facilitée par d’une part la disponibilité d’APIs compatibles AWS chez Outscale et d’autre part, par une tarification similaire.

Capacités fournies

  • 50 Cœurs,
  • 200 Go de RAM,
  • 15 To de données hautes performances NetApp

 

badge-xeon-vert

Découvrez comment les technologies Intel® accélèrent le Big Data : intel.fr/bigdata
Plus d’informations sur intel.com/xeone5