Solocal
La principale problématique au sein de l’équipe Audiences Analytics est la diversité ainsi que le volume de données disponibles qui est incroyable. Il faut donc optimiser les requêtes SQL pour extraire l’information en s’assurant de récupérer les bonnes données qui permettront par la suite de construire les axes et les indicateurs requis pour les études.
Notre stratégie
En capitalisant sur les dernières études réalisées nous avons pu identifier les axes et indicateurs les plus couramment utilisés par les études afin de les isoler dans un datamart.
Ceci nous a permis de construire des premières requêtes et de tester le % de questions auxquelles nous pouvions répondre directement via ce datamart.
Nous avons par la suite amélioré avec l’usage en ajoutant de nouveaux indicateurs et de nouveaux axes dans notre datamart pour couvrir progressivement toutes les questions posées par les métiers dans le cadre de nos analyses sur le moteur de recherche.
Analyse de données
Dashboard
Machine learning
Qualité de données
Tableau Software
Power BI
Web analytics
SQL
Gestion de projet
SAS
Google Cloud Platform
Python
Nous pouvions nous appuyer sur la suite Google Cloud Platform pour l’ensemble de la problématique. Big Query nous servait à extraire les données et à les organiser dans un datamart. Google Data Studio nous permettait de restituer les indicateurs et les axes. Nous avons aussi utilisé SAS pour la partie de rédaction des requêtes avant déploiement en production dans Big Query.
Résultats
Réalisation d’analyses afin d’améliorer la pertinence du moteur de recherche et mesure de l’impact des modifications apportées au moteur (analyse d’A/B Testing).
Réalisation d’études sur les comportements des utilisateurs des sites web et applications mobiles du groupe.
Accompagnement des équipes métiers et techniques du groupe pour des éclairages et des recommandations sur les évolutions des indicateurs d’audience (Visites, Recherches de pros, affichages, clics), via des analyses ad’hoc, selon ces axes principalement: Source de trafic (Direct / SEO / Campagnes), Support (Fixe / Mobile / Tablettes), Verticale (Commerces, Services, BtoB, Habitat, Public).
Construction des analyses ad’hoc de suivi et pilotage de la performance : définition des meilleurs indicateurs d’analyses, exploration des données, diffusion et recommandation stratégique afin de faciliter la prise de décision des clients internes.
Recette de la migration Hadoop (Impala) dans le Cloud (GCP) et amélioration continue de la base de données pour répondre aux nouveaux besoins métiers (spécifications, recette…).
Construction d’outils d’analyse permettant la mise à disposition des datas aux métiers (Datamarts et Tableaux de Bord dans la suite Google Cloud Platform – Big Query et Datastudio).