Selon SalesCycle, le trafic en magasin du Black Friday et du Cyber Monday affiche une augmentation de 38 % . Les entreprises doivent préparer leur infrastructure pour les jours de pointe, car même quelques minutes d'arrêt peuvent leur coûter des milliers de dollars. Au cours des dernières années, de nombreuses grandes marques, dont Walmart, J. Crew, Lowe's et GAME , ont perdu beaucoup d'argent et ont brisé la confiance de leurs clients parce que leurs équipes n'étaient pas prêtes pour le Black Friday. Pour en revenir à l'augmentation de 38 %, un tel changement exige une attention constante au service fourni et à son évolutivité afin que les entreprises puissent suivre le flux des commandes, maximiser l'expérience des clients et minimiser leurs commentaires négatifs.
Flowwow, un marché mondial de marques locales et d'entreprises florales, a ses propres 3 à 4 jours de pointe (Saint-Valentin, Fête des Mères) lorsque le trafic est multiplié par 30. Notre équipe informatique a développé un système flexible qui permet de faire évoluer le service, de le gérer et de le terminer une fois la journée de pointe terminée.
Dans cet article, je partage cinq conseils qui vous aideront à préparer votre service à une évolution massive – et à éviter les erreurs courantes sur les plateformes de commerce électronique.
Avant toute action, élaborer et mettre en œuvre un plan de mise à l'échelle détaillé, divisé en plusieurs étapes : 1 mois avant un jour de pointe, 2 semaines avant un jour de pointe, 3-4 jours avant un jour de pointe et 1 jour avant un jour de pointe avec un liste d'actions pour les équipes. À chaque étape, il est important que les spécialistes désignés comprennent comment effectuer chaque tâche et résoudre tout problème potentiel. Ces équipes sont généralement composées d'une équipe DevOps et de développeurs backend.
Chaque année, le nombre total de commandes augmente – ce n'est pas surprenant, c'est pourquoi il est essentiel de prévoir le volume du trafic et de s'y préparer. Les données historiques et la collaboration interfonctionnelle avec l'équipe marketing sont des éléments essentiels pour une prédiction précise. Ils aident à comprendre lesquels des composants du système peuvent croître, puis à décider du nombre de serveurs et de leur capacité.
Une fois que vous avez évalué les chiffres attendus, mettez 2X dans la prévision. Si vous prévoyez une croissance de 30 fois, définissez la tâche pour qu'elle soit prête à une augmentation de 60 fois. Cette approche vous permet une préparation supplémentaire aux défis inattendus. Si vous disposez d'une mise à l'échelle du cloud, vous disposez des outils nécessaires pour augmenter considérablement la capacité en peu de temps, puis la réduire à des indicateurs réguliers si nécessaire.
Effectuez une analyse de découverte de l'infrastructure, basée sur les paramètres de base : cartographiez les serveurs, leur taille actuelle, leurs composants, projets et applications. Comprendre les paramètres de base facilite l'extrapolation : vous prédisez la croissance et calculez des scénarios potentiels au cas où elle serait effectivement 60X.
Appliquez la règle 30X à toutes les erreurs. Si vous trouvez une erreur, demandez-vous : « Si cette erreur commence à apparaître 30 fois plus souvent, est-ce que cela nous posera un problème ? Si une erreur sur le trafic 30X mérite d'être corrigée maintenant, commencez à y travailler.
Lorsque votre équipe de développement n'est pas assez nombreuse, il y a de fortes chances que la liste de tâches de chacun soit pleine à craquer. Il est donc nécessaire de constituer une équipe de développement interne distincte, qui se concentrera exclusivement sur la période de pointe : cette équipe doit être libérée des autres demandes commerciales et s'occuper uniquement des tâches d'optimisation. Le principe de Pareto fonctionne bien ici : optimiser 20 % des goulots d'étranglement signifie résoudre 80 % des problèmes de performances dans le code et la base de données.
N'oubliez pas d'annoncer un gel des fonctionnalités (une période pendant laquelle votre équipe n'ajoutera pas de nouvelles fonctionnalités) et de le rappeler à l'équipe, de préférence un mois à l'avance. Nous n'autorisons pas d'apporter des modifications au code ou à la base de données pendant cette période car, lorsque des modifications sont apportées, l'ensemble du système peut tomber et le coût de cette erreur augmente alors de 30 fois.
Les goulots d'étranglement montrent les mécanismes que vous devez optimiser dans votre infrastructure actuelle. Nous divisons les composants actuels du système en différents domaines et les surveillons séparément. Cela nous permet d'évaluer les performances de chaque serveur et de comprendre quels composants nécessitent plus de ressources de notre part – cette approche nous aide à planifier nos ressources de manière flexible. Utilisez un système de surveillance avancé, capable d'évaluer les performances de chaque composant en temps réel, et d'agréger les journaux pour détecter toutes les erreurs (afin de pouvoir les corriger plus tard).
Le principe de Pareto fonctionne bien ici : optimiser 20 % des goulots d'étranglement signifie résoudre 80 % des problèmes de performances dans le code et la base de données.
Effectuez des tests de résistance à l'avance, en essayant d'imiter le comportement de votre client potentiel. Commencez par simuler la charge de l'infrastructure, par exemple 10 fois plus que d'habitude. Sur la base des données obtenues, nous comprenons quels domaines nécessitent une optimisation. Il existe des outils spéciaux qui vous permettent de prendre une heure de charge et de la jouer 10 fois plus vite pour évaluer et confirmer si le système peut résister à un certain niveau de pression.
Pendant les périodes de pointe, nous planifions méticuleusement la charge de travail de chaque membre de l'équipe, en attribuant les rôles clés et en répartissant les responsabilités. Nous nous soucions de nos employés et c'est pourquoi nous veillons à ce que chacun dorme suffisamment. Cependant, nous nous efforçons également de couvrir le maximum de fuseaux horaires. À chaque étape, nous nommons un responsable de processus qui surveille ce qui se passe au moment le plus critique. C'est cette personne qui informe l'équipe si l'un des composants du système approche la limite de performance (80 %).
Alors que nous travaillons à distance, lorsque le jour X arrive, il est crucial que toute l'équipe reste en contact non seulement via des messageries professionnelles comme Slack, mais également via des canaux de communication d'urgence, tels que Telegram et un téléphone personnel.
Les jours de pointe comme le Black Friday, le Cyber Monday et Noël sont des phases actives pour lesquelles vous devez être prêt. Plus de trafic signifie plus de valeur pour votre entreprise. Cela se traduit généralement par une augmentation des revenus. C'est pourquoi n'hésitez pas à investir dans du développement, à adhérer aux principes internationaux et à mettre en œuvre des services modernes. Gardez un œil sur les nouvelles solutions qui répondent aux besoins actuels de votre entreprise et évoluez en fonction des avantages de votre service !