Restauration, backup & PRA/PCA

Méthode complète : de la définition RPO/RTO aux exercices de restauration documentés.


Principes fondamentaux

RPO — Recovery Point Objective

Quantité maximale de données qu’on accepte de perdre (exprimée en temps).

  • RPO = 24 h → on accepte de perdre au maximum 1 journée de données.
  • RPO = 1 h → sauvegardes au minimum toutes les heures.

RTO — Recovery Time Objective

Durée maximale acceptable pour restaurer un service après un incident.

  • RTO = 4 h → le service doit être opérationnel en moins de 4 heures.
  • RTO = 30 min → procédures de failover / restore rapides obligatoires.

PRA — Plan de Reprise d’Activité

Ensemble des procédures permettant de reprendre l’activité après un sinistre majeur.

PCA — Plan de Continuité d’Activité

Ensemble des mesures permettant de maintenir l’activité pendant un incident (résilience).


Stratégie 3-2-1

La règle de sauvegarde éprouvée :

RègleDescription
3 copiesLes données existent en 3 exemplaires minimum (production + 2 sauvegardes).
2 supportsLes sauvegardes sont sur au moins 2 supports différents (disque + NAS, disque + bande, disque + cloud).
1 copie hors siteAu moins 1 copie est stockée hors du site principal (datacenter distant, cloud chiffré, coffre physique).

Matrice RPO/RTO type (PME)

ServiceRPORTOStratégie
AD / DNS / DHCP4 h1 hBackup VM + snapshot quotidien
Serveur de fichiers1 h2 hBackup incrémental + snapshot
Application métier4 h4 hBackup VM + export base de données
Messagerie4 h2 hBackup VM ou cloud natif
Supervision / logs24 h8 hBackup config + données reconstruibles

Ces valeurs sont des exemples. Chaque client définit ses RPO/RTO selon ses contraintes métier.


Tests de restauration

Pourquoi tester ?

Une sauvegarde qui n’a jamais été testée n’est pas une sauvegarde.

Fréquence recommandée

Type de testFréquence
Test unitaire (1 fichier / 1 VM)Mensuel
Test de service complet (VM + données + applicatif)Trimestriel
Exercice PRA complet (reprise intégrale sur environnement isolé)Annuel

Journal de test

Chaque test de restauration produit un journal contenant :

## Journal de test de restauration
 
| Champ | Valeur |
|-------|--------|
| Date | YYYY-MM-DD |
| Service restauré | [nom du service] |
| Type de sauvegarde | Snapshot / Incrémental / Complet |
| Support source | PBS / NAS / Cloud |
| Durée de restauration | XX min |
| Résultat | ✅ Succès / ❌ Échec |
| Écarts constatés | [description] |
| Actions correctives | [description] |
| Responsable du test | [initiales] |

Scénarios types

Scénario 1 — Panne stockage

  • Impact : perte de VMs sur le stockage défaillant.
  • Réponse : restauration depuis PBS / NAS sur stockage sain.
  • KPI : RTO mesuré par test.

Scénario 2 — Erreur d’administration

  • Impact : suppression accidentelle d’une VM ou d’une GPO.
  • Réponse : restauration depuis snapshot ou backup récent.
  • KPI : RPO (âge du dernier snapshot).

Scénario 3 — Ransomware (niveau conceptuel)

  • Impact : chiffrement des données accessibles.
  • Réponse : isolation du réseau, restauration depuis backup hors ligne / hors site.
  • Pré-requis : backup non accessible depuis le réseau compromis (air gap logique ou physique).
  • KPI : RTO + vérification intégrité des backups.

Note : ce scénario est traité au niveau conceptuel. Aucun détail d’exploitation ou de technique offensive n’est publié.


Références