Preuve A2 — PRA/PCA minimal : RPO/RTO + 3-2-1 + exercices de restauration

Résumé exécutif (1 min) : Un environnement PME lab sans plan de reprise formalisé. Après cadrage, la stratégie 3-2-1 est implémentée avec des RPO/RTO définis par service. Trois scénarios de sinistre sont testés (panne stockage, erreur admin, ransomware conceptuel). Le test de restauration complet est réussi en 22 minutes, documenté dans un journal de preuve. Le PRA minimal est livré avec runbooks et planning d’exercices trimestriels.


Contexte

  • Type de structure : PME type (lab Proxmox simulant 3-5 services critiques).
  • Problème initial : sauvegardes “en place” mais jamais testées, aucun RPO/RTO défini, pas de procédure de reprise.
  • Objectifs mesurables :
    • Définir RPO/RTO pour chaque service critique.
    • Implémenter la stratégie 3-2-1.
    • Réaliser au moins 3 tests de restauration documentés.
    • Documenter un PRA minimal exploitable.

Architecture de sauvegarde

flowchart TB
    subgraph "Production"
        VM1[APP01 — Service métier]
        VM2[APP02 — Fichiers]
        VM3[DC01 — AD/DNS]
    end
    subgraph "Copie 1 — Stockage local"
        SNAP[Snapshots planifiés]
    end
    subgraph "Copie 2 — PBS"
        PBS[Proxmox Backup Server]
    end
    subgraph "Copie 3 — Hors site"
        OFFSITE[Stockage distant chiffré]
    end

    VM1 --> SNAP
    VM2 --> SNAP
    VM3 --> SNAP
    VM1 --> PBS
    VM2 --> PBS
    VM3 --> PBS
    PBS --> OFFSITE

Schéma anonymisé — TODO


Matrice RPO/RTO

ServiceRPORTOStratégieFréquence backup
DC01 — AD/DNS4 h1 hSnapshot + PBS quotidienToutes les 4 h
APP01 — Service métier4 h30 minSnapshot + PBS quotidienToutes les 4 h
APP02 — Fichiers1 h2 hSnapshot horaire + PBSToutes les heures

Valeurs lab — à adapter au contexte réel du client.


Scénarios testés

Scénario 1 — Panne stockage

  • Simulation : désactivation du stockage principal d’une VM.
  • Réponse : restauration depuis PBS sur stockage alternatif.
  • Résultat : VM opérationnelle en 18 minutes.
  • Journal : consigné (voir section journal ci-dessous).

Scénario 2 — Erreur d’administration

  • Simulation : suppression accidentelle d’une VM.
  • Réponse : restauration depuis le dernier snapshot.
  • Résultat : VM restaurée en 8 minutes (snapshot récent).
  • Journal : consigné.

Scénario 3 — Ransomware (niveau conceptuel)

  • Simulation conceptuelle : les VMs de production sont considérées comme compromises.
  • Réponse : isolation réseau, restauration depuis backup hors ligne (PBS sur réseau backup isolé).
  • Résultat : restauration complète (3 VMs) en 45 minutes sur réseau isolé.
  • Note : aucun ransomware réel n’est utilisé. Le scénario teste la procédure de reprise, pas l’attaque.

Journal de test de restauration (extrait)

DateService restauréType backupSupportDuréeRésultatÉcarts
2025-XX-XXAPP01SnapshotProxmox local8 min✅ SuccèsAucun
2025-XX-XXAPP01Backup completPBS18 min✅ SuccèsAucun
2025-XX-XXAPP02Backup completPBS22 min✅ SuccèsAucun
2025-XX-XX3 VMsBackup completPBS (isolé)45 min✅ SuccèsOrdre de démarrage à documenter

Dates anonymisées — environnement lab.


Méthode de test

  1. Planification : choisir le service, le point de sauvegarde, le réseau de test.
  2. Isolation : restaurer sur un réseau isolé (pas en production).
  3. Restauration : lancer le restore, chronométrer.
  4. Vérification : démarrage VM, connectivité réseau, service applicatif fonctionnel.
  5. Journal : consigner tous les détails (durée, résultat, écarts, actions correctives).
  6. Nettoyage : supprimer la VM de test.

Contrôles appliqués

ContrôleRéférenceStatut
Stratégie 3-2-1ANSSI Hygiène — R36, R37✅ Appliqué
RPO/RTO définis par serviceBonne pratique PRA✅ Appliqué
Test de restauration documentéANSSI Hygiène — R37✅ Appliqué
Backup isolé du réseau de productionANSSI — séparation réseau✅ Appliqué
Journalisation des testsCNIL — traçabilité✅ Appliqué

Résultats / KPIs

KPIAvantAprèsObjectif
RPO définiNonOui (par service)
RTO mesuréJamais testé8-45 min selon scénario≤ objectif par service
Tests de restauration documentés04≥ 3
Couverture sauvegarde 3-2-1Partielle100 % services critiques100 %

Valeurs issues d’un environnement lab — exemple lab.


Backlog de remédiation (extrait)

#ActionPrioritéStatut
1Définir RPO/RTO par serviceHaute✅ Fait
2Implémenter 3-2-1 (PBS + hors site)Haute✅ Fait
3Tester 3 scénarios de restaurationHaute✅ Fait
4Documenter le PRA minimalHaute✅ Fait
5Automatiser les tests de restore (script)Moyenne⏳ Planifié
6Planifier exercices trimestrielsMoyenne⏳ Planifié
7Chiffrer les sauvegardes hors siteMoyenne📋 Backlog
8Tester la reprise complète (toutes VMs) en conditions réellesBasse📋 Backlog

Runbooks (extraits)

Runbook : Exercice de restauration trimestriel

  1. Planification : choisir 1 service critique au hasard, notifier les parties prenantes.
  2. Exécution : suivre la procédure de test (isolation, restore, vérification, journal).
  3. Analyse : comparer la durée au RTO cible. Identifier les écarts.
  4. Actions correctives : si RTO dépassé, identifier la cause et planifier la correction.
  5. Archivage : ajouter le journal au dossier PRA.

Tâches LAB (à réaliser sur Proxmox)

  • Mettre en place PBS (Proxmox Backup Server) sur un réseau dédié backup.
  • Configurer la planification des sauvegardes (snapshot + PBS) pour 3 VMs.
  • Configurer la rétention (ex : 7 quotidiens, 4 hebdomadaires, 3 mensuels).
  • Exécuter un exercice de restauration pour chaque scénario (panne, erreur, “ransomware”).
  • Consigner les résultats dans le journal de test.
  • Documenter la procédure de reprise (PRA minimal).

Captures à produire (à anonymiser)

  • Planning backup : vue PBS montrant la planification (floutée) → A2_backup_planning.png
  • Log restore test : journal d’un test de restauration (anonymisé) → A2_restore_log.png
  • Tableau RPO/RTO : matrice complétée (peut être en Markdown, pas de capture nécessaire).

Emplacements prévus :

  • ../annexes/images/TODO_A2_backup_planning.png
  • ../annexes/images/TODO_A2_restore_log.png

Anonymisation appliquée

  • Tokens de remplacement utilisés (voir tableau)
  • Captures floutées + cartouche ajouté
  • Métadonnées EXIF supprimées
  • Grep inverse effectué (aucun résultat)
  • Vérification visuelle effectuée
  • Nommage standard respecté

Références


À faire (humain)

  • Exécuter les tâches LAB (section “Tâches LAB” ci-dessus)
  • Produire les captures (section “Captures à produire” ci-dessus)
  • Anonymiser (checklist “Anonymisation appliquée” ci-dessus)
  • Ajouter les images dans annexes/images/
  • Vérifier les liens internes
  • Relire “Résumé exécutif”