Support AI Skill

Support Risk Management

Identify, assess, and mitigate risks in support operations including data security, compliance, business continuity, reputation management, and operational risks. Use when creating risk management frameworks, developing business continuity plans, managing support compliance, or preparing for support-related crises. Triggers on phrases like "support risk management", "business continuity support", "support compliance", "data security support", "support crisis plan", "operational risk support", "support contingency", "risk mitigation support", "support disaster recovery", "support risk assessment".

Support Risk Management & Business Continuity

Identify, assess, and mitigate risks in support operations — ensuring business continuity, data security, regulatory compliance, and reputation protection during normal operations and crisis situations.

Workflow

Conduct risk assessment: identify all potential support-related risks.
Categorize risks: operational, security, compliance, reputational, financial.
Assess likelihood and impact for each risk; create risk matrix.
Develop mitigation strategies and contingency plans for high-priority risks.
Create business continuity plan (BCP) for critical scenarios.
Test plans through simulations and drills.
Train team on risk awareness and emergency procedures.
Review and update plans quarterly.

Risk Assessment Framework

SUPPORT RISK REGISTER
========================

Risk Category 1 — Operational Risks:
  ════════════════════════════════════════════════════════════════════════
  Risk                              | Likelihood | Impact | Priority | Mitigation
  ════════════════════════════════════════════════════════════════════════
  Help desk platform outage         | Medium     | Critical| HIGH    | Backup platform; manual processes
  Mass ticket spike (outage/event)  | Medium     | High    | HIGH    | Overflow protocol; auto-responders
  Key staff departure               | Medium     | Medium  | MEDIUM  | Cross-training; documentation
  Data loss (tickets/customers)     | Low        | Critical| HIGH    | Regular backups; disaster recovery
  Security breach (customer data)   | Low        | Critical| HIGH    | Access controls; encryption; audit
  ════════════════════════════════════════════════════════════════════════

Risk Category 2 — Compliance Risks:
  ════════════════════════════════════════════════════════════════════════
  Risk                              | Likelihood | Impact | Priority | Mitigation
  ════════════════════════════════════════════════════════════════════════
  GDPR violation (data request)     | Medium     | High    | HIGH    | Standard procedures; training
  SLA breach (contractual penalty)  | Medium     | Medium  | MEDIUM  | Monitoring; escalation triggers
  Industry regulation non-compliance| Low        | High    | MEDIUM  | Regular audits; compliance officer
  Data retention violation          | Low        | Medium  | MEDIUM  | Automated retention policies
  ════════════════════════════════════════════════════════════════════════

Risk Category 3 — Reputational Risks:
  ════════════════════════════════════════════════════════════════════════
  Risk                              | Likelihood | Impact | Priority | Mitigation
  ════════════════════════════════════════════════════════════════════════
  Social media complaint viral      | Medium     | High    | HIGH    | Social monitoring; response protocol
  Negative review (G2, Trustpilot)  | High       | Medium  | MEDIUM  | Proactive CSAT; review management
  Customer churn publicity          | Low        | High    | MEDIUM  | Retention program; win-back
  Agent misconduct (public)         | Low        | Critical| HIGH    | Training; monitoring; code of conduct
  ════════════════════════════════════════════════════════════════════════

Risk Category 4 — Financial Risks:
  ════════════════════════════════════════════════════════════════════════
  Risk                              | Likelihood | Impact | Priority | Mitigation
  ════════════════════════════════════════════════════════════════════════
  Budget overrun                    | Medium     | Medium  | MEDIUM  | Monthly tracking; variance alerts
  Revenue loss from churn           | Medium     | High    | HIGH    | Health scoring; proactive retention
  Penalty from SLA breach           | Low        | Medium  | MEDIUM  | SLA monitoring; proactive escalation
  Tool/vendor cost increase         | Medium     | Low     | LOW     | Multi-year contracts; alternatives
  ════════════════════════════════════════════════════════════════════════

Business Continuity Plans

BUSINESS CONTINUITY PLAN (BCP)
================================

Scenario 1 — Help Desk Platform Outage:
  ════════════════════════════════════════════════════════════════════════
  Detection: Platform status page + agent reports within 5 minutes
  Immediate Actions (0–30 minutes):
    → Activate backup communication channels (email, phone)
    → Post status update on website and social media
    → Notify customers: "Experiencing technical issues; use [alternative]"
    → Switch to backup help desk (pre-configured, minimal setup)
  Short-Term (30 min – 4 hours):
    → Triage tickets via email and phone
    → Prioritize P1 issues; batch-process P2/P3 when system restored
    → Monitor customer communications for frustration; respond proactively
  Recovery (4–24 hours):
    → System restored; migrate tickets from backup to primary
    → Post-mortem: Root cause, impact, timeline
    → Prevention: Improved monitoring, vendor SLA review
  
Scenario 2 — Mass Ticket Spike (Product Outage):
  ════════════════════════════════════════════════════════════════════════
  Detection: 50%+ volume increase within 30 minutes
  Immediate Actions (0–15 minutes):
    → Activate incident mode: All-hands Slack channel
    → Post status update: "We're aware of the issue. Working on it."
    → Auto-responder: "We're experiencing high volume due to [issue]."
    → Redirect: Non-critical tickets → email (from chat/phone)
  During Incident:
    → Bulk response templates for common outage-related questions
    → Focus agents on P1/P2; defer P3/P4
    → Updates every 30 minutes (status page + email to affected customers)
    → Managers jump in to handle tickets alongside agents
  Post-Incident:
    → Send resolution email to all affected customers
    → Review: Response time, CSAT, process effectiveness
    → Improvement: Update incident protocols based on learnings
  
Scenario 3 — Data Breach:
  ════════════════════════════════════════════════════════════════════════
  Detection: Security alert + anomaly detection
  Immediate Actions (0–1 hour):
    → Contain: Restrict access to affected systems
    → Assess: What data exposed? How many customers?
    → Legal notification: Engage legal counsel within 1 hour
    → Regulatory notification: GDPR requires 72-hour notification
  Customer Communication (1–24 hours):
    → Affected customers notified: "We detected unauthorized access to [data]."
    → What's being done: "We've secured systems and are investigating."
    → What customers should do: "Change password, monitor account."
    → Support channel: Dedicated line/email for breach-related questions
  Investigation and Recovery (1–7 days):
    → Full forensic investigation
    → System hardening and vulnerability fixes
    → Customer support for breach-related tickets
    → Post-mortem and preventive measures

Risk Monitoring and Reporting

RISK MONITORING FRAMEWORK
===========================

Continuous Monitoring:
  ════════════════════════════════════════════════════════════════════════
  Risk                    | Monitoring Method              | Alert Threshold
  ════════════════════════════════════════════════════════════════════════
  Platform uptime         | Status monitoring tool          | Any outage
  Ticket volume           | Real-time dashboard             | +50% vs avg
  SLA compliance          | Automated SLA tracking          | < 90%
  CSAT score              | Survey results                  | < 4.0
  Data access anomalies   | Security monitoring             | Any unusual pattern
  Social media mentions   | Social listening tool           | Negative sentiment spike
  Agent attrition         | HR reporting                    | > 15% quarterly
  ════════════════════════════════════════════════════════════════════════

Quarterly Risk Review:
  → Update risk register (new risks, retired risks)
  → Reassess likelihood and impact for all risks
  → Review effectiveness of mitigation strategies
  → Test business continuity plans (tabletop exercise)
  → Report to leadership: Risk status, incidents, improvements

Integration Points

Monitoring (Datadog, PagerDuty, UptimeRobot): Platform uptime, system health, alerting
Security (Okta, LastPass, Cloudflare): Access management, encryption, threat detection
Communication (Slack, Teams, Email): Incident communication, customer notifications
Status Page (Statuspage, Atlassian Statuspage): Public status updates, incident communication
Help Desk (Zendesk, Freshdesk): Ticket management during incidents, backup platform
Legal/Compliance: Regulatory notification procedures, data retention policies
Backup/Disaster Recovery (AWS Backup, Veeam): Data backup, system recovery
Social Listening (Hootsuite, Brandwatch): Reputation monitoring, crisis detection

Edge Cases

Multiple simultaneous risks: Platform outage + mass ticket spike + social media crisis
Prioritization: Contain → Communicate → Resolve (in that order)
Team roles: Clear incident commander, communication lead, technical lead
Customer communication: Single source of truth (status page)
Internal communication: Dedicated incident channel (no noise)
Post-incident: Comprehensive post-mortem covering all aspects

Vendor failure: Help desk vendor goes out of business
Prevention: Multi-year contracts with financial stability assessment
Data portability: Regular exports; data not locked in
Alternative evaluation: Maintain awareness of alternative platforms
Transition plan: 30–60 day migration plan pre-documented
Contract terms: Exit clause with data export guarantee

Regulatory change: New privacy law impacts support operations
Monitoring: Subscribe to regulatory updates in operating regions
Assessment: Impact analysis within 30 days of law announcement
Implementation: Process changes, training, system updates
Timeline: Comply before law effective date
Documentation: Updated policies and procedures

Disclaimer: All rights reserved by Circulos AI. These skills are specifically designed for Claude Code, Claude Cowork, Codex, and OpenClaw. When using or referencing any skill, please provide proper attribution to Circulos AI.