Skip to content

มาตรฐานตัวชี้วัดและ KPIs ของ SOC

เอกสารนี้กำหนด Key Performance Indicators (KPIs) และตัวชี้วัดการปฏิบัติงานที่ใช้วัด ประสิทธิผล, ประสิทธิภาพ, และ สุขภาพทีม ของ SOC ตัวชี้วัดขับเคลื่อนการปรับปรุงอย่างต่อเนื่องและช่วยจัดสรรทรัพยากรตามข้อมูล


ภาพรวม

graph LR
    Data["📊 ข้อมูลดิบ"] --> Metrics["📈 ตัวชี้วัด"]
    Metrics --> KPIs["🎯 KPIs"]
    KPIs --> Decisions["💡 การตัดสินใจ"]
    Decisions --> Actions["🔧 การปรับปรุง"]
    Actions --> Data
หมวด เน้น ตัวอย่างตัวชี้วัด
⏱️ ประสิทธิภาพ ตอบสนองเร็วแค่ไหน MTTD, MTTR, MTTA
🎯 ประสิทธิผล ตรวจจับดีแค่ไหน FPR, detection coverage, dwell time
👥 กำลังคน ภาระงานและสุขภาพทีม Alerts ต่อ analyst, burnout, utilization
💰 ธุรกิจ คุณค่าที่ส่งมอบ ต้นทุนต่อ incident, การป้องกัน breach
📊 Compliance การปฏิบัติตามข้อบังคับ SLA met %, audit findings

1. ตัวชี้วัดประสิทธิภาพ (How Fast)

1.1 Mean Time To Detect (MTTD)

แอตทริบิวต์ รายละเอียด
คำจำกัดความ เวลาเฉลี่ยจาก การบุกรุก ถึง SOC ตรวจจับได้
สูตร Σ(Detection Time − Intrusion Time) / Total Incidents
เป้าหมาย < 30 นาที
การวัด ค่าเฉลี่ยรายเดือน

💡 วิธีปรับปรุง: เพิ่ม log coverage, behavioral analytics, automated correlation, threat intel feeds

1.2 Mean Time To Acknowledge (MTTA)

แอตทริบิวต์ รายละเอียด
คำจำกัดความ เวลาเฉลี่ยจาก alert ขึ้น ถึง analyst รับเรื่อง
สูตร Σ(Acknowledge Time − Alert Time) / Total Alerts
เป้าหมาย < 10 นาที
การวัด ค่าเฉลี่ยรายวัน

1.3 Mean Time To Respond (MTTR)

แอตทริบิวต์ รายละเอียด
คำจำกัดความ เวลาเฉลี่ยจาก ตรวจจับ ถึง containment + remediation
สูตร Σ(Resolution Time − Detection Time) / Total Incidents
เป้าหมาย < 60 นาที (Critical/High) · < 4 ชม. (Medium)
การวัด ค่าเฉลี่ยรายเดือน แยกตามความรุนแรง

1.4 Mean Time To Close (MTTC)

แอตทริบิวต์ รายละเอียด
คำจำกัดความ เวลาเฉลี่ยจาก เปิด incident ถึง ปิดทั้งหมด (รวม PIR)
เป้าหมาย < 24 ชม. (Critical) · < 72 ชม. (High)

2. ตัวชี้วัดประสิทธิผล (How Well)

2.1 False Positive Rate (FPR)

แอตทริบิวต์ รายละเอียด
คำจำกัดความ เปอร์เซ็นต์ alert ที่เป็น benign หลังสืบสวน
สูตร (False Positive Alerts / Total Alerts) × 100%
เป้าหมาย < 10%

การดำเนินการตาม FPR

ระดับ FPR การดำเนินการ
< 5% ✅ ดีเยี่ยม — คงค่า tuning ปัจจุบัน
5–10% ⚠️ ยอมรับได้ — ทบทวน 5 กฎที่ noise มากสุด
10–25% 🟠 ต้องดำเนินการ — sprint ปรับแต่ง
> 25% 🔴 วิกฤต — เน้น tuning ก่อนสร้าง detection ใหม่

2.2 Detection Coverage

แอตทริบิวต์ รายละเอียด
คำจำกัดความ เปอร์เซ็นต์ MITRE ATT&CK techniques ที่มี detection อย่างน้อย 1 ตัว
เป้าหมาย ≥ 80% ของ 50 เทคนิคหลัก
การวัด ประเมินรายไตรมาส

2.3 Dwell Time

แอตทริบิวต์ รายละเอียด
คำจำกัดความ ระยะเวลาที่ผู้โจมตีอยู่ใน ระบบโดยไม่ถูกตรวจจับ
เป้าหมาย < 24 ชม. (ค่าเฉลี่ยอุตสาหกรรม: 16 วัน)
ผลกระทบ Dwell time ยาว = ความเสี่ยง data breach สูงขึ้น

2.4 Escalation Accuracy

แอตทริบิวต์ รายละเอียด
คำจำกัดความ เปอร์เซ็นต์ escalation T1→T2 ที่ ถูกต้อง
เป้าหมาย ≥ 85%

3. ตัวชี้วัดกำลังคน (Team Health)

3.1 ปริมาณ Alert

ตัวชี้วัด เป้าหมาย การดำเนินการเมื่อเกิน
Alerts ต่อ analyst ต่อกะ 15–25 เพิ่มคนหรือ automate triage
ความลึกคิวตอนสิ้นกะ < 10 ทบทวน staffing model
Alert backlog (> 24 ชม.) 0 Triage sprint ทันที

3.2 การใช้ประโยชน์ Analyst

ตัวชี้วัด เป้าหมาย หมายเหตุ
Utilization rate 60–80% > 80% = เสี่ยง burnout
ชั่วโมง OT < 10% ของเวลาปกติ ติดตามรายเดือน
เวลาฝึกอบรม ≥ 10% ของเวลาทำงาน ต่อคนต่อเดือน

3.3 สุขภาพทีม

ตัวชี้วัด เป้าหมาย ทำไมสำคัญ
อัตราลาออกรายปี < 15% คน SOC มีราคาแพงในการทดแทน
ระยะเวลาทำงานเฉลี่ย > 2 ปี การรักษาความรู้องค์กร
อัตราใบรับรอง ≥ 70% baseline ความสามารถทีม
คะแนนความพึงพอใจ ≥ 4/5 สำรวจรายไตรมาส (ไม่ระบุตัวตน)

4. ตัวชี้วัดธุรกิจ (Value Delivered)

ตัวชี้วัด สูตร การใช้งาน
ต้นทุนต่อ incident Total SOC Cost / Total Incidents วางแผนงบประมาณ
ต้นทุนต่อ alert Total SOC Cost / Total Alerts เปรียบเทียบประสิทธิภาพ
ประหยัดจากระบบอัตโนมัติ (เวลา manual − เวลา automated) × อัตราค่าจ้างรายชั่วโมง พิสูจน์ ROI

5. การรายงานและ Dashboard

5.1 ความถี่การรายงาน

รายงาน ความถี่ กลุ่มเป้าหมาย ตัวชี้วัดหลัก
Shift Report ทุกกะ SOC Lead ความลึกคิว, incidents active
Daily Brief รายวัน SOC Manager MTTA, alerts ที่ประมวลผล
Weekly Summary รายสัปดาห์ SOC Manager, CISO MTTD, MTTR, FPR, แนวโน้ม
Monthly SOC Report รายเดือน CISO, Management KPIs ทั้งหมด
QBR รายไตรมาส C-Suite, Board ตัวชี้วัดธุรกิจ, ROI

5.2 แผง Dashboard

แผง รูปแบบการแสดงผล รีเฟรช
🚨 Incidents ที่ Active ตามความรุนแรง Pie/donut chart เรียลไทม์
📈 แนวโน้มปริมาณ Alert Line chart (7 วัน) 5 นาที
⏱️ MTTA / MTTR เรียลไทม์ Gauge 5 นาที
📊 ความลึกคิว Bar chart ตามกะ 5 นาที
🎯 แนวโน้ม FPR รายสัปดาห์ Line chart รายวัน
👥 ภาระงาน Analyst Heatmap 15 นาที
🌍 ประเทศต้นทาง Top Geo map รายชั่วโมง
🛡️ Detection Coverage MITRE heatmap รายสัปดาห์

6. สรุปเป้าหมาย

ตัวชี้วัด เป้าหมาย การแบ่งตามความรุนแรง
MTTD < 30 นาที ทุกระดับ
MTTA < 10 นาที ทุกระดับ
MTTR < 60 นาที Critical/High
MTTC < 24 ชม. Critical
FPR < 10% โดยรวม
Detection Coverage ≥ 80% 50 เทคนิค MITRE หลัก
Dwell Time < 24 ชม. ทุก incident
Escalation Accuracy ≥ 85% T1→T2
Alerts ต่อ Analyst 15–25 ต่อกะ
Utilization 60–80% ต่อ analyst
อัตราลาออก < 15% รายปี
SLA Adherence ≥ 95% ทุก incident

เอกสารที่เกี่ยวข้อง

Metrics Collection & Reporting

Operational Metrics Template

Metric Source Collection Target
Total Alerts SIEM Auto/daily Trend ↓
True Positive Rate Ticketing Weekly > 80%
MTTR Ticketing Auto < 4 hrs
Escalation Rate Ticketing Weekly 10-15%
Coverage (ATT&CK) Rule mapping Monthly > 60%

Executive Reporting Cadence

Report Audience Frequency Content
Daily Brief SOC Team Daily Open incidents, alerts
Weekly Summary IT Management Weekly Trends, KPIs
Monthly Report CISO Monthly Full metrics, risks
Quarterly Review Board Quarterly ROI, maturity, roadmap

Metric Health Indicators

Metric Green Yellow Red
MTTR < 4 hrs 4-8 hrs > 8 hrs
FP Rate < 20% 20-40% > 40%
SLA Met > 95% 85-95% < 85%

Metric Review Cadence

Level Frequency Audience
Operational Daily SOC team
Tactical Weekly Management
Strategic Monthly CISO/Board

อ้างอิง (References)