สารบัญ
ถ้าให้เดาว่า outage อันดับ 1 ของ IT ทั่วโลกมาจากอะไร คุณจะเดาว่าอะไรครับ?
Hacker? — ไม่ใช่ Hardware fail? — ไม่ใช่ Natural disaster? — ห่างไกล
คำตอบคือ change ที่เราทำเอง
จากสถิติ IT operations ที่ ISACA + ITIL community เก็บมา การ “เปลี่ยนแปลง” ที่ไม่ได้ผ่าน change management อย่างถูกต้อง คือสาเหตุของ production outage มากกว่าทุกสาเหตุอื่นรวมกัน
ที่น่าสนใจคือ change ส่วนใหญ่ไม่ได้ตั้งใจทำให้พังนะ มันทำเพื่อแก้ปัญหา / เพิ่ม feature / patch security ทั้งนั้น แต่เพราะไม่ได้ test ไม่ได้ approve ไม่มี backout plan ก็เลยกลายเป็น outage
ตอนนี้ขอคุยทุกแง่ของ Section 4.8 ทั้ง Change Configuration และ Patch Management หรือที่ผมเรียกว่าเรื่อง “ปิดประตูตัวเอง” นั่นแหละครับ
ทำไม Change Management ถึงไม่ใช่ bureaucracy
ภาพในหัวของหลายคนเวลาพูดถึง change management คือ “process ช้าๆ ที่กลั่น IT ออกมาเป็นกระดาษ form”
นี่คือความเข้าใจผิดที่อันตรายมาก เพราะมันทำให้ทีม dev/ops พยายาม bypass กระบวนการ
ผมขอเสนอ frame ใหม่ครับ change management คือ “เราจะทำให้แน่ใจว่า ถ้าพังแล้ว rollback ได้ทัน”
ลองนึกถึงหมอผ่าตัด ก่อนผ่า หมอทำ 4 อย่าง:
- ดู scan + indication — แน่ใจว่าควรผ่าตรงนี้
- ทบทวนกับทีม — ทุกคนเข้าใจตรงกัน
- เตรียม contingency — ถ้าเลือดออกหนักจะทำยังไง? ถ้าเปลี่ยน plan กลางคันจะทำยังไง?
- document ทุกขั้น — เผื่อต้องตามต่อหรือมีคดีความ
หมอที่ดีไม่เคยผ่าโดยไม่รู้วิธีกลับ เพราะถ้าเปิดท้องไปแล้วเจอเรื่องไม่คาดคิด ต้องมีทางถอย
change management ก็แบบนี้แหละ เราไม่ deploy โดยไม่รู้วิธี rollback
3 ประเภทของ change ที่ exam ชอบหลอก
CRM แบ่ง release เป็น 3 ประเภท แต่ละประเภทมี process ต่างกัน แต่ทุกประเภทต้องมี control
ประเภทที่ 1 — Major Release
- เนื้อหา: feature ใหม่, architecture change, integration ใหม่
- ความถี่: น้อยที่สุด (รายไตรมาส / ราย 6 เดือน)
- process: เต็มรูปแบบ — RFC (Request for Change / คำขอเปลี่ยนแปลง), impact analysis, testing ใน UAT (User Acceptance Testing / การทดสอบให้ผู้ใช้ยอมรับระบบ), sign-off, scheduled deployment, post-implementation review
- backout plan: ต้องมี + ทดสอบแล้ว
ประเภทที่ 2 — Minor Release
- เนื้อหา: bug fix เล็กๆ, configuration tweak, parameter change
- ความถี่: บ่อย (รายเดือน / รายสัปดาห์)
- process: ลดทอนแต่ยังครบ — minor RFC, peer review, testing แบบ smoke test, sign-off
- backout plan: ต้องมี
ประเภทที่ 3 — Emergency Release
- เนื้อหา: critical bug, security patch ที่ห้ามรอ, production hot fix
- ความถี่: ตอนเกิดเหตุจริง
- process: เร็วแต่ยังควบคุม — verbal approval ก่อน written ตามหลัง mandatory post-implementation review
- backout plan: ต้องมี (เพราะ urgency = ไม่ได้ test เต็ม → risk สูงไปอีก)
Trap ใหญ่ที่สุดของ exam — Emergency change ≠ no controls
ที่ผมว่าอันตรายและ exam ออกแน่ๆ:
“Emergency = ไม่ต้องผ่าน process” ผิด
emergency change ยังต้องมี:
- authorization (อาจเป็น verbal ก่อน, written ตาม)
- logging (ทุก action ที่ทำ)
- post-hoc review (review ภายใน X วัน)
ถ้าองค์กรไหน emergency change > 10% ของทั้งหมด → flag finding ทันที เพราะนั่นคือ sign ของ process avoidance ทีม dev ใช้ “emergency” เป็นข้ออ้าง bypass change management
ตัวอย่าง pattern คลาสสิคของวงการ: e-commerce platform บางที่ใน 6 เดือน apply emergency change หลายร้อยครั้ง และเกือบ 1 ใน 6 ของ emergency change สร้าง incident ใหม่ — ไม่มี post-implementation review เลยซักรอบ
นี่ไม่ใช่ “emergency” หรอกครับ นี่คือ change management ที่ตายไปแล้ว
Patch Management: cyber security ผ่านการ update
Patch ≠ optional
ทำไม security patch ถึงเป็นเรื่องด่วน?
เพราะเมื่อ vendor ออก patch สาธารณะ = vulnerability นั้นถูกเปิดเผยแล้ว hacker รู้แล้วว่าจะเข้ามาจากตรงไหน
ทุกวันที่ผ่านไปโดยไม่ติด patch ก็เหมือนปล่อยให้ attacker รู้ทางเข้าแล้วเราไม่ได้ปิดประตู
แต่ patch ก็ไม่ใช่ “apply ทันที” เสมอ
นี่คือความขัดแย้งของ patch management:
- ติดเร็ว → กันโจรเร็ว แต่อาจ break production
- ติดช้า → ไม่ break แต่เปิด window ให้โจรนาน
วิธีที่ work: test → stage → production ในระยะเวลาที่กำหนด
| Tier | คำอธิบาย | timeline สำหรับ critical patch |
|---|---|---|
| Test environment | ลง patch ก่อน เช็คว่า break อะไรมั้ย | < 24 ชั่วโมงหลัง release |
| Staging | ลง patch ใน environment ที่ใกล้ production | 24-72 ชั่วโมง |
| Production | ลงตามแผน rollout (ทยอยที่ละกลุ่ม) | 7-14 วัน |
สำหรับ patch ที่มี exploit ใน the wild แล้ว — timeline จะสั้นลงทันที (24-48 ชั่วโมงทั้ง pipeline)
กรณีจริง: SCADA factory ที่ Bangpoo
โรงงานแห่งหนึ่ง ทีม IT apply OS (Operating System / ระบบปฏิบัติการ) patch ให้เครื่อง production control ในเย็นวันศุกร์ โดยไม่ test ก่อน
patch มี compatibility issue กับ SCADA (Supervisory Control and Data Acquisition / ระบบควบคุมและเก็บข้อมูลในโรงงาน) system Monday เช้า production start ไม่ได้
ลอง rollback ดู ปรากฏว่าไม่มี documented backout procedure
ใช้เวลา 6 ชั่วโมง restore จาก backup เสียกะการผลิตทั้งวันเลย
control gap ทุกชั้นเลย:
- ไม่มี test environment ก่อนลง production
- ไม่มี documented backout plan
- ลง patch เย็นวันศุกร์ (= “Friday deployment” anti-pattern พังเสาร์อาทิตย์ไม่มีใครแก้)
Configuration Management: blueprint ของระบบ
CMDB คืออะไร
CMDB (Configuration Management Database) = ฐานข้อมูลที่บันทึกว่าระบบของเราตอนนี้ configure ยังไง
- server แต่ละตัวรัน OS version อะไร? patch level เท่าไหร่?
- database parameter set ยังไง?
- network device firewall rule ปัจจุบัน?
- ระบบ A กับ B เชื่อมกันที่ port อะไร?
ถ้า CMDB accurate — auditor ตอบคำถาม “ระบบเรามีอะไรอยู่บ้าง” ได้
ถ้า CMDB outdated หรือไม่มี — ทุก control downstream ก็เดิน blind
กรณี hospital DB parameter
โรงพยาบาลแห่งหนึ่ง developer เปลี่ยน “timeout parameter” ใน database เพื่อปรับ performance
parameter นั้นโดยบังเอิญไป disable audit logging ของการ access ผู้ป่วยซะงั้น
2 สัปดาห์ต่อมา investigation เรื่อง data breach ต้องการ audit log → log ไม่อยู่ อ้าว
control gap:
- configuration change ของ database ไม่ผ่าน change management
- ไม่มี security review สำหรับ configuration change
- ไม่มี monitoring ว่า audit logging กำลัง active อยู่หรือไม่
นี่แหละเหตุผลที่ configuration change ทุกตัวต้องผ่าน process ไม่ว่าจะดู minor แค่ไหน
IS Operations — งานหลังบ้านที่ผู้สอบบัญชีต้องเช็ค
ก่อนจะไปต่อเรื่อง source code ขอแวะคุย infrastructure layer ที่ change / config / patch ทั้งหมดข้างบนนี้นั่งทับอยู่ก่อนครับ ก็คือ IS Operations หรืองาน “ดูแลบ้าน” ของระบบทั้งหมด
CRM Section 4.8.3 บอกชัดว่า IS Operations คือกระบวนการที่ support + manage infrastructure / systems / applications / data ในชีวิตประจำวัน ทุก outage / breach / data loss ที่เกิดขึ้นจริง สุดท้ายจะวิ่งกลับมาที่คำถามเดียว — “ทีม operations ทำตามขั้นตอนที่เขียนไว้ไหม”
IS Operations staff ทำอะไรบ้าง
พอเห็น job description ของทีมนี้ในหนังสือ หลายคนจะนึกว่าเป็นหลายตำแหน่ง จริงๆ มันคือบทบาทเดียวกัน ที่คลุมงาน 7 อย่าง:
- จัด job schedules — งาน batch / cron / scheduled job ต้องวิ่งตรงเวลา
- ทำ backup ตามรอบที่กำหนด
- กัน unauthorized access ของ sensitive data
- Monitor + review ว่าทีมทำตาม procedure ที่ผู้บริหารกำหนดไว้ไหม
- ร่วมทดสอบ DRP (disaster recovery plan)
- Monitor performance / capacity / availability / failure ของ information resources
- Troubleshooting + incident handling เวลามีของพัง
จะเห็นว่าไม่ใช่ “operator นั่งกดปุ่ม” อย่างที่หลายคนเข้าใจ คือคนที่ถือกุญแจระบบทั้งหมดในมือเลยครับ
Operations documentation set ที่ต้องมี
CRM ระบุว่าทุก IS operations function ต้องมีเอกสาร 5 ชุด ขั้นต่ำ:
| เอกสาร | ทำไมต้องมี |
|---|---|
| Operations procedures — operating instructions + job flows | คนใหม่มาทำงานต่อได้โดยไม่ต้องเดา |
| Startup / shutdown procedures | ลำดับเปิดปิดผิด = ระบบเสีย / ข้อมูลหาย |
| Error detection procedures | รู้ว่าจะหา error ของ system + application ตรงไหน |
| Problem handling + escalation | เกินมือเรา → ส่งต่อใครภายในกี่นาที |
| Backup + recovery procedures | restore ได้จริง ไม่ใช่ backup เก็บไว้แล้วเปิดไม่ออก |
ถ้าเอกสารเหล่านี้ขาดสักชุด = control gap ที่ผู้สอบบัญชีต้อง flag ทันที
Operator access controls + operator manuals
จุดที่ exam ชอบหลอก — operator ≠ คนเขียน code ≠ คนใช้ระบบ operator คือคนที่มีสิทธิ์ run / restart / monitor production system
control ที่ต้องดู:
- จำกัดสิทธิ์ของ operator ไม่ให้แตะ source code library + production data libraries
- utility ที่ใช้ patch software / data ต้องจำกัดสิทธิ์เป็น case-by-case
- operator manual ต้องครอบคลุม: วิธีคุมเครื่อง + peripheral / startup-shutdown / กรณี machine หรือ program fail / record ที่ต้องเก็บ / สิ่งที่ห้ามทำ
operator ที่ทำงานโดยไม่มี manual = ทำงานตามความจำ วันที่จำผิดก็คือวัน outage
Librarian role + media library — คนละเรื่องกับ source code library
ตรงนี้สำคัญมากครับ เพราะคำว่า “library” ใน CRM มีสองความหมาย คนละโลกเลย:
- Source code library (ที่คุยใน section ถัดไป) = ที่เก็บ source code ของ developer
- Media library (ที่คุยตรงนี้) = ที่เก็บ physical media — tape backup, removable disk, optical media, sensitive print-out
Librarian คือคนที่ดูแล media library ตัวเป็นๆ ไม่ใช่ผู้คุม Git repo ครับ control ที่ต้องมี:
- Labeling — ทุกตลับ / disk / tape มี label ว่าเก็บอะไร classification ระดับไหน
- Check-in / check-out — บันทึกว่าใครหยิบ media ออกไปเมื่อไหร่ คืนเมื่อไหร่
- Receipt / return — librarian รับ + ส่งคืน media ที่ย้ายเข้า-ออกห้อง
- Secure destruction — media ที่เลิกใช้ต้องทำลายตามระดับ classification (degauss / shred / incinerate)
- Physical theft prevention — ห้องล็อก กล้องวงจรปิด ห้ามเอาออกโดยไม่มี authorization
นี่คือ control ที่ digital-first generation มักลืม เพราะคิดว่า “ใครจะมาขโมย tape” แต่จริงๆ tape ที่หายไป 1 ตลับอาจมี customer record หลักล้านอยู่ในนั้นเลย
Lights-out operations — data center ที่ไม่มีคน
Lights-out operation = data center ที่ run แบบไม่มีคนประจำ ใช้ automation + remote console จัดการทุกอย่าง เจอใน cloud provider + บริษัทใหญ่ที่ลด headcount
control challenge พิเศษของ lights-out:
- Remote master console เปิดให้ standby operator เข้าได้เผื่อกรณี automated software failure → security ของ remote access ต้องแน่นพอกัน hacker เข้ามาคุม console
- Automated software ที่ทำหน้าที่ operator ต้อง documented + tested ที่ recovery site ด้วย ไม่ใช่ทดสอบแค่ที่ primary
- Contingency operator ต้องมีจริง + รู้วิธีเข้ามารับช่วงตอน automation พัง
- Change control ของ automation script เองก็ต้องเข้มไม่แพ้ production code
- Operator notification — error ทุกตัวต้อง alert ถึงคนได้ ห้ามมี error ที่ระบบ “กลืน” เงียบๆ
data center แบบไม่มีคนประจำ ที่ไม่มี control 5 ข้อนี้ = ระเบิดเวลาที่จะระเบิดวันที่ automation เจอ edge case ที่ไม่เคย test
Figure 4.18 — checklist ที่ผู้สอบบัญชีใช้จริง
CRM แนะนำให้ผู้สอบบัญชี เดินสำรวจ information processing facility (IPF) จริงๆ เพื่อเห็นภาพ operations ก่อนถาม control คำถามที่ใช้ check แต่ละจุด:
| Area | คำถามหลักที่ผู้สอบบัญชีถาม |
|---|---|
| Observation IS personnel | control efficient + ตาม standard / policy ไหม? job schedule ทันไหม? management review + data integrity + security มีไหม? |
| Operator access | operator เข้าถึง file + documentation library ได้จำกัดไหม? หน้าที่กับเครื่อง + peripheral ถูกแบ่งชัดไหม? การใช้ computer ถูก supervise ไหม? สิทธิ์ใช้ utility ที่แก้ software / data ถูกจำกัดไหม? access ของ production source code + data library จำกัดไหม? |
| Operator manuals | manual ครอบคลุมการคุมเครื่อง + peripheral, startup-shutdown, กรณี machine / program fail, record ที่ต้องเก็บ, routine duty + restricted activity ไหม? |
| Library access | librarian ห้ามแตะ computer hardware ไหม? เข้าถึงแค่ data management system ไหม? access ของห้อง library เปิดเฉพาะคนได้รับอนุญาตไหม? การหยิบ file ออกถูกคุมโดย scheduling software ไหม? librarian รับส่ง movable media ไหม? |
| Offline storage | media ที่เก็บ production program + data ติด label ชัดไหม? policy ครอบคลุม admin / check-in-out / labeling / inventory / secure destruction ไหม? |
| File-handling procedures | procedure คุมรับ-ส่ง file + secondary storage ไหม? retention label ป้องกัน erasure ก่อนกำหนดไหม? คนทำตาม procedure จริงไหม? |
| Data entry | input document มี authorization + signature ไหม? batch total ถูกคำนวณ + ใช้จริงไหม? separation of duties ระหว่างคน key data กับคน review ไหม? control report ถูก produce + accurate + standardize + review ไหม? |
| Lights-out operations | security ของ remote master console กัน unauthorized use ได้ไหม? automated operation software + manual contingency procedure ถูก document + test ที่ recovery site ไหม? change control ครอบคลุม automation ไหม? test หลัง change / update ถูกทำ periodic ไหม? operator notification ครบทุก error ไหม? |
ตารางนี้น่าจำที่สุดในตอนนี้ครับ เพราะเป็น physical checklist ที่เอาไปใช้กับ IPF ของบริษัทไหนก็ได้ ผู้สอบบัญชีที่ดีจะถือไปเดิน data center แล้วเช็คทีละข้อ ไม่ใช่นั่งอ่าน policy ที่ฝ่าย IT ส่งมาให้แล้ว stamp ผ่าน
Source Code Management: บัญชีของโค้ดทั้งบริษัท
CMDB คุม configuration ของระบบ แต่source code ที่ทีม dev เขียนเองหรือดัดแปลง ก็เป็น asset ที่ต้องคุมเหมือนกัน
CRM 4.6.7 แยก source code management เป็น control set ของตัวเอง
หลักการ: check-in / check-out + version + library
Source code library = ที่เก็บ source code ที่มี:
- Version control — ทุก commit มี version + author + timestamp
- Check-out / check-in — developer ที่จะแก้ → check-out → แก้ → ทดสอบ → check-in กลับ
- Branch protection — ห้าม commit ตรงไปยัง production / main branch
- Code review — ก่อน merge ต้องมี reviewer คนอื่น approve
ในยุค Git/GitHub concept พวกนี้ implement ผ่าน pull request + branch protection rule
Production code ≠ Development code
กฎเหล็ก: code ที่ run ใน production ต้องตรงกับ version ที่ checked-in + tested + approved
ถ้า developer ลอง edit production code ตรงๆ (hot fix แบบ console) โดยไม่ผ่าน source library → CMDB กับ source library ไม่ตรงกัน เป็น control gap ระดับร้ายแรง
ตัวอย่างจริง
โรงงานแห่งหนึ่ง developer แก้ bug ใน production server ตรงๆ โดย SSH (Secure Shell / โปรโตคอลเข้าถึง server ระยะไกลแบบเข้ารหัส) เข้าไปแก้ไฟล์
- Source library ยังมี version เก่า
- 2 สัปดาห์ต่อมา มี deployment ใหม่จาก source library → overwrite hot fix → bug กลับมา
- ไม่มีใครรู้ว่าทำไม bug “หายไปแล้วกลับมา” 555+
control gap: production code ไม่ sync กับ source library + ไม่มี FIM (File Integrity Monitoring / ระบบเฝ้าความถูกต้องของไฟล์) ที่ alert
มุม IS Auditor
- Reconciliation — ระหว่าง production binary กับ source library ตรงไหม (ใช้ hash compare)
- Access control — ใครมีสิทธิ์ check-in / merge / approve PR (Pull Request / คำขอ merge code)
- SoD (Segregation of Duties / การแยกหน้าที่) ใน source pipeline — developer ≠ reviewer ≠ release manager
- Audit trail — ทุก change มี traceability กลับไป commit + approver + ticket
เกี่ยวเนื่อง: ถ้าซื้อ software จาก vendor แทนการพัฒนาเอง (build-vs-buy) source code อาจไม่อยู่ในมือเราเลย — ตรงนี้ source code escrow คือ control สำคัญที่ exam ออกถามบ่อย รายละเอียดเขียนไว้แล้วใน ตอนที่ 25 — SDLC waterfall + build-vs-buy
Software Licensing: เรื่องที่ exam ออกซ้ำ
Software piracy ≠ ปัญหาเฉพาะ pirated copy
หลายคนคิดว่า software licensing risk = “บริษัทใช้ software เถื่อน”
จริงๆ แล้ว bigger risk คือ license non-compliance ของ software ที่ซื้อถูกต้องต่างหาก
ตัวอย่างที่เจอบ่อย:
- ซื้อ license สำหรับ 100 user — install จริง 130 user (เกิน license)
- ซื้อ license แบบ named user — แชร์ account ให้หลายคน (ผิดเงื่อนไข)
- ซื้อ license สำหรับ on-premise — install ใน virtual machine ที่ migrate ไป cloud (license ไม่คลุม)
- ซื้อ Oracle Database Standard Edition — รัน feature ของ Enterprise Edition (audit แตก)
กฎเหล็กของ vendor (Microsoft, Oracle, SAP): vendor มีสิทธิ์ audit การใช้ software ของลูกค้าได้ ถ้าเกิน license จริง ค่าปรับมหาศาล + retroactive licensing fee เลยครับ
Vendor License Audit
vendor ใหญ่มี dedicated team ที่ทำ license audit:
- Microsoft Software Asset Management (SAM)
- Oracle License Management Services (LMS)
- BSA (Business Software Alliance) — ตัวกลางที่ enforce license สำหรับ vendor หลายราย รวมถึงในไทย
ถ้า audit แตก — penalty อาจ 3-5 เท่า ของ license cost จริง + back-payment
ตัวอย่างจริงในไทย
บริษัทขนาดกลางในไทย ใช้ Microsoft Office + Adobe Creative Suite
เริ่มซื้อ license 50 ชุด → growth เป็น 80 พนักงาน IT install เพิ่มแต่ไม่ซื้อ license เพิ่ม
3 ปีต่อมา Microsoft initiate audit (จากการ license tracking ของ Office activation)
ผลลัพธ์: pay back-licensing 3 ปี + penalty + true-up licensing สำหรับ 30 user ที่เกิน เจ็บมาก
มุม IS Auditor — License Compliance Audit
5 จุดที่ตรวจ:
- License inventory — จำนวน license ที่ purchased + entitlement detail
- Deployment count — install จริงในระบบมีกี่เครื่อง / กี่ user
- Usage reconciliation — license usage ≤ entitlement
- License terms compliance — concurrent vs named, on-prem vs cloud, geographical scope
- Open source compliance — open source library มี license terms (MIT, GPL, Apache) ที่ business ต้อง comply (โดยเฉพาะ GPL ที่บังคับเปิด source)
มุมที่ผู้บริหารต้องเข้าใจ: software license = legal liability ไม่ใช่แค่ procurement issue ผู้บริหารที่ตอบ “IT ดูแลเรื่องนี้แทน” → ตอน vendor audit แตกแล้วไม่มีทางหนีนะครับ
Backout Plan: สิ่งที่ exam ชอบเช็ค
เอาตรงๆ ผมว่า feature เดียวที่ทำให้ change management work จริงๆ ก็คือ backout plan นี่แหละครับ
ถ้า change fail แล้ว rollback ได้ภายใน X นาที = พื้นที่เสี่ยงจำกัด ถ้า change fail แล้ว rollback ไม่ได้ = พื้นที่เสี่ยงไม่จำกัด
requirement สำหรับ backout plan ที่ใช้ได้จริง:
- Documented step-by-step — ไม่ใช่ “เดี๋ยว IT จะคิด”
- Tested — ทดสอบใน test environment ว่า rollback ได้จริง ใช้เวลาเท่าไหร่
- Resourced — มีคนที่รู้วิธีทำ + standby ในช่วง deployment
- Time-boxed — กำหนดล่วงหน้า “ถ้าหลัง X นาทียังไม่ stable ให้ rollback”
Trap ของ exam: “เรามี backup เลยไม่ต้องมี backout plan” ผิด backup คือ data, backout plan คือกระบวนการ คนละเรื่องกันเลย
ที่ auditor ต้องตรวจใน Change Management
5 จุดหลัก:
- Authorization — ทุก change มี approval จากระดับที่ถูกต้องมั้ย?
- Testing — มี evidence ของการ test ก่อน production มั้ย?
- Backout plan — documented + tested?
- Emergency change ratio — > 10% = red flag
- Reconciliation — change log ใน CMDB ตรงกับ change request ที่ approve มั้ย? มี change ที่อยู่ใน log แต่ไม่มี approval = unauthorized change
จุดที่ 5 คือสิ่งที่ผมว่าน่าตรวจที่สุด มัน reveal “ghost changes” ที่ทีมแอบทำโดยไม่ผ่าน process ออกมาให้เห็นเลย
ปิดบท: process ที่ดูช้า แต่จริงๆ เร็ว
ความเข้าใจผิดของหลายคน — change management ทำให้ deploy ช้า
ความจริงคือ change management แท้จริงทำให้ deploy เร็วต่างหาก เพราะ:
- ลด rollback / outage → ไม่ต้องเสียเวลาแก้ของพัง
- มี documentation → ครั้งหน้าทำได้เร็วขึ้น
- มี backout plan → กล้า deploy เร็วเพราะรู้ว่าถอยได้
องค์กรที่ deploy เร็วที่สุดในโลก (Google, Netflix, Amazon) มี change management process ที่เข้มงวดกว่าองค์กรทั่วไปด้วยซ้ำ แต่ automate ทุกขั้น
DevOps ที่ดี ≠ ไม่มี change control แต่ DevOps ที่ดี = change control ที่ automate ต่างหาก
ตอนถัดไปคุยเรื่องที่เก็บทุก trace ของ change — Log Management + SLA (Service Level Agreement / สัญญาระดับการให้บริการ) ที่เป็น measurable contract ระหว่าง IT กับ business
อ้างอิง CRM (CISA Review Manual 28th Edition): Domain 4: Section 4.8 IT Change, Configuration and Patch Management + Section 4.6.7 Source Code Management + Section 4.6.8 Software Licensing Issues