1025 คำ
5 นาที
Project Management 101 EP.13 — เคสล้มจริง: Denver, NHS, Boeing
สารบัญ

📚 EP นี้เป็นตอนที่ 13 ของ mini-series Project Management 101 — สารบัญรวม อยู่ที่นี่

EP ก่อนๆ เล่าเรื่องที่ “ควรเป็นยังไง” — EP นี้เล่าเรื่องที่ “ผิดพลาดยังไงเมื่อไม่ทำตาม

ทุกเคสในส่วนนี้เป็นบทเรียนของวงการ — ใช้เป็น pattern recognize project ของตัวเองได้


1. Denver Airport Baggage System (1995) — scope เปลี่ยนกลางทาง#

สิ่งที่เกิด#

Denver International Airport ตั้งใจเปิดปี 1993 — แต่ระบบ baggage automation ทำให้เปิดช้า 16 เดือน

ความเสียหาย:

  • ค่า financing ทบทวี $1M/วัน × 16 เดือน
  • Cost overrun ของระบบ baggage: $560M
  • ต้องสร้างระบบ manual backup ทำคู่กัน

Project failure pattern#

1. Scope explosion กลางทาง

  • เริ่มต้น: BAE Automated Systems รับ implement สำหรับ United Airlines เท่านั้น
  • กลางโปรเจค: เมือง Denver ตัดสินใจ expand ให้ครอบคลุมทั้งสนามบิน
  • ไม่ reset schedule + budget — keep timeline เดิม

2. ไม่มี master integrator

  • Vendors หลายราย — แต่ไม่มีคนรับผิดชอบ system-of-systems
  • Integration ไม่ได้ถูก plan

3. Schedule pressure

  • Deadline politically driven — เมืองอยาก open ตามที่ promise ผู้ลงคะแนน
  • Vendor บอก “ทำไม่ทัน” → bypassed

4. Testing skipped

  • Time pressure → integration testing → cut
  • รถส่ง bag ฉีกกระเป๋าตอน demo

Lesson#

Scope จาก subsystem → system-of-systems = different project — ต้อง reset estimate, schedule, team ไม่ใช่ “ขอให้ทำเหมือนเดิม แต่ใหญ่กว่า”

💡 PM principle: Scope creep + fixed schedule = disaster


2. NHS National Programme for IT — NPfIT (UK, 2002-2011)#

สิ่งที่เกิด#

UK พยายามสร้าง electronic health record ที่ unified ทั่ว NHS (National Health Service)

ความเสียหาย:

  • ตั้งงบ £6B → จริง £12B+
  • National Audit Office: £10B+ wasted
  • Officially dismantled 2011
  • บางส่วน rescue ไป — ส่วนใหญ่ wasted

Project failure pattern#

1. Top-down design

  • Government ตัดสินใจระดับ national — clinician (หมอ + พยาบาล) ไม่ engage
  • ระบบ design ไม่ตรงกับ workflow จริง

2. Mega-contract = ทุกอย่างใน 1 ครั้ง

  • 5 prime contractors
  • Each contractor £1B+
  • Big bang approach

3. Vendor failure

  • Accenture pull out 2006 (เสีย £450M)
  • Fujitsu contract terminated 2008
  • iSoft (key software vendor) ล้มละลาย

4. Requirement instability

  • NHS reform ระหว่าง project = requirement เปลี่ยน
  • Spec ไม่เคย stable

5. ไม่มี clinical leadership

  • IT-driven project — clinicians มอง outsider
  • Adoption rate ต่ำ — แม้ระบบเสร็จก็ไม่ใช้

Lesson#

Mega-project + bottom-up adoption needed = ต้อง engage user ก่อน ไม่ใช่หลัง Big bang IT in healthcare = doom — ต้อง phased + iterative

💡 PM principle: ลูกค้าปลายทางไม่ engage → ระบบดี ก็ไม่ใช้


3. Heathrow Terminal 5 (2008) — building ดี, operations พัง#

สิ่งที่เกิด#

T5 เป็น project building ที่ เสร็จ on time, on budget — เป็น legend ใน construction industry

แต่: วันแรก operations chaos:

  • 42,000 bags lost ใน 10 วัน
  • 500 flights cancelled
  • BA สูญ £16M ตรง

Project failure pattern#

1. Building project ≠ operations project

  • T5 building เสร็จดี
  • T5 operations rollout (IT, training, baggage system) — ไม่ได้ rehearse end-to-end

2. Insufficient end-to-end testing

  • ระบบ test เป็นชิ้น
  • ไม่เคย test “vol full” — ระบบหัวแตก

3. Staff training ขาด

  • Staff หลายคน first day = first time
  • ไม่มี dry run

Lesson#

“Project complete” ≠ “Operations ready” Cutover/launch is its own project — ต้องมี dedicated team + plan + dry run

💡 PM principle: Build phase ≠ Go-live phase — แยก plan, แยก budget


4. Boeing 737 MAX MCAS (2018-2019) — schedule pressure killed people#

สิ่งที่เกิด#

Boeing เร่งสร้าง 737 MAX แข่งกับ Airbus A320neo

ใส่ engine ใหญ่ขึ้น — เปลี่ยน aerodynamic — เพื่อ “fix” ใส่ software ชื่อ MCAS (Maneuvering Characteristics Augmentation System)

ผลลัพธ์:

  • Lion Air JT610 (2018) — 189 ตาย
  • Ethiopian ET302 (2019) — 157 ตาย
  • รวม 346 ตาย
  • Worldwide grounding 20 เดือน
  • Boeing ขาดทุน $20B+

Project failure pattern (governance + PM combined)#

1. Schedule pressure overrode safety

  • Airbus เริ่ม A320neo ก่อน
  • Boeing ต้อง launch MAX ภายใน window แคบ
  • Engineering concern → suppressed

2. Safety analysis flawed

  • MCAS ใช้ single sensor input สำหรับ flight-critical system
  • Assumption: pilots react in 4 seconds
  • ความจริง: pilots ตกใจ 30+ seconds

3. FAA certification captured

  • Boeing’s ODA program — Boeing approve เอง (regulatory capture)
  • FAA review ไม่เข้ม

4. Pilot training suppressed

  • ถ้าต้อง pilot training extra → simulator-cost flag
  • → airlines ต้องจ่ายเพิ่ม → ขายไม่ดี
  • Boeing ระบุไม่ต้อง training — ไม่บอก pilot ด้วยซ้ำว่ามี MCAS

5. Whistleblower ignored

  • Engineers internal raise concern → suppressed

Lesson#

Schedule pressure + cost pressure overriding engineering judgment + captured oversight = ตาย

💡 PM principle: Safety-critical = never take shortcut — schedule second to safety


5. Healthcare.gov (2013) — multi-vendor + skipped testing#

สิ่งที่เกิด#

Obamacare website launch 1 ตุลาคม 2013

Day 1: crash ภายใน 2 ชั่วโมง — 6 ของผู้ใช้แรก 8M เข้าได้

Project failure pattern#

1. Multi-vendor ไม่มี master integrator

  • 55 contractors
  • ไม่มี end-to-end owner
  • Integration testing fail

2. Waterfall ใน fast-moving environment

  • 3-year project, requirement เปลี่ยนรายเดือน
  • ไม่ iterate

3. Testing ไม่พอ

  • Load testing → 500 simultaneous users (เปิด day 1 = 250,000)
  • ไม่มี penetration testing เพียงพอ

4. No tech leadership

  • Government project — leadership = lawyer + admin
  • ไม่มี CTO

Recovery#

Obama ส่ง tech surge — Silicon Valley engineers เข้ามาช่วย

  • Mikey Dickerson (Google SRE) lead
  • Daily standup, fast iteration, monitoring

ภายใน 2 เดือน — site stable

Lesson#

Tech project ต้องมี tech leadership Multi-vendor ต้องมี master integrator Big-bang launch = high risk — ทำ phased rollout ดีกว่า


6. Mythical Man-Month (Brooks 1975)#

Origin#

Fred Brooks manage IBM OS/360 (1960s) — operating system ใหญ่สุดในยุคนั้น

ตอนช้า — IBM ใส่คนเพิ่ม → ช้าลงอีก

Brooks เขียนหนังสือเป็น postmortem

Brooks’ Law#

“Adding manpower to a late software project makes it later.”

(เล่าใน EP.10)

บทเรียนอื่นจาก Brooks#

1. “No silver bullet”

  • ไม่มี technique เดียวที่ให้ 10x productivity
  • All progress เป็น 2x มากที่สุด ภายใน decade

2. “Plan to throw one away; you will, anyhow”

  • First version ของ system ผิด — sure
  • Plan ไว้ตั้งแต่ต้นว่าจะ throw away

3. “Conceptual integrity”

  • ระบบที่ออกแบบโดย 1 ใจ → simpler + better
  • Group design = compromise everywhere

7. โบนัส: Therac-25 (1985-1987) — software bug killed people#

สิ่งที่เกิด#

Therac-25 = radiation therapy machine Software bug → patient ได้ radiation 100x ที่ควรได้

6 patients ตาย หรือเสีย organ permanent

Project failure pattern#

1. Reuse software จากรุ่นเก่าโดยไม่ verify

  • Therac-25 reuse code จาก Therac-20 (ที่มี hardware lock)
  • Therac-25 ตัด hardware lock — software อย่างเดียว
  • Software bug ที่ Therac-20 ป้องกันโดย hardware → expose ใน Therac-25

2. ไม่มี independent code review 3. Race condition — เกิดเฉพาะตอน operator พิมพ์เร็ว 4. Bug report ถูก dismiss — “ไม่ reproduce” 5. No fail-safe design

Lesson#

Safety-critical software ต้องมี independent verification + redundancy + fail-safe


Common Pattern ของทุกเคส#

ลอง pattern match — เกือบทุกเคสมี อย่างน้อย 3 ใน 6 ของอาการ:

  1. Schedule pressure overriding judgment (Denver, Boeing, Heathrow)
  2. Scope creep without re-baseline (Denver, NHS)
  3. Big-bang launch without phased rollout (Healthcare.gov, NHS)
  4. Multi-vendor without master integrator (Healthcare.gov, NHS)
  5. End-user / stakeholder ไม่ engage (NHS, Boeing pilots)
  6. Testing / verification skipped (Heathrow, Therac-25, Boeing)

Bonus: Whistleblower ignored#

Boeing, Therac-25, Wells Fargo (governance EP), FTX — pattern อมตะ: คนภายในเตือนล่วงหน้าทุกเคส — แต่ถูก suppress

ระบบ governance ที่ดี = whistleblower channel ที่ใช้งานได้


ใช้ Pattern นี้ judge โปรเจคของคุณ#

ก่อนเริ่ม project — checklist:

  • Schedule realistic ไม่ใช่ politically driven?
  • Scope ชัด + change control process มี?
  • Multi-vendor — ใครเป็น master integrator?
  • End-user engaged ตั้งแต่ planning?
  • Testing + verification plan?
  • Whistleblower channel?
  • Phased rollout เลือกได้?
  • Schedule + safety conflict — process resolve ยังไง?

ถ้าตอบ “ไม่” หลายข้อ — pause ก่อนลุย


CHAOS Report — ภาพรวม#

Standish Group ตั้งแต่ 1994:

  • 16-29% successful
  • 19-31% failed (cancelled)
  • 52-53% challenged (over budget/time/scope)

McKinsey 2012: 17% ของ project ใหญ่ (>$15M) failure threaten company existence

Bent Flyvbjerg “Iron Law of Megaprojects”:

“Over budget, over time, under benefits, over and over again.”

ศึกษาจาก 16,000+ projects — IT + Olympics worst


สรุป EP นี้#

เคสที่ผ่านมา:

  • Denver Airport — scope expansion without re-baseline
  • NHS NPfIT — top-down + no clinician engagement
  • Heathrow T5 — building ดี, operations skip
  • Boeing 737 MAX — schedule pressure killed safety
  • Healthcare.gov — no tech leadership, multi-vendor chaos
  • Mythical Man-Month — adding people doesn’t help late projects
  • Therac-25 — software bug killed people, no fail-safe

Common pattern (อย่างน้อย 3 ใน 6):

  1. Schedule pressure
  2. Scope creep
  3. Big-bang launch
  4. No master integrator
  5. End-user not engaged
  6. Testing skipped

Whistleblower ignored = อมตะใน failure case

EP สุดท้าย — Certifications + Career roadmap + Closing ของซีรีส์