สารบัญ
Series: AAISM — AI Security Management สำหรับเจ้าของกิจการ (มุม Deployer/ผู้บริหาร)
ตอนที่ 27 / Domain 3 — AI Technologies and Controls (เปิด Domain 3 ฝั่งวงจรชีวิต)
(สารบัญเต็มจะตามมาครับ — ตอนนี้ขอเล่าไล่เป็นตอนๆ ไปก่อน)
📚 พื้นฐานที่ควรอ่านคู่กัน: ตอนนี้ผมจะพูดถึง “วงจรชีวิตของการพัฒนาซอฟต์แวร์ (SDLC)” และ DevSecOps เป็นจุดเทียบเคียงตลอดทั้งตอน เพราะวงจรชีวิต AI มันแทบจะถอดแบบมาจากตรงนั้น. ใครที่ยังไม่แม่นว่า “ทำไมเราต้องคิดเรื่องความปลอดภัยตั้งแต่ก่อนเขียนโค้ดบรรทัดแรก (Shift-Left)” หรือ “pipeline จากเขียนโค้ดถึงขึ้น production หน้าตาเป็นยังไง” แวะอ่าน CyberSecurity Foundation EP.34 — DevSecOps + Shift-Left ก่อนได้ครับ. ตอนนี้ผม จะไม่สอน SDLC ซ้ำ — แต่จะชี้เฉพาะ จุดที่ AI ทำให้วงจรนี้ “แปลกไป” และจุดที่ผู้บริหารต้องเลือก control ลงให้ถูกเฟส
ตอนก่อนๆ เราปิด Domain 2 ไป — เรื่อง “พนักงาน AI คนนี้เสี่ยงพังตรงไหน ใครรับผิด และห่วงโซ่ที่เขามาจากยาวแค่ไหน” พอเข้า Domain 3 เรากำลังเปลี่ยนหมวกครับ จากเดิมที่นั่งมองภาพรวมความเสี่ยง คราวนี้เรา ลงมาคุมงานจริงในแต่ละวัน — เลือกเทคโนโลยี วาง control ตัวจริง คุมข้อมูล คุมการทดสอบ คุมตอนใช้งานจริง
Domain 3 เป็นโดเมนที่ใหญ่ที่สุดและเทคนิคที่สุดของทั้งหลักสูตร และขอพูดตรงๆ เลยนะครับว่าเราไม่ได้จะมาเป็น นักวิทยาศาสตร์ข้อมูล (data scientist) ที่นั่งสร้างโมเดลเอง เราไม่ต้องรู้ว่าจะปรับ learning rate ยังไง ไม่ต้องเขียน neural network เป็น แต่เราต้องเข้าใจ “พอ” ที่จะตอบคำถามเดียวให้ได้ในทุกช่วงของงาน: “ตอนนี้ AI อยู่ช่วงไหนของชีวิต และช่วงนี้มันพังได้ยังไง ผมต้องวาง control ตัวไหนลงไป”
ตอนนี้คือ แผนที่ ของคำถามนั้น
ลองนึกภาพ — พนักงานใหม่คนนี้ก็มี “ช่วงชีวิต” ของเขา
ลองนึกภาพแบบนี้ครับ (สมมติขึ้นมาให้เห็นภาพนะครับ) — เจ้าของกิจการคนหนึ่งกำลังจะรับพนักงานใหม่เข้าทีม ถ้าเป็นพนักงานคนจริงๆ เราไม่ได้แค่ “จ้างแล้วโยนงานให้เลย” ใช่ไหมครับ มันมีลำดับอยู่:
ก่อนจะจ้าง เรา คิดก่อนว่าจะรับตำแหน่งนี้มาทำอะไร วัดผลเขายังไงถึงเรียกว่าเก่ง → จากนั้นเรา หาคนและเตรียมข้อมูลเข้างาน ประวัติ วุฒิ ความรู้ที่เขาจะใช้ → พอรับเข้ามา เราก็ เทรนเขา สอนงาน ให้ลองทำ → แล้วก่อนจะให้เขาคุยกับลูกค้าจริง เรา ทดสอบ ให้เขาลองทำงานจำลองดูก่อนว่าไหวไหม → ผ่านแล้วถึง ส่งเขาขึ้นหน้างานจริง → จากนั้น คอยดูผลงานเขาทุกวัน ว่ายังทำดีอยู่ไหม เผลอทำพลาดตรงไหนไหม → และสุดท้าย วันหนึ่งเมื่อเขาหมดประโยชน์หรือมีคนเก่งกว่ามาแทน เราก็ต้อง ให้เขาออกอย่างเรียบร้อย ส่งมอบงาน เก็บกุญแจ ปิดสิทธิ์การเข้าระบบ
AI ก็เป๊ะเลยครับ — มันมี วงจรชีวิต (AI Life Cycle) ตั้งแต่ “ยังไม่มีตัวตน” ไปจนถึง “วันที่ต้องปลดระวาง” และหัวใจที่ผมอยากให้จำทั้งตอนคือ:
ความเสี่ยงของ AI ไม่ได้หน้าตาเหมือนกันทุกช่วง — ความเสี่ยงตอนวางแผน คนละเรื่องกับตอนเก็บข้อมูล คนละเรื่องกับตอนใช้งานจริง. ถ้าเราเอา control ชุดเดียวไปครอบทุกช่วง เราจะคุมพลาด — บางช่วงคุมเกิน บางช่วงคุมไม่ถึง
นี่คือเหตุผลที่ผู้บริหารต้องรู้จัก “เฟส” ของมัน ไม่ใช่เพื่อไปสร้างโมเดล แต่เพื่อ วาง control ให้ถูกที่ถูกเวลา
ทำไมต้องเทียบกับ SDLC — และมันต่างกันตรงไหน
ในคู่มือ AAISM เปิดเรื่องวงจรชีวิต AI ด้วยประโยคที่ผมชอบมาก สรุปใจความได้ว่า “วงจรชีวิต AI ไม่ได้ต่างจากวงจรพัฒนาซอฟต์แวร์ (SDLC) มากนัก” ใครเคยทำโปรเจกต์ซอฟต์แวร์มาก็จะคุ้นกับลำดับ วางแผน ออกแบบ เขียน เทสต์ ปล่อยใช้ ดูแล ปลด อยู่แล้ว
ข่าวดีก็คือ เราไม่ต้องเริ่มจากศูนย์ กระบวนการคุมงานที่เรามีอยู่แล้ว เช่น การจัดการการเปลี่ยนแปลง (change management), การทำเอกสาร, การ sign-off ก่อนขึ้นระบบ พวกนี้เอามาใช้กับ AI ได้เกือบหมด
แต่ข่าวที่ต้องระวังก็คือ AI มี “เฟสแปลกๆ” ที่ SDLC ไม่มี และเฟสแปลกๆ นี่แหละที่ทำให้ผู้บริหารหลายคนคุมพลาด เพราะเอากระบวนการซอฟต์แวร์เดิมมาครอบแล้วคิดว่าจบ มาดูกันว่าต่างตรงไหน
| มุมเทียบ | ซอฟต์แวร์ปกติ (SDLC) | AI (AI Life Cycle) | ความต่างที่ผู้บริหารต้องระวัง |
|---|---|---|---|
| วัตถุดิบหลัก | โค้ด + ความต้องการ (requirement) | ข้อมูล เป็นพระเอก โค้ดเป็นรอง | คุณภาพข้อมูลแย่ = AI แย่ ถึงโค้ดจะเป๊ะ. มี “เฟสเก็บข้อมูล” เป็นเฟสเต็มๆ ที่ซอฟต์แวร์ปกติไม่มี |
| พฤติกรรมหลังปล่อย | ปล่อยแล้วทำงานเหมือนเดิมจนกว่าจะแก้โค้ด | เปลี่ยนพฤติกรรมเองได้ ตามข้อมูลใหม่ที่เจอ (drift) | ปล่อยแล้วลืมไม่ได้เด็ดขาด ต้องเฝ้าตลอด |
| ความเข้าใจว่ามันทำงานยังไง | อ่านโค้ดก็รู้ว่าทำไมมันตัดสินใจแบบนี้ | บ่อยครั้งเป็น “กล่องดำ” อธิบายไม่ได้ว่าทำไม | ต้องวาง control เรื่องการอธิบายได้ (explainability) ตั้งแต่ต้น |
| เวลาวัดความเสี่ยง | วัดตอนทดสอบก็ค่อนข้างชัด | เสี่ยงบางตัวซ่อนอยู่ ตอนต้นยังไม่โผล่ มาโผล่ตอนใช้ไปนานๆ | ต้องวัดความเสี่ยงซ้ำหลายรอบตลอดวงจร ไม่ใช่วัดครั้งเดียว |
ประเด็นสุดท้ายในตารางสำคัญมาก ในแนวทาง NIST (กรอบบริหารความเสี่ยง AI ของสถาบันมาตรฐานสหรัฐ — NIST AI RMF) เขาเตือนไว้ตรงๆ ว่า “ความเสี่ยงที่วัดตอนต้นวงจร อาจได้ผลไม่เหมือนกับที่วัดตอนปลายวงจร” ความเสี่ยงบางตัวมันแฝงอยู่เงียบๆ (latent) แล้วค่อยโตขึ้นเมื่อ AI ปรับตัวและวิวัฒนาการไปตามข้อมูลใหม่
แปลเป็นภาษาเจ้าของกิจการก็คือ อย่าตรวจความเสี่ยง AI แค่ตอนซื้อหรือตอนสร้างเสร็จแล้วปิดแฟ้ม มันไม่เหมือนซื้อเครื่องจักรที่ตรวจรับครั้งเดียวจบ AI ต้องตรวจซ้ำเรื่อยๆ เพราะตัวมันเองเปลี่ยนได้
อีกเรื่องที่ NIST ย้ำ — “คนละคนมองความเสี่ยงคนละมุม”
มีอีกประโยคหนึ่งในแนวทาง NIST ที่ผมว่าโดนใจคนทำธุรกิจมาก คือ คนในห่วงโซ่ AI แต่ละคน “เห็นความเสี่ยงคนละมุม”
ยกตัวอย่างที่คู่มืออธิบายไว้ (ผมเรียบเรียงใหม่): บริษัทที่ สร้างโมเดล ขึ้นมาขาย เขามองความเสี่ยงแบบหนึ่ง เพราะเขารู้ว่าโมเดลตัวนี้เก่งเรื่องอะไร ฝึกมาจากข้อมูลแบบไหน แต่เราในฐานะคน เอาโมเดลเขามาใช้ (deployer) อาจเอาไปใช้ในงานที่คนสร้างไม่เคยคิดถึง แล้วงานนั้นมันมีความเสี่ยงที่คนสร้างมองไม่เห็น เพราะเขาไม่รู้ว่าเราจะเอาไปทำอะไร
มุมผู้บริหาร: อย่าหลงเชื่อว่า “ผู้ผลิต AI ทดสอบมาให้หมดแล้ว เราเอามาใช้ได้เลย” — เพราะเขาทดสอบในบริบทของเขา ไม่ใช่บริบทของเรา. ความเสี่ยงที่เกิดจาก “เราเอาไปใช้ผิดที่” เป็นของเราเต็มๆ ไม่ใช่ของคนขาย. นี่คือเหตุผลที่ deployer ต้องทำการประเมินความเสี่ยงของตัวเองทุกครั้ง ต่อให้ซื้อของสำเร็จรูปมาก็ตาม
(เรื่อง “ใครรับผิด provider vs deployer” ผมเล่าละเอียดไปแล้วในตอนที่ 21 ใครยังไม่ได้อ่านแวะไปทบทวนได้ครับ — ตอนนี้ผมจะโฟกัสที่ “แล้วในแต่ละเฟส เราต้องทำอะไร”)
ภาพรวม 7 เฟส — แผนที่ทั้งใบก่อนลงรายละเอียด
ก่อนเดินทีละเฟส ผมขอกางแผนที่ทั้งใบให้ดูก่อน วงจรชีวิต AI ที่ใช้กันในแนวทางสากล (OECD และ NIST ใช้โครงเดียวกัน) แบ่งเป็น 7 ช่วง ดังนี้:
[1] วางแผน & ออกแบบ (Plan & Design) │ ▼ [2] เก็บ & เตรียมข้อมูล (Collect & Process Data) │ ▼ [3] สร้าง / ปรับโมเดล (Build / Adapt Model) │ ▼ [4] ทดสอบ-ประเมิน-ตรวจสอบ-ยืนยัน (Test, Evaluate, Verify, Validate = TEVV) │ ▼ [5] ปล่อยขึ้นใช้งานจริง (Deploy) │ ▼ [6] ใช้งาน & เฝ้าดู (Operate & Monitor) ←──┐ วนกลับมาประเมินซ้ำได้ │ │ (เจอปัญหา → ย้อนไปแก้เฟสก่อน) └─────────────────┘ │ ▼ [7] ปลดระวาง (Retire / Decommission)ลูกศรที่วนกลับตรงเฟส 6 สำคัญครับ — วงจรนี้ ไม่ใช่เส้นตรงทางเดียว เฟสใช้งานจริงสามารถส่งสัญญาณกลับไปให้เราย้อนไปแก้เฟสก่อนหน้าได้เสมอ (เช่น ใช้ไปแล้วเจอว่าข้อมูลที่เทรนมาเริ่มเก่า ก็ต้องวนกลับไปเฟส 2)
และนี่คือ ตารางแผนที่ความเสี่ยง ที่ผมอยากให้เป็นของฝากชิ้นใหญ่ที่สุดของตอนนี้ — แต่ละเฟส “พังได้ยังไง” และ “ผู้บริหารวาง control ตัวไหน”:
| เฟส | คำถามหลักที่ผู้บริหารต้องตอบ | ถ้าพลาดเฟสนี้ ความเสี่ยงคือ | control หลักที่ต้องวาง |
|---|---|---|---|
| 1. วางแผน & ออกแบบ | ”เราจะใช้ AI ตัวนี้ทำอะไร วัดว่าสำเร็จยังไง” | โปรเจกต์ล้มตั้งแต่ยังไม่เริ่ม / สร้างความเสี่ยงเกินจำเป็น / ไม่มีคนรับผิดชอบ | Business use case, ตั้งเป้า+ตัวชี้วัด, ประเมินความเสี่ยงรอบแรก, กำหนดคนรับผิดชอบ |
| 2. เก็บ & เตรียมข้อมูล | ”ข้อมูลที่เอามาเทรน สะอาด ถูกกฎหมาย ครบไหม” | ผลลัพธ์ผิด/มีอคติ (bias) / ละเมิดความเป็นส่วนตัว / โดนฟ้อง | ขอความยินยอม (consent), ทำความสะอาดข้อมูล, ตรวจคุณภาพ, บันทึกที่มาข้อมูล (data provenance) |
| 3. สร้าง / ปรับโมเดล | ”โมเดลที่เลือกอธิบายได้ไหม ทนทานไหม” | อธิบายไม่ได้ว่าทำไมตัดสินใจแบบนี้ (black box) / เปราะบาง | เลือกโมเดลให้เหมาะงาน, บันทึกเหตุการณ์อัตโนมัติ (logging), วางจุดให้คนตรวจ (HITL) |
| 4. ทดสอบ (TEVV) | “มันทำงานถูกตามที่ออกแบบ และตอบโจทย์ธุรกิจจริงไหม” | ปล่อยของพังขึ้น production / มีช่องโหว่ที่โดนโจมตี | Model/Stress test, ตรวจอคติ, AI red teaming, sign-off ผ่าน change management |
| 5. ปล่อยขึ้นใช้งานจริง | ”เสียบเข้าระบบเดิมแล้วพังไหม คนใช้พร้อมไหม” | ระบบเดิมล่ม / คนใช้ไม่เป็น / ผิดกฎเกณฑ์ | นำร่อง (pilot) ก่อน, ตรวจความเข้ากันได้, เอกสารส่งมอบ, เทรนพนักงาน, จัดการการเปลี่ยนแปลง |
| 6. ใช้งาน & เฝ้าดู | ”วันนี้มันยังทำดีเหมือนเดิมไหม เริ่มเพี้ยนหรือยัง” | คุณภาพค่อยๆ เสื่อม (drift) / ผลข้างเคียงที่ไม่ตั้งใจ / หลุดกฎ | วัดตัวชี้วัดคุณภาพต่อเนื่อง, ระบบจัดการคุณภาพ (QMS), ตรวจสอบ (audit) เป็นรอบ |
| 7. ปลดระวาง | ”จะเลิกใช้ยังไงให้ข้อมูลไม่หลุด งานไม่สะดุด” | ข้อมูลตกค้าง/รั่ว / สิทธิ์ค้างในระบบ / งานสะดุด | แผนปลดระวาง, ลบ/ย้ายข้อมูล, ปิดสิทธิ์, สื่อสารผู้เกี่ยวข้อง |
ทีนี้เราจะเดินทีละเฟส ลงรายละเอียดในมุม “ผู้บริหารต้องตัดสินใจและคุมอะไร” กันครับ
เฟส 1 — วางแผน & ออกแบบ (Plan & Design)
นี่คือเฟสที่ผมอยากให้เจ้าของกิจการ ลงแรงมากที่สุด เพราะมันคือเฟสที่ “ถูกที่สุด” ที่จะแก้ความผิดพลาด แก้บนกระดาษมันถูกกว่าแก้ของที่สร้างเสร็จแล้วเสมอ เหมือนหลัก Shift-Left ใน DevSecOps ที่ผมเล่าใน EP.34
เฟสนี้คือการตอบให้ชัดว่า AI ตัวนี้เกิดมาเพื่ออะไร ตั้งแต่แนวคิดของระบบ สมมติฐานที่ตั้งไว้ บริบทที่จะใช้ ความต้องการ และอาจรวมถึงการทำตัวต้นแบบ (prototype) ลองของก่อน
สิ่งที่ผู้บริหารต้องคุมในเฟสนี้:
- ตั้งเป้าและตัวชี้วัดความสำเร็จให้ชัด — “สำเร็จ” ของโปรเจกต์นี้หน้าตายังไง วัดด้วยตัวเลขอะไร. ถ้าตอบไม่ได้ตั้งแต่ต้น แปลว่าเรายังไม่พร้อมเริ่ม
- ทำเอกสาร business use case — เขียนให้ชัดว่าปัญหาคืออะไร AI จะแก้ยังไง และต้องให้ ผู้มีส่วนได้ส่วนเสีย (stakeholder) ที่เกี่ยวข้อง มาร่วมเขียน ไม่ใช่ฝ่าย IT คิดเองคนเดียว
- ดึงคนที่เกี่ยวข้องเข้ามาตั้งแต่เนิ่นๆ — คนหน้างานรู้ข้อจำกัดที่ห้องประชุมไม่รู้ การดึงเขาเข้ามาแต่ต้นทำให้ทุกคน “เป็นเจ้าของร่วม” และลดแรงต้านตอนใช้จริง
- กำหนดโครงสร้างคนรับผิดชอบ — ใครเป็นคนตัดสินใจ ใครรับผิดเรื่องจริยธรรมและกฎหมาย ต้องมีชื่อชัดตั้งแต่ตอนนี้
- ประเมินความเสี่ยงรอบแรก — รวมถึงผลกระทบเชิงจริยธรรมและสังคม โดยเฉพาะการมองหา อคติ (bias) ที่อาจซ่อนอยู่ในข้อมูลหรือตัวอัลกอริทึม และคิดวิธีลดมันไว้ล่วงหน้า
- วางกรอบการกำกับข้อมูล (data governance) — ตั้งแต่ตอนนี้เลยว่าข้อมูลจะเก็บ/ใช้/ทิ้งยังไงให้เคารพความเป็นส่วนตัวและไม่ผิดกฎหมาย
ตัวต้นแบบ (prototype) เป็นเครื่องมือสำคัญของเฟสนี้ มันให้เราลองของจริงเล็กๆ เพื่อพิสูจน์ว่าแนวคิดเวิร์กไหม เจอปัญหาตั้งแต่ยังเล็ก ก่อนจะทุ่มงบเต็มที่
มุมผู้บริหาร: กับดักที่เจอบ่อยที่สุดในเฟสนี้คือ “เห่อเทคโนโลยีจนลืมถามว่าจะแก้ปัญหาอะไร” — เห็นคู่แข่งใช้ AI ก็อยากใช้บ้าง สั่งทีมไปทำเลยโดยไม่มี use case ชัด. คำถามที่ผู้บริหารต้องถามให้ได้ก่อนเซ็นอนุมัติงบคือ: “ถ้าโปรเจกต์นี้สำเร็จ ตัวเลขธุรกิจตัวไหนจะดีขึ้น และเราจะรู้ได้ยังไงว่ามันดีขึ้นเพราะ AI ตัวนี้จริงๆ” ถ้าทีมตอบไม่ได้ ให้กลับไปคิดก่อน อย่าเพิ่งอนุมัติ
กับดักที่พบบ่อยในเฟส 1:
- คิดว่า “เดี๋ยวค่อยคิดเรื่องความเสี่ยงตอนใกล้ขึ้นระบบ” — ผิด ยิ่งคิดช้ายิ่งแก้แพง
- ตั้งเป้าแบบลอยๆ (“เพิ่มประสิทธิภาพ”) วัดผลไม่ได้ พอจบโปรเจกต์ก็เถียงกันว่าสำเร็จหรือไม่
- ไม่มีใครเซ็นชื่อรับผิดชอบ พอเกิดปัญหาก็โยนกันไปมา
เฟส 2 — เก็บ & เตรียมข้อมูล (Collect & Process Data)
นี่คือเฟสที่ ต่างจาก SDLC ชัดที่สุด และเป็นเฟสที่ผู้บริหารมักประเมินค่าต่ำเกินไป เพราะมันดูเป็นงาน “เทคนิคน่าเบื่อ” แต่จำประโยคนี้ไว้ครับ: คุณภาพของข้อมูล = คุณภาพของ AI โดยตรง ข้อมูลขยะเข้าไป ผลขยะออกมา ต่อให้โมเดลเทพแค่ไหนก็ช่วยไม่ได้
ถ้าพลาดเฟสนี้ AI จะออกผลลัพธ์ที่ ผิดเพี้ยน มีอคติ และเสี่ยงผิดกฎหมายความเป็นส่วนตัว มาดูกันว่าเฟสนี้ทำอะไรและผู้บริหารต้องคุมตรงไหน:
1) เก็บข้อมูล (Collect) — รวบรวมข้อมูลจากหลายแหล่ง ทั้งแบบมีโครงสร้าง (ตาราง) และไม่มีโครงสร้าง (ข้อความ รูป เสียงเซ็นเซอร์). จุดที่ผู้บริหารต้องคุมแบบห้ามพลาดคือ:
ต้องได้ “ความยินยอม” (consent) สำหรับข้อมูลทุกชุดที่เอามาใช้สร้าง AI — ถ้าเก็บข้อมูลลูกค้ามาเทรน AI โดยไม่ได้ขออนุญาตและไม่ได้แจ้งให้เขารู้ เราอาจละเมิดกฎหมายคุ้มครองข้อมูลส่วนบุคคลหลายฉบับพร้อมกัน และเปิดทางให้โดนฟ้องโดยไม่จำเป็น
2) ทำความสะอาดข้อมูล (Clean) — กำจัดข้อมูลที่ขัดแย้งกัน ซ้ำซ้อน หรือผิดพลาดออก ให้เหลือแต่ข้อมูลที่ถูกต้องและใช้งานได้
3) ตรวจความครบและคุณภาพ (Completeness & Quality Check) — เช็กว่าชุดข้อมูลครอบคลุมขอบเขตที่ต้องการไหม ตอบโจทย์ business case ที่ตั้งไว้ในเฟส 1 ไหม. ต้องดูทั้ง:
- ข้อมูลที่ ขาดหาย (missing) — มีช่องว่างตรงไหนที่จะทำให้ผลเพี้ยน
- ความผิดปกติและค่าโดดๆ (anomalies & outliers) ที่อาจดึงผลให้เบี้ยว
- ความสดใหม่และตรงประเด็น — ข้อมูลเก่าเกินไปหรือไม่เกี่ยวกับเป้าหมายธุรกิจหรือเปล่า
4) บันทึกที่มาของข้อมูล (Data Provenance) — อันนี้เป็น control ที่ผู้บริหารต้องบังคับให้มี เพราะมันคือ หลักฐานความโปร่งใสและความรับผิดชอบ ของทั้งโปรเจกต์. เอกสารที่มาข้อมูลควรบอก:
| บันทึกอะไร | เพื่ออะไร |
|---|---|
| ข้อมูลมาจากไหน เก็บด้วยวิธี/เครื่องมืออะไร | ถ้ามีปัญหาภายหลัง ตามรอยกลับได้ว่าต้นตอจากแหล่งไหน |
| องค์ประกอบของชุดข้อมูล (ชนิด จำนวน การกระจายตัว) | รู้ว่าข้อมูลเอนเอียงไปทางไหน ช่วยจับ bias |
| ตั้งใจเอาไปใช้กับงานอะไร | กันการเอาข้อมูลไปใช้ผิดวัตถุประสงค์ (และผิดกฎหมาย) |
| ดูแล/แก้ไขข้อมูลยังไงเมื่อเวลาผ่านไป (version, นโยบายเก็บข้อมูล) | ตรวจสอบย้อนหลัง (audit) ได้ |
มุมผู้บริหาร: เฟสนี้คือจุดที่ความเสี่ยง “กฎหมาย” กับ “อคติ” เข้ามาพร้อมกัน และทั้งสองเรื่องตกเป็นภาระของเจ้าของกิจการ ไม่ใช่ของทีมเทคนิค. คำถามที่ต้องถามทีมคือ — “ข้อมูลทุกชุดที่เอามาเทรน เรามีสิทธิ์ใช้ตามกฎหมายไหม (consent/สัญญา)” และ “ข้อมูลชุดนี้เป็นตัวแทนของลูกค้าจริงของเราไหม หรือเอียงไปทางกลุ่มใดกลุ่มหนึ่ง” — ข้อหลังคือต้นตอของ AI ที่ “เหยียด” หรือตัดสินใจไม่เป็นธรรม ซึ่งทำลายชื่อเสียงบริษัทได้ในชั่วข้ามคืน
กับดักที่พบบ่อยในเฟส 2:
- เอาข้อมูลลูกค้าเก่ามาเทรนโดยไม่เช็กว่าตอนเก็บมาได้ขอ consent ให้ใช้กับ AI หรือเปล่า
- “ข้อมูลเยอะไว้ก่อน” โดยไม่ตรวจคุณภาพ — ขยะเยอะก็คือ AI ที่แม่นยำน้อยลง
- ไม่ทำเอกสารที่มาข้อมูล พอ auditor หรือหน่วยงานกำกับมาถาม “ข้อมูลนี้มาจากไหน” ตอบไม่ได้
เฟส 3 — สร้าง / ปรับโมเดล (Build / Adapt Model)
เฟสนี้คือหัวใจฝั่งเทคนิค คือการเปลี่ยนข้อมูลที่เตรียมไว้ให้กลายเป็น “สมอง” ที่ใช้งานได้ ขั้นตอนคร่าวๆ ก็คือเลือกหรือสร้างโมเดล แล้วปรับจูน (calibrate) และเทรน จากนั้นตีความผลที่ออกมา
ตรงนี้ผมขอย้ำอีกครั้งว่า เราไม่ได้จะลงไปทำเอง งานนี้เป็นของทีมเทคนิค สิ่งที่ผู้บริหารต้องเข้าใจคือ “มันมีขั้นตอนอะไร และต้องวาง control ตัวไหน” เท่านั้น:
- เลือกโมเดล/อัลกอริทึมให้เหมาะกับงาน — เลือกตามธรรมชาติของข้อมูล ความซับซ้อนของปัญหา และผลลัพธ์ที่อยากได้. (เลือกผิดประเภท = ทำงานไม่มีประสิทธิภาพ หรือผลไม่แม่น)
- ปรับจูนและเทรน (Calibrate & Train) — การปรับจูนคือการปรับค่าพารามิเตอร์ของโมเดลให้แม่นขึ้น เป็นงานที่ต้องวนทำซ้ำหลายรอบ ลองแล้วปรับ. การเทรนคือป้อนข้อมูลปริมาณมากให้มันเรียนรู้แพตเทิร์น
แต่สอง control ต่อไปนี้คือสิ่งที่ผู้บริหารต้อง บังคับให้มี เพราะมันคือเกราะป้องกันความเสี่ยงในมุมบริหารโดยตรง:
1) การอธิบายได้ (Explainability) — โมเดลมาถึงคำตอบนี้ได้ยังไง อะไรคือตัวแปรหลักที่มีผลต่อการตัดสินใจ เรื่องนี้สำคัญไม่ใช่แค่เชิงเทคนิค ลองคิดดูว่าถ้า AI ปฏิเสธสินเชื่อลูกค้า แล้วลูกค้าถามว่า “ทำไม” เราต้องตอบได้ ไม่งั้นทั้งเสียลูกค้าและอาจผิดกฎหมาย โมเดลที่อธิบายไม่ได้เลย (กล่องดำสนิท) คือความเสี่ยงทางธุรกิจ ไม่ใช่แค่เรื่องเทคนิค
2) การบันทึกเหตุการณ์อัตโนมัติ (Automated Event Recording / Logging) — ออกแบบให้ระบบจดบันทึกทุกการกระทำและการตัดสินใจสำคัญของ AI ไว้อัตโนมัติ. ทำไมผู้บริหารต้องสน — เพราะ log นี้คือสิ่งที่ทำให้เรา:
- เฝ้าดูและตรวจสอบ (monitor & audit) ได้ว่า AI ทำอะไรไปบ้าง
- จับความผิดปกติได้ทันท่วงที
- มีหลักฐานเวลาเกิดเหตุ ว่า AI ตัดสินใจอะไร เมื่อไหร่ บนข้อมูลอะไร
3) วางจุดให้คนเข้ามาตรวจ (Human-in-the-loop = HITL) — ออกแบบให้มี “คน” คอยตรวจและยืนยันการตัดสินใจของ AI ที่จุดสำคัญๆ มันคือการเอาจุดแข็งของคน (วิจารณญาณ) มาเสริมจุดแข็งของ AI (ความเร็ว) HITL เป็นเรื่องใหญ่ที่ผมจะเล่าละเอียดในตอนหลังของ Domain 3 ตอนนี้แค่จำว่า เฟสสร้างโมเดลต้องออกแบบ “ช่องให้คนแทรกได้” ไว้ตั้งแต่แรก ไม่ใช่ไปแปะทีหลัง
มุมผู้บริหาร: อย่าปล่อยให้ทีมเทคนิคเลือกโมเดลโดยดูแค่ “ตัวไหนแม่นที่สุด” — เพราะโมเดลที่แม่นที่สุดมักเป็นโมเดลที่อธิบายยากที่สุด (กล่องดำ). ในงานที่กระทบลูกค้าโดยตรง (สินเชื่อ จ้างงาน ประกัน) ผู้บริหารควรยอมแลก “ความแม่นนิดหน่อย” กับ “อธิบายได้และตรวจสอบได้” เพราะวันที่โดนถาม/โดนฟ้อง สิ่งที่ช่วยเราคือ “อธิบายได้” ไม่ใช่ “แม่นที่สุด”
กับดักที่พบบ่อยในเฟส 3:
- ไล่ตามความแม่นยำอย่างเดียวจนได้โมเดลที่อธิบายไม่ได้ พอเอาไปใช้กับงานที่ต้องให้เหตุผลก็ติดล็อก
- ไม่ทำ logging ตั้งแต่ต้น พอเกิดเหตุก็ไม่มีหลักฐานว่า AI ทำอะไรไป
- คิดว่า HITL คือ “เดี๋ยวค่อยใส่ทีหลัง” — แต่ระบบที่ไม่ได้ออกแบบช่องให้คนแทรก จะแทรกทีหลังแทบไม่ได้
เฟส 4 — ทดสอบ-ประเมิน-ตรวจสอบ-ยืนยัน (TEVV)
เฟสนี้คำเต็มยาวมาก Test, Evaluate, Verify, Validate (TEVV) แต่ผมขอแปลแก่นให้จำง่ายเป็น 2 คำถาม:
- Verify (สร้างถูกไหม): โมเดลถูกสร้างตรงตามที่ออกแบบไว้หรือเปล่า
- Validate (ตอบโจทย์ไหม): โมเดลทำงานได้ผลถูกต้องเชื่อถือได้ และ ตอบโจทย์ธุรกิจที่ตั้งไว้ตั้งแต่เฟส 1 จริงไหม
ความต่างของสองคำนี้สำคัญนะครับ “สร้างถูกตามสเปก” ไม่เท่ากับ “ตอบโจทย์จริง” เราอาจสร้างของได้ตรงสเปกเป๊ะ แต่สเปกนั้นแก้ปัญหาธุรกิจไม่ได้ก็เป็นได้
control สำคัญของผู้บริหาร: การทดสอบ AI ต้องเดินผ่านกระบวนการจัดการการเปลี่ยนแปลง (change management) เดียวกับระบบอื่นในบริษัท และต้องทดสอบเทียบกับ business justification เดิม ไม่ใช่แค่ทดสอบว่า “มันรันได้”
วิธีทดสอบมีหลายแบบ ผมเรียบเรียงเป็นตารางให้เห็นว่าแต่ละแบบ “กันความเสี่ยงตัวไหน”:
| วิธีทดสอบ | ทดสอบอะไร | กันความเสี่ยงอะไร |
|---|---|---|
| Model testing | วัดผลเทียบกับเกณฑ์มาตรฐาน (ความแม่น precision recall ฯลฯ) | AI ทำงานไม่แม่นพอใช้งานจริง |
| Stress testing | โยนสถานการณ์สุดขั้ว/เคสประหลาด (edge case) ใส่ | AI พังเมื่อเจอ input ที่ไม่คาดคิด |
| Comparative analysis | เทียบกับโมเดลเดิมหรือ baseline | ไม่รู้ว่าของใหม่ดีกว่าของเดิมจริงไหม |
| Bias & fairness checks | เช็กว่าโมเดลเอนเอียง/เลือกปฏิบัติกับกลุ่มใดไหม | AI ตัดสินใจไม่เป็นธรรม → เสียชื่อ + ผิดกฎหมาย |
| Scenario analysis | จำลองสถานการณ์สมมติว่ามันจะตอบสนองยังไง | คาดเดาพฤติกรรมในโลกจริงไม่ได้ |
AI Red Teaming — จ้างคนมา “แกล้งเป็นโจร”
ส่วนที่ขาดไม่ได้ของ TEVV ในมุมความปลอดภัยคือ AI Red Teaming คือการจำลองตัวเป็นศัตรูจริงๆ ใช้เครื่องมือ กลยุทธ์ และวิธีการแบบที่ผู้ไม่หวังดีใช้ เพื่อหาช่องโหว่ จุดบอด และทดสอบสมมติฐานของเราว่ามันจริงไหม
red teaming แบ่งได้ 2 ระดับ:
- ระดับโมเดลพื้นฐาน (Base model red teaming): หาว่าโมเดลถูกเอาไปใช้ในทางที่ผิดได้ยังไง ทดสอบขีดความสามารถจริง และหาขีดจำกัดของมัน
- ระดับแอปพลิเคชัน (Application level red teaming): ทดสอบทั้งระบบที่เอาโมเดลไปประกอบเป็นแอป หาจุดพังที่อยู่ “นอกเหนือ” เกราะความปลอดภัยของตัวโมเดลเอง และดูความปลอดภัยเฉพาะของแอปนั้น
(พวกช่องโหว่ AI เฉพาะทาง เช่น prompt injection, data poisoning — ผมอ้างอิงกรอบสาธารณะอย่าง OWASP Top 10 for LLM และ MITRE ATLAS ไว้ และจะลงรายละเอียดในตอนความปลอดภัยของ Domain 3 — ในเฟส TEVV นี้สิ่งที่ผู้บริหารต้องรู้คือ “ต้องมีการแกล้งโจมตีตัวเองก่อนปล่อยจริง”)
ปิดเฟสด้วย sign-off: บทเรียนจากการทดสอบต้องเอาไปแก้และปรับปรุงก่อนขึ้น production ถ้าเจอความเสี่ยง ต้องทำ แผนลดความเสี่ยงเป็นเอกสาร หรือใส่เข้า risk register ของโปรเจกต์ และของที่ผ่านการทดสอบแล้วเท่านั้นถึงจะได้รับอนุญาตให้ขึ้น production ตามกระบวนการ change management
มุมผู้บริหาร: เฟสนี้คือ “ด่านสุดท้ายก่อนปล่อยของ” และเป็นจุดที่ผู้บริหารต้องมี อำนาจสั่งหยุด (go/no-go) อยู่ในมือ. คำถามที่ต้องถามก่อนเซ็นอนุมัติขึ้นระบบคือ — “เราได้แกล้งโจมตีมันเองหรือยัง (red team), มันผ่านการตรวจอคติหรือยัง, และความเสี่ยงที่ยังเหลือเรายอมรับได้ตามความเสี่ยงที่บริษัทรับได้ (risk appetite) ไหม” — ถ้าทีมบอกว่า “ยัง แต่อยากปล่อยก่อนเพราะลูกค้ารอ” นั่นคือสัญญาณอันตราย อย่ายอม
กับดักที่พบบ่อยในเฟส 4:
- ทดสอบแค่ “เคสปกติ” ไม่ทดสอบเคสประหลาด (edge case) — แล้วไปพังหน้าลูกค้า
- ข้าม bias check เพราะ “ดูเป็นเรื่องวิชาการ” — จนกลายเป็นข่าวว่า AI บริษัทเลือกปฏิบัติ
- ปล่อยขึ้นระบบโดยไม่ผ่าน sign-off เป็นทางการ พอพังก็ไม่มีใครรับผิดชอบ
เฟส 5 — ปล่อยขึ้นใช้งานจริง (Deploy)
ผ่านด่านทดสอบแล้ว ก็ถึงเวลา เอา AI ขึ้นใช้งานจริง เฟสนี้ฟังดูเหมือนแค่ “กดปุ่ม launch” แต่จริงๆ มีงานคุมหลายอย่าง:
- นำร่องก่อน (Piloting) — ทดสอบในวงจำกัด/สภาพแวดล้อมควบคุม ก่อนปล่อยเต็มสเกล เพื่อจับปัญหา วัดผล และเก็บ feedback จากผู้ใช้จริงกลุ่มเล็กก่อน. มันคือ proof of concept รอบสุดท้ายในสภาพจริง
- ตรวจความเข้ากันได้กับระบบเดิม (Compatibility) — AI มักต้องเสียบเข้ากับระบบและซอฟต์แวร์เดิมที่บริษัทใช้อยู่ การเช็กว่ามันทำงานร่วมกันได้ช่วยกันไม่ให้ระบบเดิมล่ม. อาจต้องปรับจูนทางเทคนิค ทำตัวเชื่อม (integration) หรือกระทั่งอัปเดตระบบเดิม
- ดูแลถึงบุคคลที่สามและผู้นำไปใช้ปลายทาง (downstream deployers) — ถ้าเราส่ง AI ต่อให้คนอื่นใช้ ต้องให้คำแนะนำการติดตั้ง ตั้งค่า แก้ปัญหา และดูแลรักษาที่ชัดเจน
- เอกสารทางเทคนิคโดยละเอียด — ทำไว้ตลอดกระบวนการพัฒนาและเก็บรักษาตลอดวงจรชีวิต. เอกสารนี้ทำ 2 หน้าที่: (1) เป็นคู่มือส่งมอบ และ (2) เป็น หลักฐานความสอดคล้องตามกฎเกณฑ์ (compliance) — รวมคำแนะนำ การประเมินความเสี่ยง การ map กับข้อกำหนดกฎหมาย ฯลฯ
- จัดการการเปลี่ยนแปลงคน (Organizational Change Management) — นี่คือจุดที่ผู้บริหารมักลืม. การปล่อย AI ไม่ใช่แค่เรื่องเทคนิค แต่คือการเปลี่ยนวิธีทำงานของคน:
- เทรนพนักงาน ให้เข้าใจบทบาทและหน้าที่ใหม่
- สร้างการรับรู้และการยอมรับ (buy-in) — คนกลัว AI มาแย่งงานจะต่อต้านเงียบๆ
- มี ช่องทางรับ feedback ที่กระตุ้นให้เจ้าของระบบ AI ลงมือแก้เมื่อผู้ใช้เจอปัญหา
มุมผู้บริหาร: โปรเจกต์ AI ส่วนใหญ่ที่ล้ม ไม่ได้ล้มเพราะ “เทคโนโลยีไม่ดี” แต่ล้มเพราะ “คนไม่ใช้” หรือ “ใช้ผิด”. เฟสนี้คือเฟสที่ภาวะผู้นำ (ไม่ใช่ทักษะเทคนิค) ตัดสินความสำเร็จ. คำถามผู้บริหาร: “พนักงานที่ต้องทำงานกับ AI ตัวนี้ เข้าใจไหมว่ามันมาช่วยหรือมาแทน, เขาได้รับการเทรนหรือยัง, และถ้าเขาเจอว่า AI ตอบผิด เขารู้ไหมว่าต้องบอกใคร” — ถ้าตอบไม่ได้ครบ การ deploy นั้นเสี่ยงเงียบ
กับดักที่พบบ่อยในเฟส 5:
- ปล่อยเต็มสเกลทันทีโดยไม่ทำ pilot — พังทีก็พังทั้งบริษัท
- ลืมว่าระบบเดิมต้องคุยกับของใหม่ พอเสียบเข้าไประบบเดิมรวน
- โฟกัสแต่เทคนิค ลืมเทรนคน — ของดีแต่ไม่มีใครใช้เป็น
เฟส 6 — ใช้งาน & เฝ้าดู (Operate & Monitor)
นี่คือเฟสที่ ยาวที่สุด (กินเวลาเป็นปีๆ) และเป็นเฟสที่ทำให้ AI ต่างจากเครื่องจักรทั่วไปมากที่สุด เพราะ AI ไม่ได้อยู่นิ่งหลังปล่อย มันเปลี่ยนพฤติกรรมเองได้ตามข้อมูลที่เจอใหม่ เฟสนี้จึงเป็น “กระบวนการต่อเนื่องและพลวัต” ที่ต้องเฝ้าดูตลอด ไม่ใช่ตั้งแล้วลืม
งานหลักของเฟสนี้:
- ดูแลงานประจำวัน ของ AI ให้ทำงานได้ปกติ
- วัดและบันทึกตัวชี้วัดคุณภาพ (quality metrics) อย่างเป็นระบบ — ไม่ใช่ดูตอนเสียแล้วค่อยดู แต่วัดต่อเนื่องเพื่อจับ “อาการเสื่อม” แต่เนิ่นๆ
- ประเมินทั้งผลที่ตั้งใจและผลที่ไม่ได้ตั้งใจ (intended & unintended consequences) — AI อาจสร้างผลข้างเคียงที่เราไม่ได้คิดไว้ ต้องมีกลไกจับให้ได้ ว่ามันยังตรงกับเป้าธุรกิจและยังอยู่ในกรอบจริยธรรมไหม
- ตั้งระบบจัดการคุณภาพ (Quality Management System = QMS) — ช่วยให้สอดคล้องกับมาตรฐานและกฎเกณฑ์ โดยใช้เอกสารชุดเดิมที่ทำมาตั้งแต่เฟสก่อนๆ (เอกสารเทคนิค การประเมินความเสี่ยง compliance mapping) มาดูแลต่อเนื่อง พร้อม ตรวจสอบ (audit) และอัปเดตเป็นรอบ
จุดที่ผมอยากเน้นที่สุดในเฟสนี้คือเรื่อง “การเสื่อมของโมเดล (drift)” แม้คู่มือจะไม่ได้ใช้คำนี้ตรงๆ แต่นี่คือหัวใจของการ monitor เลย: โลกเปลี่ยน ข้อมูลเปลี่ยน พฤติกรรมลูกค้าเปลี่ยน แต่โมเดลเรายังเทรนมาจากโลกเก่า AI ที่เคยแม่น 95% เมื่อปีก่อน อาจเหลือ 70% ปีนี้โดยที่ไม่มีใครรู้ ถ้าไม่ได้เฝ้าวัด
มุมผู้บริหาร: กับดักใหญ่ที่สุดของทั้งวงจรอยู่ที่เฟสนี้ — “ปล่อยแล้วลืม”. ผู้บริหารหลายคนคิดว่า AI ขึ้นระบบแล้วคือจบโปรเจกต์ ตัดงบ ปลดทีม. แต่ AI ที่ไม่มีคนเฝ้า คือ AI ที่ค่อยๆ เพี้ยนโดยไม่มีใครรู้จนกลายเป็นปัญหาใหญ่. คำถามผู้บริหาร: “ใครเป็นเจ้าของ AI ตัวนี้หลังขึ้นระบบ, เราดูตัวเลขคุณภาพมันบ่อยแค่ไหน, และเรามีเกณฑ์ชัดไหมว่าคุณภาพตกถึงระดับไหนต้องสั่งหยุด/เทรนใหม่” — ต้องกันงบและคนสำหรับเฟสนี้ไว้ตั้งแต่อนุมัติโปรเจกต์ ไม่ใช่คิดว่าจบที่ deploy
กับดักที่พบบ่อยในเฟส 6:
- “ปล่อยแล้วลืม” — ไม่มีใครเฝ้า ไม่มีใครเป็นเจ้าของหลังขึ้นระบบ
- ดูแค่ว่า “ระบบล่มไหม” แต่ไม่ดูว่า “คำตอบมันยังถูกไหม” — AI ทำงานปกติแต่ตอบผิดได้
- ไม่มีเกณฑ์ชัดว่า “เสื่อมถึงไหนต้องลงมือ” จนปัญหาโตเกินแก้
เฟส 7 — ปลดระวาง (Retire / Decommission)
เฟสสุดท้าย คือการ ให้ AI “ออกจากงาน” ซึ่งหลายบริษัทไม่เคยคิดถึงเลย แล้วก็ทิ้งระบบเก่าค้างไว้จนกลายเป็นความเสี่ยงเงียบ
AI ถูกปลดระวางได้จาก 2-3 สาเหตุ:
- มัน ล้าสมัย ใช้ไม่ได้ตามวัตถุประสงค์เดิมแล้ว
- มี ทางเลือกใหม่ที่ดีกว่า มาแทน
- หรือจาก กระบวนการประเมินความเสี่ยง/ตรวจสอบ พบว่าความเสี่ยงรวมของมัน เกินระดับที่ผู้บริหารยอมรับได้ (risk appetite) แล้ว — ข้อนี้สำคัญ เพราะมันแปลว่า “การปลดระวาง” เป็นการตัดสินใจเชิงบริหาร ไม่ใช่แค่เรื่องเทคนิค
เมื่อตัดสินใจปลดแล้ว ต้องทำ แผนปลดระวาง (decommissioning plan) ที่เดินผ่าน change management เหมือนเฟสอื่นๆ โดยครอบคลุม:
- การย้ายหรือลบข้อมูล (data migration / deletion) — ข้อมูลที่ค้างในระบบ AI ที่เลิกใช้คือความเสี่ยงรั่วไหล ต้องจัดการให้เรียบร้อย
- การจัดการการเชื่อมต่อกับระบบอื่น (integration) — ถอดออกยังไงไม่ให้ระบบอื่นที่พึ่งมันอยู่พังตาม
- ความต่อเนื่องของงาน (continuity of operations) — งานที่ AI ตัวนี้เคยทำ ต้องมีคน/ระบบอื่นรับช่วงต่อ ไม่ให้สะดุด
- สื่อสารกับผู้เกี่ยวข้องให้ชัด — ตั้งความคาดหวัง ลดการกระทบกระเทือนช่วงเปลี่ยนผ่าน
มุมผู้บริหาร: การปลดระวาง AI คือเรื่องเดียวกับการ “ปิดสิทธิ์พนักงานที่ลาออก” — ถ้าทำไม่เรียบร้อย กุญแจยังอยู่ในมือคนนอก ข้อมูลยังเข้าถึงได้. AI ที่เลิกใช้แต่ไม่ได้ถอดให้เรียบร้อย = ข้อมูลตกค้าง + ช่องโหว่ที่ไม่มีใครดูแล. คำถามผู้บริหาร: “ตอนเลิกใช้ ข้อมูลที่มันเคยเข้าถึงถูกลบ/ย้ายหมดไหม, สิทธิ์การเข้าระบบถูกปิดไหม, และงานที่มันเคยทำมีคนรับช่วงต่อหรือยัง” — ปลดระวางที่ดีคือการ “ปิดประตูให้สนิท” ไม่ใช่แค่ “เลิกเปิดเครื่อง”
กับดักที่พบบ่อยในเฟส 7:
- เลิกใช้แบบเงียบๆ ไม่มีแผน — ข้อมูลและสิทธิ์ค้างในระบบนานเป็นปี
- ลืมว่ามีระบบอื่นพึ่ง AI ตัวนี้อยู่ พอถอดออกระบบอื่นพังตาม
- ไม่จัดการข้อมูลที่ค้าง — กลายเป็นจุดรั่วที่หน่วยงานกำกับจับได้ภายหลัง
สรุป Domain 3 ฝั่งวงจรชีวิต — แผนที่ใบเดียวที่ผู้บริหารต้องพกติดตัว
ถ้าจะให้สรุปทั้งตอนเหลือประโยคเดียว ผมจะบอกว่า AI ไม่ใช่ของที่ “ซื้อมาแล้วใช้ตลอดไป” แต่คือพนักงานที่มีชีวิต มีช่วงเริ่ม ช่วงโต ช่วงทำงาน และช่วงต้องให้ออก และความเสี่ยงของมันก็เปลี่ยนหน้าตาไปทุกช่วง
หน้าที่ของผู้บริหารใน Domain 3 ฝั่งนี้ ไม่ใช่การลงไปสร้างโมเดลเอง แต่คือการ รู้ว่าตอนนี้ AI อยู่เฟสไหน และวาง control ให้ถูกเฟส:
- วางแผน & ออกแบบ — ลงแรงมากที่สุด ตั้งเป้าให้ชัด หาคนรับผิดชอบ ประเมินเสี่ยงรอบแรก
- เก็บ & เตรียมข้อมูล — คุม consent + คุณภาพ + ที่มาข้อมูล (เฟสที่ SDLC ไม่มี)
- สร้าง / ปรับโมเดล — บังคับให้มี explainability + logging + ช่อง HITL
- ทดสอบ (TEVV) — ถือ go/no-go ไว้ในมือ ต้อง red team + ตรวจ bias ก่อนปล่อย
- ปล่อยขึ้นใช้งาน — pilot ก่อน + เทรนคน + จัดการการเปลี่ยนแปลง
- ใช้งาน & เฝ้าดู — เฟสยาวที่สุด ห้าม “ปล่อยแล้วลืม” ต้องกันงบ+คนไว้
- ปลดระวาง — ปิดประตูให้สนิท ลบข้อมูล ปิดสิทธิ์ ส่งมอบงาน
และอย่าลืมหลักจาก NIST 2 ข้อ — (1) วัดความเสี่ยงซ้ำตลอดวงจร เพราะความเสี่ยงบางตัวซ่อนตอนต้นแล้วโตตอนปลาย และ (2) เราในฐานะ deployer เห็นความเสี่ยงคนละมุมกับคนสร้าง ฉะนั้นต่อให้ซื้อของสำเร็จมา ก็ต้องประเมินเสี่ยงในบริบทของเราเองเสมอ
ตอนนี้เราได้ “แผนที่เวลา” ของ AI แล้วว่ามันเดินจากเกิดถึงปลดยังไง และความเสี่ยงเปลี่ยนหน้าตาตรงไหนบ้าง ตอนต่อๆ ไปของ Domain 3 เราจะซูมเข้าไปในเฟสที่ “วัตถุดิบ” สำคัญที่สุดอยู่ นั่นคือเรื่อง ข้อมูล ว่าจะกำกับ (governance) และรักษาความปลอดภัย (security) ของข้อมูลที่หล่อเลี้ยงพนักงาน AI คนนี้ยังไง เพราะอย่างที่เราเห็นในเฟส 2 แล้วว่า ข้อมูลพังเมื่อไหร่ AI ก็พังตาม
อ้างอิงแนวคิด: AAISM — Domain 3: Section 3.3 (AI Life Cycle Phases). โครงวงจรชีวิต 7 เฟสอ้างอิงแนวทางสาธารณะของ OECD AI Principles และ NIST AI RMF 1.0 (NIST AI 100-1) เรื่องการวัดความเสี่ยงตลอดวงจรและมุมมองความเสี่ยงที่ต่างกันของ AI actors. กรอบความปลอดภัย AI สาธารณะที่อ้างถึง: OWASP Top 10 for LLM Applications และ MITRE ATLAS. ตัวอย่างทั้งหมดในบทเป็นกรณีสมมติเพื่อประกอบความเข้าใจ ไม่ใช่เหตุการณ์จริงของผู้เขียน