925 คำ
5 นาที
AI 101 EP.12 — เมื่อโมเดลพัง — overfitting, bias, model drift, black box
สารบัญ

AI 101 — ปัญญาประดิษฐ์ฉบับภาษาคน · Part 1 (เบื้องหลัง: AI ทำงานยังไง) ซีรีส์นี้ผมเขียนให้เจ้าของกิจการกับคนทำงานทั่วไปที่ไม่ใช่สาย IT อ่านสนุกๆ แต่ได้ของกลับไปใช้จริง ไม่มีศัพท์ยากๆ ขู่ให้กลัว ตอนนี้เป็นเรื่อง “เมื่อโมเดลพัง” — เราเปิดฝาดูกันมาหลายตอนแล้วว่า AI ข้างในมันคิดยังไง ตอนนี้ถึงคิวที่ผมว่าสำคัญที่สุด คือเวลามัน คิดผิด เนี่ย มันพังหน้าตายังไง แล้วทำไมเราถึงต้องคอยจ้องดูมันตลอดเวลาไม่ได้ปล่อยให้มันทำงานเองลอยๆ (สารบัญเต็มของซีรีส์จะตามมาทีหลังนะครับ)

ลองนึกภาพฉากนี้ดูก่อนครับ#

สมมติว่ามีเจ้าของกิจการคนหนึ่ง เปิดร้านขายของมาหลายปี ตัดสินใจลงทุนซื้อระบบ AI มาช่วยทำงานสักอย่าง สมมติว่าเป็น AI ช่วยคัดว่าลูกค้ารายไหนน่าจะเป็นลูกค้าดี ควรปล่อยให้ซื้อแบบผ่อนจ่ายได้ รายไหนเสี่ยงเบี้ยวควรให้จ่ายสดอย่างเดียว

เดือนแรกมันทำงานได้สวยมากครับ แม่นเป๊ะ เจ้าของยิ้มแก้มปริ บอกใครต่อใครว่า “เฮ้ย ของมันดีจริง คุ้มค่าเงิน” พนักงานก็เริ่มไว้ใจมัน ปล่อยให้มันตัดสินใจเองได้เลยไม่ต้องมานั่งเช็ก

ผ่านไปครึ่งปี… อยู่ๆ ยอดหนี้เสียก็ค่อยๆ ไต่ขึ้นเงียบๆ ลูกค้าที่ AI บอกว่า “ปล่อยได้เลย ดีแน่นอน” หลายรายกลับเบี้ยวหนี้ พอเรียกทีมมานั่งดู ก็งงกันทั้งวง เพราะระบบมันไม่ได้ขึ้นจอแดง ไม่มี error ไม่มีอะไรเตือนเลย มันยังทำงานปกติ ยังตอบมาอย่างมั่นใจเหมือนเดิมทุกอย่าง แค่มัน ตอบผิด เฉยๆ

นี่แหละครับคือเรื่องที่ผมอยากเล่าในตอนนี้ และเป็นเรื่องที่ vendor ขายของมักไม่ค่อยพูดถึงตอนมาเสนอขาย คือ AI มันไม่ได้พังแบบเครื่องจักรพัง ที่มีควันขึ้น มีเสียงดัง มีไฟแดงกะพริบให้เรารู้ตัว มันพังแบบ ยิ้มแย้ม ตอบฉะฉาน มั่นใจเต็มร้อย แต่ผิด ซึ่งอันตรายกว่าเยอะ เพราะกว่าเราจะรู้ตัว บางทีก็เสียหายไปแล้ว

ตอนนี้ผมเลยจะพาไปรู้จัก 4 อาการพังยอดฮิตของโมเดล AI แบบภาษาคนๆ ว่าแต่ละอาการมันหน้าตายังไง เกิดจากอะไร แล้วทำไมเจ้าของกิจการอย่างเราถึงต้องรู้จักมันไว้ ไม่ใช่เพื่อจะไปซ่อมเอง (อันนั้นเป็นงานช่าง) แต่เพื่อจะได้ รู้ว่าต้องคอยดูตรงไหน และไม่หลงไว้ใจมันเกินไป

ทวนนิดนึงก่อน — AI มันเรียนรู้ยังไง#

ก่อนจะไปดูว่ามันพังยังไง ผมขอทวนสั้นๆ ว่ามันเรียนรู้ยังไงก่อนนะครับ เพราะพอเข้าใจตรงนี้ปุ๊บ อาการพังทั้ง 4 อย่างจะเข้าใจง่ายขึ้นเยอะเลย

ลองนึกภาพว่า AI แบบที่เราคุยกันในตอนนี้ มันเรียนรู้คล้ายๆ เด็กที่เราเอาตัวอย่างไปป้อนให้ดูเยอะๆ ครับ ไม่ใช่การนั่งเขียนกฎให้มันทีละข้อแบบ automation (ถ้าใครยังไม่ชัดเรื่อง AI กับ automation ต่างกันยังไง ไว้ย้อนไปอ่านตอนนั้นได้นะครับ) แต่เป็นการเอาตัวอย่างของจริงเป็นกองพะเนินไปให้มันดู แล้วมันก็ค่อยๆ จับ รูปแบบ (pattern) เอาเอง

อย่างเคสปล่อยผ่อนเมื่อกี้ เราก็เอาประวัติลูกค้าเก่าเป็นพันๆ รายไปให้มันดู บอกมันว่า “รายนี้จ่ายตรง รายนี้เบี้ยว รายนี้จ่ายตรง…” แล้วมันก็ค่อยๆ จับเอาเองว่า ลูกค้าหน้าตาแบบไหนมักจ่ายตรง หน้าตาแบบไหนมักเบี้ยว พอเจอลูกค้าใหม่เข้ามา มันก็เอาสิ่งที่เรียนรู้มาเดาว่า “รายนี้น่าจะจ่ายตรงนะ”

ของพวกนี้เราเรียกว่า โมเดล (model) ครับ — แปลแบบบ้านๆ คือ “ก้อนความเข้าใจ” ที่ AI สรุปได้จากตัวอย่างที่เราป้อนเข้าไป มันเหมือนสมองที่เราฝึกมาก้อนหนึ่ง พอฝึกเสร็จก็เอาไปใช้งานเดาเรื่องใหม่ๆ

ทีนี้… ของที่เรียนรู้จากตัวอย่างเนี่ย มันมีจุดอ่อนที่ซ่อนอยู่หลายจุดครับ และนี่แหละคือที่มาของอาการพังทั้ง 4 ที่ผมจะเล่าต่อไปนี้

อาการที่ 1 — Overfitting / Underfitting: “จำเก่งเกินไป” กับ “เรียนไม่พอ”#

อาการแรกผมขอจับสองตัวมาเล่าคู่กัน เพราะมันเป็นเหมือนสองหน้าของเหรียญเดียวกันครับ ตัวหนึ่งคือ เรียนน้อยไป อีกตัวคือ เรียนเยอะเกินจนเสียคน 555+

Underfitting — “เรียนไม่พอ เลยยังโง่อยู่”#

เริ่มที่ตัวง่ายก่อน underfitting (แปลตรงๆ คือ “เรียนรู้ไม่พอ”) อันนี้เข้าใจง่ายที่สุด

ลองนึกภาพเด็กนักเรียนคนหนึ่งที่อ่านหนังสือสอบแค่ผ่านๆ แค่ครึ่งบทแล้วก็ไปนอน พอเข้าห้องสอบก็เลยทำได้งูๆ ปลาๆ ตอบถูกบ้างผิดบ้างแบบมั่วๆ เพราะความรู้มันยังไม่แน่นพอ — AI ที่ underfitting ก็เป็นแบบนี้แหละครับ เราป้อนตัวอย่างให้มันน้อยเกินไป หรือฝึกมันเร็วๆ ผ่านๆ ไม่ทันได้จับรูปแบบให้ครบ มันเลยยัง “เบลอๆ” อยู่ ใช้งานจริงก็เลยเดาได้ห่วยตั้งแต่แรก

อาการนี้จริงๆ ไม่ค่อยน่ากลัวเท่าไหร่ครับ เพราะมันห่วยให้เห็นตั้งแต่แรก เหมือนเด็กที่สอบตกตั้งแต่สอบย่อย เราก็รู้เลยว่า “เอ๊ะ ตัวนี้ยังไม่พร้อม” แล้วก็ส่งกลับไปฝึกใหม่ มันโชว์ความห่วยให้เราเห็นซึ่งๆ หน้า ไม่ได้แอบพังเงียบๆ

Overfitting — “จำเก่งเกินไป จนใช้จริงไม่เป็น”#

ตัวที่น่ากลัวกว่าคือตัวนี้ครับ overfitting (แปลแบบบ้านๆ คือ “ฟิตเกินไป” หรือผมชอบเรียกว่า “จำเก่งเกินจนเสียคน”)

อันนี้ฟังดูย้อนแย้งใช่ไหมครับ เรียนเยอะแล้วจะไม่ดีได้ไง? ผมขอเล่าด้วยอุปมาที่ผมชอบที่สุดนะครับ

ลองนึกภาพเด็กนักเรียนอีกคนหนึ่ง คนนี้ขยันมาก แต่ขยันผิดทาง คือแกไปท่อง เฉลยข้อสอบเก่า มาทุกข้อแบบเป๊ะๆ ข้อ 1 ตอบ ก. ข้อ 2 ตอบ ค. ข้อ 3 ตอบ ข. ท่องจำมาหมดทุกตัวอักษร พอเอาข้อสอบเก่ามาให้ทำ — ได้เต็มครับ เต็มร้อยทุกครั้ง เพราะแกจำเฉลยได้หมด

แต่พอวันสอบจริง อาจารย์เปลี่ยนโจทย์นิดเดียว สลับตัวเลข เปลี่ยนคำถามหน่อยเดียว เด็กคนนี้ทำไม่ได้เลยครับ มึนตึ้บ เพราะแกไม่เคย เข้าใจ เนื้อหาจริงๆ แกแค่ ท่องจำเฉลย มา พอโจทย์ไม่ตรงกับที่ท่องมาเป๊ะๆ ก็จบเห่

AI ที่ overfitting ก็เป็นแบบนี้เป๊ะเลยครับ มันจำตัวอย่างที่เราป้อนให้ดูตอนฝึก ได้แม่นเวอร์ จำได้ทุกเม็ดทุกรายละเอียด จนเวลาเราทดสอบมันด้วยข้อมูลชุดเดิม มันได้คะแนนสวยหรู เจ้าของกิจการเห็นแล้วปลื้มมาก “โห แม่นจัง” แต่พอเอาไปเจอ ลูกค้าจริงในโลกจริง ที่หน้าตาไม่เหมือนตัวอย่างเป๊ะๆ มันก็เริ่มเดาพลาด เพราะมันไม่ได้เข้าใจหลักการจริงๆ มันแค่ จำของเก่า มา

💡 มุมเจ้าของกิจการ: ระวังตอน vendor มาโชว์ว่า “ระบบเราแม่น 99% เลยนะ” ครับ คำถามที่ควรถามกลับคือ — “แม่น 99% กับ ข้อมูลชุดไหน? ข้อมูลที่เคยเอาไปฝึกมัน หรือข้อมูลใหม่ที่มันไม่เคยเห็น?” ถ้าแม่นเฉพาะกับข้อมูลเก่าที่เคยเห็น นั่นอาจเป็นแค่อาการ “ท่องเฉลยเก่ง” ไม่ใช่ “เก่งจริง” — พอเจอของจริงในร้านคุณอาจร่วงก็ได้

อุปมาอีกอันที่ผมชอบใช้คือ คนที่ขับรถเป็นเฉพาะเส้นทางบ้าน-ที่ทำงานที่ขับทุกวันจนหลับตาขับได้ แต่พอต้องไปขับเส้นทางใหม่ที่ไม่เคยไป กลับเก้ๆ กังๆ ทำอะไรไม่ถูก นั่นแหละ overfitting คือเก่งเฉพาะของที่เคยเจอซ้ำๆ แต่ปรับตัวกับของใหม่ไม่ได้

จุดที่พอดี — ไม่มากไป ไม่น้อยไป#

ของที่เราอยากได้จริงๆ คือตรงกลางระหว่างสองตัวนี้ครับ คือ AI ที่ “เรียนมาพอดี” — เข้าใจ หลักการ ไม่ใช่ท่องจำ พอเจอของใหม่ที่ไม่เคยเห็นก็ยังเดาได้ดี ผมขอสรุปเป็นตารางเทียบให้เห็นภาพชัดๆ นะครับ

อาการเปรียบเหมือนเด็กนักเรียนแบบเวลาเจอของเก่าเวลาเจอของใหม่
Underfitting (เรียนไม่พอ)อ่านหนังสือผ่านๆ ไม่แน่นทำได้งูๆ ปลาๆก็ห่วยเหมือนเดิม
พอดี (ที่เราอยากได้)เข้าใจเนื้อหาจริง ทำโจทย์เป็นทำได้ดีทำได้ดี (ปรับตัวเป็น)
Overfitting (จำเก่งเกิน)ท่องเฉลยข้อสอบเก่ามาเป๊ะได้เต็ม! (หลอกตา)ร่วงเลย

เห็นไหมครับว่าตัวที่หลอกตาที่สุดคือ overfitting เพราะ “ตอนทดสอบกับของเก่ามันสวยหรู” ทำให้คนซื้อหลงดีใจ แต่ของจริงในร้านมันไม่เวิร์ก นี่คือเหตุผลแรกที่เราต้อง คอยดู ไม่ใช่ดูแค่ตอนซื้อแล้วจบ

อาการที่ 2 — Bias: “อคติที่ติดมากับข้อมูล”#

อาการที่สองนี้ผมว่าสำคัญมากในแง่ธุรกิจและในแง่ความเป็นธรรมเลยครับ คือ bias (แปลว่า “อคติ” หรือ “ความลำเอียง”)

หลายคนพอได้ยินคำว่า “AI มีอคติ” อาจจะนึกว่า เอ๊ะ เครื่องจักรมันจะมีอคติได้ไง มันไม่มีอารมณ์ ไม่มีความรู้สึกนี่ ใช่ครับ ตัว AI เองมันไม่ได้เกลียดใครหรอก แต่ปัญหาคือ มันเรียนรู้จากข้อมูลที่เราป้อนให้ และถ้าข้อมูลที่เราป้อนให้มัน มีอคติซ่อนอยู่ มันก็จะ ดูดอคตินั้นเข้าไปแล้วทำต่อ อย่างซื่อๆ โดยไม่รู้ตัว

ผมขออุปมาแบบนี้นะครับ AI มันเหมือนเด็กที่เลียนแบบผู้ใหญ่ ถ้าเราเลี้ยงเด็กด้วยตัวอย่างที่ลำเอียง เด็กก็จะซึมซับความลำเอียงนั้นมาเต็มๆ โดยที่ตัวเด็กเองไม่ได้ตั้งใจจะลำเอียง แค่ “เห็นมาแบบนั้นก็ทำตามแบบนั้น”

ลองนึกภาพเคสสมมตินะครับ สมมติว่าโรงงานแห่งหนึ่งจะเอา AI มาช่วยคัดใบสมัครงาน เพื่อความเร็ว เลยเอาประวัติการรับคนในอดีต 10 ปีไปป้อนให้มันเรียน บอกมันว่า “คนกลุ่มนี้เรารับ คนกลุ่มนี้เราไม่รับ” แล้วให้มันเลียนแบบ

ฟังดูดีใช่ไหมครับ? แต่ปัญหาคือ — ถ้าในอดีต 10 ปีนั้น โรงงานนี้บังเอิญรับคนจากจังหวัดใดจังหวัดหนึ่งเป็นพิเศษ (อาจจะเพราะโรงงานอยู่แถวนั้น คนแถวนั้นเลยสมัครเยอะ) AI มันก็จะจับ pattern นี้มาแล้วสรุปเอาเองว่า “อ๋อ คนจังหวัดนี้ = ควรรับ คนจังหวัดอื่น = ไม่ค่อยรับ” ทั้งที่จริงๆ จังหวัดมันไม่ได้เกี่ยวอะไรกับฝีมือเลย แต่ AI มันไม่รู้ มันเห็นในข้อมูลว่ามันเป็นแบบนั้น มันก็ทำตามแบบนั้นอย่างซื่อๆ

นี่แหละครับคือ bias อคติมันไม่ได้มาจากตัว AI แต่มันติดมากับข้อมูลที่เราป้อน แล้ว AI ก็เอามาขยายต่อแบบไม่รู้ตัว บางทียิ่งร้ายกว่าเดิมอีก เพราะคนเรายังพอมีสติฉุกคิดได้ว่า “เอ๊ะ แบบนี้มันไม่แฟร์นะ” แต่ AI มันไม่ฉุกคิด มันทำตามตัวเลขล้วนๆ

ตัวอย่างอคติที่แอบซ่อนในข้อมูลแบบที่เรานึกไม่ถึง ผมลองยกมาให้ดูเป็นตารางนะครับ (เป็นเคสสมมติที่ผมแต่งขึ้นให้เห็นภาพ ไม่ใช่เคสจริงของใคร)

ข้อมูลที่ป้อนให้ AI (สมมติ)อคติที่แอบติดมาผลที่ตามมา
ประวัติการอนุมัติสินเชื่อในอดีต ที่คนเคยอนุมัติมีอคติบางอย่างAI ดูดอคติเดิมมาทำต่อปฏิเสธลูกค้าบางกลุ่มทั้งที่จริงๆ น่าจะผ่าน
รีวิวสินค้าที่ส่วนใหญ่มาจากลูกค้ากลุ่มเดียวAI เข้าใจรสนิยมแค่กลุ่มนั้นแนะนำสินค้าพลาดสำหรับลูกค้ากลุ่มอื่น
รูปภาพตัวอย่างที่ถ่ายในที่แสงสว่างดีอย่างเดียวAI ไม่เคยเห็นภาพในที่แสงน้อยพอเจอภาพจริงในที่แสงน้อย เดาพลาด

💡 มุมเจ้าของกิจการ: จุดสำคัญของ bias คือ — AI มันดีได้แค่ข้อมูลที่เราป้อนให้มัน ครับ ภาษาฝรั่งเขาพูดติดปากว่า “garbage in, garbage out” (ใส่ขยะเข้าไป ก็ได้ขยะออกมา) ถ้าข้อมูลที่เราเอาไปฝึกมันเอียง ผลที่ออกมาก็เอียงตาม ฉะนั้นก่อนจะตื่นเต้นกับความฉลาดของ AI ลองถามก่อนว่า “มันเรียนมาจากข้อมูลอะไร แล้วข้อมูลชุดนั้นมันครบ-แฟร์-เป็นตัวแทนของลูกค้าจริงของเราไหม?”

แล้ว bias มันร้ายตรงไหนในแง่ธุรกิจ? คือนอกจากจะทำให้ตัดสินใจพลาดแล้ว มันยังเป็นเรื่อง ความเป็นธรรมและชื่อเสียง ด้วยครับ ลองนึกภาพถ้าระบบเราดันปฏิเสธลูกค้ากลุ่มใดกลุ่มหนึ่งอย่างไม่เป็นธรรมโดยที่เราไม่ได้ตั้งใจ พอเรื่องแดงขึ้นมา ความเสียหายต่อชื่อเสียงร้านมันประเมินค่าไม่ได้เลยนะครับ นี่คือเหตุผลที่สองที่เราต้องคอยดู — ไม่ใช่แค่ดูว่ามันแม่นไหม แต่ดูว่ามัน แฟร์ไหม ด้วย

อาการที่ 3 — Model Drift: “โลกเปลี่ยน แต่โมเดลยังคิดแบบเดิม”#

มาถึงอาการที่ผมว่าคนนึกไม่ถึงที่สุด และเป็นต้นเหตุของเคสปล่อยผ่อนตอนเปิดเรื่องเลยครับ — model drift (คำว่า drift แปลว่า “ลอยเลื่อนออกไปเรื่อยๆ” ผมขอแปลแบบบ้านๆ ว่า “โมเดลค่อยๆ เพี้ยนเพราะโลกมันเปลี่ยน”)

อาการสองอย่างแรก (overfitting กับ bias) มันเป็นปัญหาที่ติดมาตั้งแต่ตอนฝึก คือพังตั้งแต่วันแรก แต่ drift นี่ต่างออกไปครับ — มันเป็นปัญหาที่ วันแรกดีงามทุกอย่าง แล้วค่อยๆ พังทีหลัง ซึ่งทรยศมาก

ผมขออุปมาแบบนี้นะครับ ลองนึกภาพว่าคุณจ้างพนักงานเก่งคนหนึ่งมาเมื่อ 5 ปีก่อน แล้วส่งไปอยู่บนเกาะร้างที่ไม่มีอินเทอร์เน็ต ไม่มีข่าวสารอะไรเข้าถึงเลย แกเก่งมากครับ เก่งสุดๆ ในความรู้ของเมื่อ 5 ปีก่อน แต่ถ้าตอนนี้คุณดึงแกกลับมา แล้วให้แกมาตัดสินใจเรื่องตลาดวันนี้ แกก็จะตัดสินใจด้วยภาพโลกเมื่อ 5 ปีก่อน ทั้งที่พฤติกรรมลูกค้าเปลี่ยนไปแล้ว ราคาเปลี่ยน คู่แข่งเปลี่ยน เทรนด์เปลี่ยน แกยังเก่งเท่าเดิมก็จริง แต่ “เก่งกับโลกที่ไม่มีอยู่แล้ว”

นี่แหละครับคือ model drift — AI ตัวหนึ่งถูกฝึกด้วยข้อมูล ณ ช่วงเวลาหนึ่ง พอเอามาใช้มันก็เก่งกับช่วงเวลานั้น แต่ โลกจริงมันไม่หยุดนิ่ง มันเปลี่ยนไปเรื่อยๆ พฤติกรรมลูกค้าปีนี้ไม่เหมือนปีที่แล้ว เศรษฐกิจเปลี่ยน เทรนด์เปลี่ยน คำที่ลูกค้าใช้พิมพ์ก็เปลี่ยน แต่โมเดลมันยังคิดด้วยภาพเก่าที่เรียนมา มันก็เลย ค่อยๆ เพี้ยนทีละนิดๆ จนวันหนึ่งเดาพลาดเยอะจนเป็นปัญหา

กลับไปที่เคสปล่อยผ่อนตอนเปิดเรื่องนะครับ — ที่ยอดหนี้เสียค่อยๆ ไต่ขึ้นเงียบๆ นั่นแหละ drift เลย สมมติว่าตอนฝึก AI มันเรียนรู้จากพฤติกรรมลูกค้าในช่วงเศรษฐกิจดี คนจ่ายตรงเยอะ พอเศรษฐกิจเริ่มฝืด คนเริ่มเบี้ยวมากขึ้น แต่ AI มันยังประเมินด้วยภาพ “ยุคเศรษฐกิจดี” อยู่ มันเลยยังปล่อยผ่อนให้คนที่จริงๆ ในสถานการณ์ใหม่นี้ไม่น่าปล่อย และที่ร้ายคือ มันไม่ขึ้นจอแดงเตือน มันยังตอบมาอย่างมั่นใจเหมือนเดิม เพราะในมุมของมัน มันก็ทำงานถูกต้องตามที่เรียนมานั่นแหละ แค่สิ่งที่มันเรียนมามัน “เก่าไปแล้ว”

ผมขอเทียบความต่างของอาการที่พังตั้งแต่แรก กับอาการที่ค่อยๆ พังทีหลังให้เห็นชัดๆ นะครับ

พังตั้งแต่แรก (overfitting / bias)ค่อยๆ พังทีหลัง (drift)
เกิดตอนไหนตั้งแต่วันที่ฝึกเสร็จวันแรกดี แล้วค่อยเพี้ยนตามกาลเวลา
สาเหตุข้อมูลฝึกมีปัญหาโลกจริงเปลี่ยน แต่โมเดลไม่ได้อัปเดต
สังเกตยากไหมยากปานกลาง (เทียบกับของจริงได้)ยากมาก เพราะมันค่อยเป็นค่อยไป
ทางแก้คร่าวๆฝึกใหม่ให้ดีตั้งแต่ต้นคอยเฝ้าดู + เอาข้อมูลใหม่มาฝึกซ้ำเป็นระยะ

💡 มุมเจ้าของกิจการ: บทเรียนที่สำคัญที่สุดจาก drift คือ — ซื้อ AI มาแล้วไม่ได้จบที่วันติดตั้ง ครับ มันไม่ใช่ของที่ “ซื้อมาแล้วใช้ไปยาวๆ ลืมๆ ไปได้” เหมือนพัดลมหรือตู้เย็น มันเหมือนพนักงานที่ต้องคอย “อัปเดตความรู้” ให้ทันโลกอยู่เรื่อยๆ ถ้า vendor ขายของแล้วหายไปเลยไม่พูดเรื่องการดูแลต่อเนื่อง — อันนั้นน่าระวังครับ เพราะ AI ที่ปล่อยทิ้งไว้เฉยๆ มันจะค่อยๆ เพี้ยนแบบที่เราไม่ทันรู้ตัว

อาการที่ 4 — Black Box: “เก่งก็เก่ง แต่อธิบายไม่ได้ว่าทำไมตอบงั้น”#

อาการสุดท้าย ไม่เชิงว่าเป็น “อาการพัง” ตรงๆ หรอกครับ แต่มันเป็น คุณสมบัติที่ทำให้ 3 อาการแรกตามจับยาก — นั่นคือ black box (แปลว่า “กล่องดำ” หมายถึง “ของที่เราเห็นแค่ว่าใส่อะไรเข้าไป ได้อะไรออกมา แต่มองไม่เห็นว่าข้างในมันคิดยังไง”)

ลองนึกภาพแบบนี้นะครับ — สมมติคุณมีพนักงานคนหนึ่ง เก่งมาก เดางานแม่นมาก แต่มีนิสัยแปลกอยู่อย่างคือ เวลาคุณถามว่า “ทำไมถึงตัดสินใจแบบนี้” แกตอบไม่ได้ แกบอกได้แค่ “ก็รู้สึกว่ามันใช่” คุณจะรู้สึกยังไงครับ? ตอนแกตอบถูกก็ดีอยู่หรอก แต่พอแกตอบผิดขึ้นมา แล้วคุณอยากรู้ว่าแกพลาดตรงไหนเพื่อจะแก้ คุณก็ทำไม่ได้เลย เพราะแกอธิบายเหตุผลตัวเองไม่ได้

AI สมัยใหม่ที่ฉลาดๆ หลายตัวมันเป็นแบบนี้แหละครับ ข้างในมันมีการคำนวณที่ซับซ้อนมหาศาล ซับซ้อนเกินกว่าที่คนจะตามดูทีละขั้นได้ มันเลยกลายเป็น “กล่องดำ” คือเราเห็นแค่ว่าใส่ข้อมูลลูกค้าเข้าไป แล้ว มันบอกว่า “ปล่อยผ่อนได้” แต่ถ้าเราถามว่า “ทำไมล่ะ? เพราะอะไร?” มันกลับตอบเป็นเหตุเป็นผลแบบที่คนเข้าใจไม่ได้ มันรู้แค่ว่า “ตัวเลขมันออกมาทางนี้”

นี่แหละครับที่ทำให้ทุกอย่างยากขึ้น เพราะถ้า AI มันเป็นกล่องใส มองเห็นข้างในชัดเจน เวลามันเริ่มเพี้ยน (drift) หรือเริ่มลำเอียง (bias) เราก็จะเห็นได้ทันทีว่า “อ้าว มันไปให้น้ำหนักกับเรื่องจังหวัดเกินไปนี่นา” แล้วก็แก้ได้ แต่พอมันเป็นกล่องดำ อาการพังทั้งหลายมันเลยซ่อนอยู่ข้างใน มองไม่เห็น กว่าจะรู้ตัวก็ต่อเมื่อผลลัพธ์ในโลกจริงมันเสียหายให้เห็นแล้ว

ในวงการเขาก็พยายามแก้เรื่องนี้กันอยู่ครับ มีศัพท์เรียกความพยายามทำให้ AI อธิบายตัวเองได้ว่า explainability (แปลว่า “ความสามารถในการอธิบายได้ว่าทำไมถึงตอบแบบนั้น”) คือพยายามทำให้กล่องดำมันโปร่งใสขึ้น ให้มันบอกได้บ้างว่า “ที่ฉันตอบแบบนี้เพราะดูจากปัจจัยนี้ๆ เป็นหลัก” แต่บอกตรงๆ ว่ายังเป็นเรื่องที่ทำได้ยากอยู่ครับ ยิ่ง AI ฉลาดเท่าไหร่ ข้างในยิ่งซับซ้อน อธิบายยิ่งยาก เหมือนกับว่ายิ่งคนเก่งระดับอัจฉริยะ บางทีก็ยิ่งอธิบายวิธีคิดของตัวเองให้คนทั่วไปฟังยากนั่นแหละครับ

💡 มุมเจ้าของกิจการ: สำหรับงานที่ “ตอบผิดแล้วเรื่องใหญ่” เช่น เรื่องเงิน เรื่องสุขภาพ เรื่องกฎหมาย เรื่องที่กระทบสิทธิ์คน — การที่ AI อธิบายไม่ได้ว่าทำไมถึงตัดสินใจแบบนั้น มันคือความเสี่ยงนะครับ เพราะวันที่ลูกค้าหรือหน่วยงานมาถามว่า “ทำไมระบบคุณถึงปฏิเสธฉัน” คุณตอบว่า “ไม่รู้เหมือนกันครับ AI มันบอกมาเอง” ไม่ได้ ฉะนั้นงานสำคัญๆ พวกนี้ ควรเก็บ คนไว้เป็นคนตัดสินใจขั้นสุดท้าย AI เป็นแค่ผู้ช่วยเสนอความเห็น ไม่ใช่ปล่อยให้กล่องดำตัดสินชะตาคนทั้งดุ้น

ทำไมเจ้าของกิจการอย่างเราต้องคอยดูมัน#

เอาล่ะครับ พอเห็นครบทั้ง 4 อาการแล้ว ผมขอร้อยมันเข้าด้วยกันเป็นบทเรียนใหญ่ๆ ของตอนนี้ คือ ทำไม AI ถึงเป็นของที่ “ซื้อมาแล้วต้องคอยดู” ไม่ใช่ “ซื้อมาแล้วลืมได้”

ลองสังเกตดูนะครับ ทั้ง 4 อาการที่ผมเล่ามา มันมีจุดร่วมที่น่ากลัวเหมือนกันอยู่อย่างหนึ่ง

AI มันพังแบบเงียบๆ ไม่ขึ้นจอแดง

เครื่องจักรทั่วไปเวลาพังมันมีสัญญาณให้เรารู้ครับ น้ำมันหมดไฟก็ขึ้น เครื่องร้อนก็มีเสียงเตือน คอมค้างก็จอฟ้า แต่ AI เวลามันคิดผิด มันไม่ได้ส่งสัญญาณอะไรเลย มันยัง ตอบมาอย่างมั่นใจ ฉะฉาน หน้าตาเฉย เหมือนตอนที่มันตอบถูกทุกประการ overfitting ก็ตอบมั่นใจ bias ก็ตอบมั่นใจ drift ก็ตอบมั่นใจ แล้วมันก็เป็นกล่องดำที่เราเปิดดูข้างในไม่ได้อีก

นี่แหละครับคือเหตุผลที่ AI ต่างจากเครื่องมือทั่วไป มันไม่ใช่ของที่ติดตั้งเสร็จแล้วจบ ผมขอสรุปเป็นตารางว่าแต่ละอาการต้องคอยดูยังไงนะครับ

อาการทำไมต้องคอยดู
Overfittingมันอาจ “ท่องเฉลยเก่ง” ไม่ใช่ “เก่งจริง” ต้องคอยทดสอบกับของจริงเรื่อยๆ ไม่ใช่เชื่อตัวเลขสวยๆ ตอนเดโม
Biasมันอาจ “ดูดอคติ” มาจากข้อมูลโดยไม่รู้ตัว ต้องคอยดูว่าผลมัน “แฟร์” ไหม ไม่ใช่แค่ “แม่น” ไหม
Driftโลกมันเปลี่ยน แต่มันไม่เปลี่ยนตาม ต้องคอยอัปเดต เอาข้อมูลใหม่มาฝึกซ้ำเป็นระยะ
Black boxมันอธิบายตัวเองไม่ค่อยได้ งานสำคัญต้องมีคนคุมขั้นสุดท้าย ไม่ปล่อยให้มันตัดสินเดี่ยวๆ

พูดง่ายๆ คือ AI มันเหมือน พนักงานที่เก่งมากแต่ต้องมีหัวหน้าคอยดู ครับ ไม่ใช่ว่าเราไม่ไว้ใจมัน แต่เพราะมันเก่งแบบที่อาจพลาดเงียบๆ ได้ การมีคนคอยดู คอยเช็ก คอยตั้งกฎกำกับ มันเลยไม่ใช่เรื่องจุกจิกน่ารำคาญ แต่มันคือสิ่งที่ทำให้เราใช้ AI ได้อย่างสบายใจและปลอดภัยจริงๆ ต่างหาก

และนี่แหละครับคือจุดที่ผมอยากปูทางไปเรื่องถัดไป

ปูทางไปเรื่อง “การกำกับดูแล AI”#

ทีนี้พอเรารู้แล้วว่า AI มันพังเงียบๆ ได้ คำถามต่อมาที่ตามมาติดๆ ก็คือ “แล้วเราจะคอยดูมันยังไงให้เป็นระบบ?” ไม่ใช่แค่ดูแบบสุ่มๆ นึกได้ก็ดู ลืมก็ลืมไป

เพราะถ้าเป็นร้านเล็กๆ มี AI ตัวเดียว เราอาจจะคอยดูเองได้ แต่พอกิจการโตขึ้น มี AI หลายตัวทำงานหลายจุด แต่ละตัวก็มีความเสี่ยงพังเงียบๆ ของตัวเอง การ “คอยดู” แบบนึกได้ก็ดูมันใช้ไม่ได้แล้วครับ เราต้องมีระบบ มีกติกา มีคนรับผิดชอบชัดเจนว่าใครดูตัวไหน ดูบ่อยแค่ไหน ดูอะไรบ้าง พังแล้วใครรับผิดชอบ

เรื่องการวางระบบ “กำกับดูแล AI” ให้เป็นเรื่องเป็นราวเนี่ย ภาษาวงการเขาเรียกว่า AI governance (แปลแบบบ้านๆ คือ “การวางกติกาและคนคอยกำกับดูแล AI ทั้งระบบ”) ซึ่งมันเป็นเรื่องใหญ่พอที่ผมจะแยกไปเล่าเป็นชุดต่างหากเลยครับ เป็นภาคที่ผมตั้งใจเล่ามุมของ คนที่ต้องตัดสินใจและออกแบบกติกา ว่าจะคุม AI ในองค์กรยังไงให้ทั้งใช้ประโยชน์ได้เต็มที่และไม่โดนมันเล่นงานเงียบๆ

แต่ทั้งหมดนั้นมันจะเริ่มต้นจากความเข้าใจพื้นฐานในตอนนี้แหละครับ คือ “รู้ก่อนว่า AI มันพังหน้าตายังไง” เพราะถ้าเราไม่รู้ว่ามันพังยังไง เราก็จะวางระบบดูแลมันไม่ถูกจุด เหมือนจะจ้างยามมาเฝ้าบ้าน แต่ไม่รู้ว่าขโมยมันเข้าทางไหน

สรุปสั้นๆ ส่งท้าย#

ถ้าให้ผมย่อทั้งตอนนี้เหลือไม่กี่บรรทัดไว้จำง่ายๆ ก็คือแบบนี้ครับ

  • AI ไม่ได้พังแบบเครื่องจักร มันพังแบบยิ้มแย้ม ตอบมั่นใจแต่ผิด ไม่ขึ้นจอแดงเตือน — ซึ่งอันตรายกว่า
  • Overfitting (จำเก่งเกิน) = ท่องเฉลยเก่ง สวยตอนเดโม แต่เจอของจริงร่วง / Underfitting (เรียนไม่พอ) = ห่วยให้เห็นตั้งแต่แรก
  • Bias (อคติจากข้อมูล) = AI ดูดความลำเอียงจากข้อมูลที่เราป้อนมาทำต่อแบบซื่อๆ — ใส่ขยะเข้า ได้ขยะออก
  • Model drift (โลกเปลี่ยนโมเดลเพี้ยน) = วันแรกดี แต่โลกเปลี่ยนไปเรื่อยๆ ขณะที่โมเดลยังคิดแบบเดิม เลยค่อยๆ เพี้ยนเงียบๆ
  • Black box (อธิบายไม่ได้) = เก่งแต่บอกไม่ได้ว่าทำไมตอบงั้น ทำให้อาการพังอื่นๆ ยิ่งซ่อนตัวจับยาก
  • เพราะมันพังเงียบได้ AI จึงเป็นของที่ “ต้องคอยดู” ไม่ใช่ซื้อมาแล้วลืม — และพอกิจการโตขึ้น การคอยดูก็ต้องวางเป็นระบบ ซึ่งก็คือเรื่อง “การกำกับดูแล AI” ที่ผมจะเล่าต่อในภาคถัดไป

ผมไม่ใช่ผู้เชี่ยวชาญด้าน AI อะไรหรอกนะครับ เป็นแค่เจ้าของกิจการคนหนึ่งที่พยายามทำความเข้าใจของพวกนี้ด้วยภาษาคนๆ แล้วก็อยากเล่าให้เพื่อนเจ้าของกิจการด้วยกันฟัง ตรงไหนผมเข้าใจคลาดเคลื่อนไป ทักท้วงกันเข้ามาได้เลยนะครับ ยินดีมากๆ

ตอนหน้าผมว่าจะพาไปดูต่อว่า เวลาเราจะ “คอยดู” AI ให้เป็นระบบเนี่ย จริงๆ แล้วมันต้องดูอะไรบ้าง ใครต้องรับผิดชอบ แล้วทำไมเรื่องนี้ถึงกลายเป็นเรื่องที่เจ้าของกิจการยุคนี้เลี่ยงไม่ได้อีกต่อไป ไว้เจอกันตอนหน้าครับ