สารบัญ
Series: AAISM — คุม AI ในองค์กรแบบผู้บริหาร (ภาษาคน) Domain 3 · ตอนที่ 24 — เปิด Domain 3: รู้จักประเภทของ AI ก่อนจะเลือก control ← คุณอยู่ตรงนี้ (สารบัญเต็มของซีรีส์จะตามมาเมื่อตอนถัดไปทยอยออกครับ)
ตอนที่แล้วเราปิด Domain 2 กันไป ทั้งโดเมนนั้นเราอยู่ในโหมด “มองและตัดสินใจ” คือมองให้ออกว่าพนักงาน AI คนนี้เสี่ยงตรงไหน แล้วตัดสินใจว่าจะรับมือยังไง และผมทิ้งท้ายไว้ว่า Domain 3 คือ “คลังอาวุธ” เครื่องมือจริงๆ ที่เราหยิบมาคุม AI
แต่ก่อนจะเดินเข้าไปในคลังอาวุธ ผมอยากชวนหยุดคิดสักนิดครับ — คุณจะเลือกอาวุธให้ถูก ก็ต่อเมื่อรู้ว่าคุณกำลังจะคุม “อะไร”
ลองนึกภาพแบบนี้ครับ สมมติว่าคุณเป็นเจ้าของกิจการที่กำลังจะรับพนักงานใหม่เข้าทีม ถ้าผมบอกคุณแค่ว่า “รับคนเก่งมากเข้ามาคนหนึ่ง” คุณยังตั้งกฎคุมเขาไม่ได้หรอกครับ เพราะคุณยังไม่รู้เลยว่าเขาเป็น พนักงานแบบไหน — เป็นพนักงานคีย์ข้อมูลที่ทำซ้ำๆ ตามขั้นตอนเป๊ะ? เป็นนักวิเคราะห์ที่ดูข้อมูลแล้วเดาแนวโน้มให้? เป็นครีเอทีฟที่แต่งงานใหม่ขึ้นมาเอง? หรือเป็นผู้จัดการที่ตัดสินใจและลงมือทำเองได้โดยไม่ต้องรอสั่ง? พนักงานแต่ละแบบ คุมคนละวิธีกันเลยครับ — คนทำซ้ำๆ คุมที่ “ขั้นตอน” คนเดาแนวโน้มคุมที่ “ข้อมูลที่ป้อนเข้าไป” คนแต่งงานคุมที่ “สิ่งที่ปล่อยออกไป” ส่วนคนตัดสินใจเอง ต้องคุมที่ “ขอบเขตอำนาจ”
AI ก็เหมือนกันเป๊ะครับ — “ประเภทของ AI” ไม่ใช่เรื่องวิชาการให้ท่องจำ แต่มันคือสิ่งที่บอกคุณว่าจะต้องคุมตรงไหน
นี่คือเหตุผลที่ Domain 3 ซึ่งเป็นบทที่หนักและเป็นเทคนิคที่สุดของทั้งซีรีส์ เปิดด้วยเรื่อง “ประเภทของ AI” ครับ ไม่ใช่เพราะอยากให้คุณกลายเป็นนักวิทยาศาสตร์ข้อมูล แต่เพราะ ผู้บริหารต้องอ่านป้ายให้ออกว่ากำลังจ้าง AI แบบไหน เพื่อจะเลือก control ให้ถูกตัว
📚 หมายเหตุก่อนเริ่ม: ตอนนี้ผมจะเล่ากลไกของ AI แบบ “พอเข้าใจเพื่อเลือก control ได้ถูก” — เช่น neural network ทำงานยังไง, transformer คืออะไร, ML เรียนรู้แบบไหน. ผมจะ ไม่ ลงลึกระดับสอนสร้างโมเดลหรือคณิตศาสตร์เบื้องหลัง เพราะนั่นเป็นงานของทีมเทคนิค ไม่ใช่หน้าที่เจ้าของกิจการ. ถ้าใครอยากเข้าใจกลไกลึกๆ ของ AI แบบภาษาคนจริงๆ — เปิดฝา neural network ดูข้างใน, transformer “ให้ความสนใจ” ยังไง, GenAI สร้างเนื้อหาขึ้นมาจากอะไร — เรื่องพวกนี้ผมจะแยกไปเล่าเต็มๆ ในซีรีส์ AI 101 (ภาษาคน เล่าสบายๆ) ครับ ตอนนี้เราโฟกัสมุมเดียวพอ คือ “type นี้ ผู้บริหารต้องคุมอะไร”
เอาล่ะครับ มาเริ่มทำความรู้จักครอบครัวของ AI กัน
ตั้งหลักก่อน — AI, ML, DL, GenAI: ใครซ้อนอยู่ในใคร
ก่อนจะไปดูประเภทย่อย ผมอยากให้เห็นภาพใหญ่ก่อน คำที่เราได้ยินกันจนเฝืออย่าง AI, Machine Learning, Deep Learning, Generative AI มันไม่ใช่คำที่อยู่คนละโลกนะครับ แต่มันเป็น วงกลมที่ซ้อนกันอยู่ วงนอกสุดใหญ่สุด แล้วค่อยๆ แคบลงไปข้างใน
ลองนึกถึงตุ๊กตาแม่ลูกดกของรัสเซีย (matryoshka) ที่เปิดออกมาแล้วมีตัวเล็กซ้อนข้างในเรื่อยๆ ครับ:
┌───────────────────────────────────────────────┐│ AI (ปัญญาประดิษฐ์) — วงนอกสุด ││ ทำให้คอมเลียนแบบความสามารถคน เรียนรู้ ตัดสินใจ ││ ┌─────────────────────────────────────────┐ ││ │ ML (Machine Learning) — เรียนจากข้อมูล │ ││ │ ┌───────────────────────────────────┐ │ ││ │ │ DL (Deep Learning) — neural net │ │ ││ │ │ หลายชั้น │ │ ││ │ │ ┌─────────────────────────────┐ │ │ ││ │ │ │ GenAI — สร้างเนื้อหาใหม่ │ │ │ ││ │ │ └─────────────────────────────┘ │ │ ││ │ └───────────────────────────────────┘ │ ││ └─────────────────────────────────────────┘ ││ (Data Science คาบเกี่ยวทุกชั้น) │└───────────────────────────────────────────────┘ผมขอแปลแต่ละวงเป็นภาษาคนแบบนี้ครับ:
| คำ | ภาษาคน | จุดที่ผู้บริหารต้องจำ |
|---|---|---|
| AI (Artificial Intelligence — ปัญญาประดิษฐ์) | วงนอกสุด — เทคนิคทุกอย่างที่ทำให้คอมพิวเตอร์เลียนแบบความสามารถของคน ทั้งเรียนรู้ ตัดสินใจ จับรูปแบบ และแก้ปัญหา. กว้างมากตั้งแต่ระบบกฎ “ถ้า-แล้ว” (if-else) ง่ายๆ ไปจนถึงรถไร้คนขับ | ”AI” เฉยๆ บอกอะไรไม่ได้มาก ต้องถามต่อว่าเป็น AI แบบไหน ในวงไหน |
| ML (Machine Learning — การเรียนรู้ของเครื่อง) | วงในของ AI — โปรแกรมที่ สร้างโมเดลทำนายจากข้อมูล คำสำคัญคือ “ข้อมูล”. AI ที่เราใช้ๆ กันทุกวันนี้ ส่วนใหญ่จริงๆ คือ ML ที่สรุปรูปแบบจากข้อมูลก้อนใหญ่ แล้วเอาไปทำนายของใหม่ | ML = “เรียนจากข้อมูล” → ความเสี่ยงเด่นคือ ข้อมูล (คุณภาพ/อคติ) |
| DL (Deep Learning — การเรียนรู้เชิงลึก) | วงในของ ML — ใช้ โครงข่ายประสาทเทียม (neural network) หลายชั้น ค่อยๆ เรียนรู้ลักษณะของข้อมูลจากหยาบไปละเอียด เลียนแบบวิธีที่สมองคนรับรู้โลก. เก่งเรื่องภาพ เสียง ภาษา | DL = ทึบ อธิบายยาก → ความเสี่ยงเด่นคือ อธิบายไม่ได้ (กล่องดำ) |
| GenAI (Generative AI — AI สร้างเนื้อหา) | วงในสุด (ในที่นี้) — โมเดลกลุ่มหนึ่งของ DL ที่ สร้างเนื้อหาใหม่ ทั้งข้อความ รูป โค้ด เสียง จากสิ่งที่เราป้อนเข้าไป | GenAI = สร้างของใหม่ → ความเสี่ยงเด่นคือ ผลลัพธ์ (มั่ว/ละเมิดลิขสิทธิ์) |
| Data Science (วิทยาการข้อมูล) | ไม่ใช่วงซ้อน แต่เป็นสาขาที่ คาบเกี่ยวทุกชั้น — รวมวิทยาการคอม สถิติ คณิตศาสตร์ AI/ML/DL เข้าด้วยกัน เพื่อดึง “ความเข้าใจ” ออกมาจากข้อมูลก้อนใหญ่ | คือ “วิชา” ที่อยู่เบื้องหลังทั้งหมด — ทีมที่สร้าง AI ใช้ความรู้นี้ |
จุดที่ผมอยากเน้นที่สุดในตารางนี้คือ คอลัมน์ขวา ครับ — สังเกตไหมครับว่าพอวงแคบลงเข้าข้างใน “จุดเสี่ยงที่ผู้บริหารต้องคุม” ก็เลื่อนตำแหน่งไปด้วย:
- พูดถึง ML เฉยๆ → ให้คิดถึงเรื่อง ข้อมูลเข้า เป็นหลัก (ถ้าข้อมูลแย่ ผลลัพธ์ก็แย่)
- พูดถึง DL → เพิ่มเรื่อง อธิบายไม่ได้ เข้ามา (มันลึกจนเปิดดูข้างในยาก)
- พูดถึง GenAI → เพิ่มเรื่อง ผลลัพธ์ที่ปล่อยออกไป (มันสร้างของใหม่ที่อาจมั่วหรือผิดกฎหมาย)
มุมผู้บริหาร: เวลามีคนในทีมหรือ vendor มาเสนอ “โซลูชัน AI” ให้คุณ — คำถามแรกที่ทรงพลังที่สุดไม่ใช่ “มันเก่งแค่ไหน” แต่คือ “ตัวนี้อยู่วงไหน — ML ธรรมดา, DL, หรือ GenAI?” เพราะคำตอบนั้นบอกคุณทันทีว่า “จุดที่ต้องจับตา” อยู่ตรงไหน. ถ้าเป็น ML ทำนายเฉยๆ ให้ไปดูที่คุณภาพข้อมูล. ถ้าเป็น DL ให้ถามเรื่องการอธิบายผล. ถ้าเป็น GenAI ให้ระวังเรื่องเนื้อหาที่มันปล่อยออกมา. รู้วง = รู้ว่าจะส่องไฟไปทางไหน
ทีนี้พอเห็นภาพครอบครัวแล้ว เราจะมาแยกประเภท AI กันอีก 2 มุมที่ใช้กันบ่อย คือแยกตาม “ความสามารถ (functionality)” กับแยกตาม “ระดับสติปัญญา (capability)” ครับ
มุมที่ 1 — แยก AI ตาม “ความสามารถ” (Functionality): 4 ระดับ
มุมแรกที่วงการใช้แบ่ง AI คือแบ่งตาม “ความสามารถในการจำและคิด” ออกเป็น 4 ระดับ ครับ ไล่จากง่ายสุดไปซับซ้อนสุด ผมอยากให้มองมันเหมือน “ระดับความรับผิดชอบของพนักงาน” ที่เราจะไว้ใจให้ทำอะไรได้แค่ไหน:
| ระดับ | ความสามารถ (ภาษาคน) | ตัวอย่างที่คุ้น | เทียบกับพนักงาน |
|---|---|---|---|
| 1. Reactive Machines (เครื่องตอบสนอง) | รุ่นเก่าแก่ที่สุด — เจออินพุตแบบนี้ ตอบแบบนี้ ตายตัว. ไม่มีความจำ ไม่เรียนรู้จากอดีต | หมากรุก/โกะ (Deep Blue, AlphaGo), หุ่นยนต์ในโรงงาน, ระบบบ้านอัจฉริยะง่ายๆ | คนที่ทำงานตามคู่มือเป๊ะ ไม่เคยจำว่าเมื่อวานทำอะไร |
| 2. Limited Memory (ความจำจำกัด) | จำได้ “นิดหน่อย” จากประสบการณ์ล่าสุด เอามาช่วยตัดสินใจ แต่จำไม่ลึก ไม่เก็บคลังความจำใหญ่ | รถไร้คนขับ, ผู้ช่วยเสียง (Siri, Alexa), ระบบแนะนำสินค้า, แชตบอต | คนที่จำเหตุการณ์เมื่อกี้ได้ ปรับตัวได้นิดหน่อย แต่ไม่ได้จำทุกอย่าง |
| 3. Theory of Mind (เข้าใจจิตใจคน) | ยังไปไม่ถึงจริง — เป้าหมายคือ AI ที่เข้าใจว่าความคิด อารมณ์ มีผลต่อพฤติกรรมคน เข้าใจการเข้าสังคม | โมเดลภาษาอย่าง ChatGPT, CoPilot, หุ่นยนต์สังคม (Pepper, Sophia) — เป็นแค่ตัวอย่างยุคแรกๆ ยังไม่ใช่ของจริง | คนที่อ่านใจคนอื่นออก รู้ว่าใครกำลังรู้สึกยังไง (AI ยังทำไม่ได้จริง) |
| 4. Self-Aware AI (รู้ตัวเอง) | ยังไม่มีในโลกนี้ — AI ที่รู้ทั้งอารมณ์คนอื่น และ “รู้ตัวเอง” มีจิตสำนึก. เป็นแนวคิดในอนาคต | ยังไม่มีตัวอย่างจริง | (สมมติ) พนักงานที่มีจิตสำนึกของตัวเอง — ยังเป็นแค่จินตนาการ |
สิ่งที่ผมอยากให้เจ้าของกิจการจำจากตารางนี้ ไม่ใช่ชื่อ 4 ระดับครับ (จำไม่ได้ก็ไม่เป็นไร) แต่คือ เส้นแบ่งสำคัญ 2 เส้น:
- เส้นที่ 1 — “มีความจำหรือเปล่า” (ระดับ 1 vs 2): ตัวที่ไม่มีความจำ (Reactive) คาดเดาง่าย คุมง่าย เพราะมันตอบเหมือนเดิมเสมอ. ตัวที่มีความจำ (Limited Memory) คุมยากขึ้น เพราะพฤติกรรมมันเปลี่ยนตามสิ่งที่เพิ่งเจอ — AI ที่เราใช้ในธุรกิจแทบทั้งหมดอยู่ระดับ 2 นี้
- เส้นที่ 2 — “ของจริง vs ของในหนัง” (ระดับ 1-2 vs 3-4): ระดับ 3 และ 4 (เข้าใจจิตใจ / รู้ตัวเอง) ยังไม่มีอยู่จริง ในวันนี้. ถ้าใครมาขายของแล้วอ้างว่า AI ของเขา “เข้าใจอารมณ์คุณจริงๆ” หรือ “มีความคิดเป็นของตัวเอง” — นั่นคือการตลาด ไม่ใช่ความจริงทางเทคนิคครับ
มุมผู้บริหาร: ประโยชน์จริงๆ ของการรู้ 4 ระดับนี้ คือเอาไว้ “กรองคำโฆษณาเกินจริง”. AI ในธุรกิจของคุณเกือบทั้งหมดคือ Limited Memory — เก่งในงานแคบๆ ที่มันถูกฝึกมา จำได้นิดหน่อย แต่ไม่ได้ “ฉลาดเหมือนคน”. เวลาเจอ vendor พูดเวอร์ว่า AI ตัวนี้ “คิดเองได้” หรือ “เข้าใจลูกค้าเหมือนมนุษย์” ให้ตั้งสติว่าวันนี้เทคโนโลยียังไปไม่ถึงตรงนั้น แล้วถามกลับว่า “งั้นช่วยอธิบายเป็นรูปธรรมหน่อยว่ามันทำอะไรได้บ้าง และทำอะไรไม่ได้บ้าง”
มุมที่ 2 — แยก AI ตาม “ระดับสติปัญญา” (Capability): ANI → AGI → ASI
มุมที่สองที่ได้ยินบ่อยมากในข่าว คือแบ่งตาม “ระดับสติปัญญา” เทียบกับมนุษย์ — มี 3 ขั้น ผมขอเรียงเป็นบันได 3 ขั้นแบบนี้ครับ
┌──────────────────────────────┐ │ ASI — เหนือมนุษย์ (ในอนาคต) │ ขั้น 3: ยังเป็นแค่ทฤษฎี ├──────────────────────────────┤ │ AGI — เก่งเท่ามนุษย์ (ยังไม่ถึง) │ ขั้น 2: กำลังพยายาม ├──────────────────────────────┤ │ ANI — เก่งงานเดียว (ของจริงวันนี้)│ ขั้น 1: ★ เราอยู่ตรงนี้ └──────────────────────────────┘ขั้น 1 — ANI: AI ที่เก่ง “งานเดียว” (และคือทั้งหมดที่มีในวันนี้)
ANI (Artificial Narrow Intelligence — ปัญญาประดิษฐ์เฉพาะทาง) หรือที่บางคนเรียก “weak AI” คือ AI ที่ เก่งเฉพาะเรื่องที่มันถูกฝึกมา เท่านั้น. ตัวที่ฝึกมาแปลภาษาก็ทำได้แต่แปลภาษา ตัวที่ฝึกมาดูรูปก็ทำได้แต่ดูรูป ออกนอกขอบเขตที่ฝึกมาเมื่อไหร่ก็จบ. มันไม่มีจิตสำนึก ไม่มีอารมณ์ ไม่มีสติปัญญาแบบมนุษย์
และนี่คือจุดสำคัญที่สุด ครับ AI ทุกตัวที่เราใช้ในโลกจริงวันนี้ ทั้ง Siri, การจดจำใบหน้า, ระบบแนะนำสินค้า, แชตบอต, ไปจนถึง ChatGPT ล้วนเป็น ANI ทั้งหมด. ต่อให้มันคุยเก่งจนเหมือนคน มันก็ยังเป็นแค่ตัวที่เก่งในขอบเขตของมัน
ที่น่าสนใจคือ ANI ตัวเดียวอาจดูเก่งมาก แต่จริงๆ มันอาจเกิดจาก ANI หลายตัวทำงานร่วมกัน ครับ ลองดูตัวอย่างรถยนต์ไร้คนขับ — รถคันเดียวมี ANI หลายตัวประกอบกัน:
| ANI ในรถไร้คนขับ | หน้าที่ |
|---|---|
| Computer Vision (มองเห็นด้วยคอม) | อ่านภาพจากกล้อง/เซ็นเซอร์ เข้าใจว่ารอบตัวมีอะไร |
| ระบบนำทาง (GPS + แผนที่) | หาตำแหน่งรถ วางเส้นทางที่ปลอดภัย เลี่ยงรถติด/อันตราย |
| ระบบควบคุม | สั่งให้รถเคลื่อนที่ตามข้อมูลจากเซ็นเซอร์และเส้นทาง |
ความเข้าใจตรงนี้สำคัญในมุมคุม control ครับ — ระบบ AI หนึ่งระบบ มักไม่ใช่ AI ตัวเดียว แต่เป็นหลายตัวต่อกันเป็นทอดๆ ซึ่งแปลว่าจุดที่อาจพลาดก็มีหลายจุด ไม่ใช่จุดเดียว
ขั้น 2 — AGI: AI ที่เก่ง “เท่ามนุษย์” (ยังไปไม่ถึง)
AGI (Artificial General Intelligence — ปัญญาประดิษฐ์ทั่วไป) คือ AI ในฝัน ที่ทำงานทาง “สติปัญญา” ได้ทุกอย่างเท่าที่มนุษย์ทำได้ ไม่ใช่เก่งงานเดียวอีกต่อไป. เพื่อจะนับว่าเป็น AGI มันต้องมีครบทุกความสามารถนี้:
- รับรู้ผ่านประสาทสัมผัส (sensory perception)
- ทักษะการเคลื่อนไหวละเอียด (fine motor skills)
- แก้ปัญหา (problem solving)
- นำทางในสภาพแวดล้อม (navigation)
- เข้าใจภาษาธรรมชาติ (natural language understanding)
- ความคิดสร้างสรรค์ (creativity)
- การมีปฏิสัมพันธ์ทางสังคมและอารมณ์ (social-emotional engagement)
วันนี้เราเก่งบางด้านมาก เช่น การมองเห็นและการเข้าใจภาษา แต่ยังขาดอีกหลายด้าน เช่น ทักษะการเคลื่อนไหวละเอียด สามัญสำนึก (common sense) และความสามารถทางสังคม-อารมณ์. ไทม์ไลน์ว่า AGI จะมาเมื่อไหร่ยังไม่มีใครรู้ แต่นักวิจัยเห็นพ้องว่าแม้โอกาสเกิดจะน้อย ผลกระทบของมันใหญ่พอที่ควรเตรียมรับมือไว้
ขั้น 3 — ASI: AI ที่ “เหนือมนุษย์” (เป็นแค่ทฤษฎี)
ASI (Artificial Superintelligence — ปัญญาประดิษฐ์ขั้นสูงสุด) คือขั้นสมมติในอนาคต ที่ AI เหนือกว่ามนุษย์ ไม่ใช่แค่ทำได้เท่าคน แต่ทำได้ในสิ่งที่คนทำไม่ได้เลย ด้วยความเร็วและความแม่นยำที่ไม่เคยมีมาก่อน. ในทฤษฎีมันจะมีคุณสมบัติแบบมนุษย์ครบ เช่น จิตสำนึก ความเชื่อ ความต้องการ อารมณ์ และประสบการณ์เชิงอัตวิสัย. วันนี้ยังเป็นแค่แนวคิด ยังไม่มีอยู่จริง
มุมผู้บริหาร: บันได ANI → AGI → ASI นี้มีค่าในเชิงบริหาร 2 อย่างครับ. หนึ่ง — ใช้ตั้งสติเวลาเสพข่าว: พาดหัวที่ว่า “AI จะแทนที่มนุษย์” หรือ “AI ใกล้รู้ตัวเอง” ส่วนใหญ่กำลังพูดถึง AGI/ASI ที่ยัง ไม่มีจริง ดังนั้นอย่าตัดสินใจลงทุนหรือตื่นตระหนกจากข่าวพวกนี้. สอง — ใช้ตีกรอบความคาดหวัง: เพราะทุกอย่างวันนี้คือ ANI (เก่งงานเดียว) คุณจึงต้อง ออกแบบงานให้ AI ทีละงานแคบๆ ที่ชัดเจน และอย่าคาดหวังให้ AI ตัวเดียว “เข้าใจธุรกิจทั้งหมด” ของคุณ — มันไม่ได้ถูกสร้างมาแบบนั้น
เชื่อมโยงสองมุมเข้าด้วยกันสักนิดครับ: AI ที่เป็น ANI (เก่งงานเดียว) ในมุม functionality ก็คือพวก Reactive Machines + Limited Memory นั่นเอง. ส่วน Theory of Mind นั้นอยู่ในเป้าหมายของ AGI และ Self-Aware AI คือรูปแบบหนึ่งของ ASI. พูดง่ายๆ คือสองมุมนี้เป็นการมองภาพเดียวกันจากคนละด้านครับ
เจาะวงในสุด: AI สร้างเนื้อหา (Generative) กับ AI ลงมือทำเอง (Agentic)
ทีนี้เรากลับมาที่วงในสุดที่ผู้บริหารต้องเจอบ่อยที่สุดในชีวิตจริง — โลกของ GenAI และญาติใหม่ของมันคือ Agentic AI ครับ สองตัวนี้คือที่มาของ “เครื่องมือ AI” เกือบทั้งหมดที่ทีมคุณกำลังใช้หรือกำลังจะซื้อ
Generative AI — AI ที่ “แต่งของใหม่”
GenAI สร้างเนื้อหาใหม่ขึ้นมา — ข้อความ รูป โค้ด เสียง เพลง งานศิลป์ — โดยเรียนรู้ “รูปแบบ” จากข้อมูลก้อนมหาศาลที่มันถูกฝึกมา แล้วเอารูปแบบนั้นมาสร้างของใหม่ที่ไม่เคยมีมาก่อน
กลไกเบื้องหลังที่เป็นจุดเปลี่ยนสำคัญตัวหนึ่งคือ GAN (Generative Adversarial Network — โครงข่ายปฏิปักษ์) ครับ ผมขออธิบายแบบเห็นภาพ — มันคือ neural network สองตัวที่ฝึก “แข่งกัน”:
- ตัวสร้าง (Generator) — หน้าที่ปลอมของขึ้นมาให้เหมือนของจริงที่สุด (เช่น ปลอมรูปหน้าคน)
- ตัวตรวจ (Discriminator) — หน้าที่จับผิดว่าอันไหนของปลอม อันไหนของจริง
ลองนึกภาพ นักปลอมแบงก์กับตำรวจที่ฝึกพร้อมกัน ครับ — นักปลอมยิ่งปลอมเก่งขึ้น ตำรวจก็ยิ่งจับผิดเก่งขึ้น สลับกันไปมา จนสุดท้ายนักปลอมเก่งขนาดที่ตำรวจแยกของจริงของปลอมไม่ออกเลย. นั่นคือตอนที่ GenAI สร้างของได้ “เนียน” จนเหมือนจริง. GAN นี่เองที่อยู่เบื้องหลังภาพ/วิดีโอปลอมคุณภาพสูง การสังเคราะห์เสียง และ deepfake ต่างๆ
ความเสี่ยงที่ผู้บริหารต้องคุมในโลก GenAI มีลักษณะเฉพาะตัวมากครับ เพราะมันไม่ได้ “ทำนาย” แต่ “แต่ง” — และของที่มันแต่งอาจ:
- มั่ว (hallucination) — แต่งข้อมูลผิดออกมาด้วยหน้าตาน่าเชื่อถือ ราวกับเป็นความจริง
- ละเมิดลิขสิทธิ์/ทรัพย์สินทางปัญญา — เพราะมันเรียนจากผลงานคนอื่นมามหาศาล ของที่มันสร้างอาจไปคล้ายของที่มีลิขสิทธิ์
- สร้างเนื้อหาที่เป็นภัย — และถ้าหลุดออกไปสู่สาธารณะ องค์กรอาจโดนทั้งความเสียหายต่อชื่อเสียงและคดีความ
มีอีกประเด็นที่ผูกกับ GenAI โดยตรงคือ Prompt (คำสั่ง/คำถามที่เราป้อน) ครับ — คุณภาพของผลลัพธ์ GenAI ขึ้นกับความชัดเจนของ prompt อย่างมาก. หลายครั้งที่คนบ่นว่า “AI ตอบมั่ว” จริงๆ แล้วเป็นเพราะ prompt ที่ป้อนเข้าไปกำกวมเอง ไม่ใช่ตัวโมเดลพัง. จุดนี้สำคัญในมุม control เพราะ “การคุม input” (การจัดการ prompt) คือ control ด่านแรกของ GenAI — แต่รายละเอียดการคุม prompt และภัยแบบ prompt injection ผมจะลงลึกในตอนเทคนิคถัดๆ ไปของ Domain 3 ครับ
Agentic AI — AI ที่ “ลงมือทำเอง”
นี่คือวิวัฒนาการรุ่นใหม่ที่ผู้บริหารต้องจับตาเป็นพิเศษครับ Agentic AI (AI แบบเอเจนต์) ไม่ได้แค่ “ตอบ” หรือ “สร้าง” แต่มันตัดสินใจเองและลงมือทำเอง เพื่อบรรลุเป้าหมายที่เราตั้งให้ เช่น “เพิ่มความพึงพอใจลูกค้า” หรือ “ทำให้ห่วงโซ่อุปทานมีประสิทธิภาพสูงสุด”
ความต่างระหว่าง GenAI กับ Agentic AI สำคัญมากครับ ผมเทียบให้เห็นแบบนี้:
| GenAI | Agentic AI | |
|---|---|---|
| ทำอะไร | สร้างเนื้อหา ตามที่ขอ แล้วจบ | ตัดสินใจ + ลงมือทำ เป็นชุดเพื่อบรรลุเป้าหมาย |
| เทียบกับพนักงาน | ครีเอทีฟที่ร่างงานให้ แล้วรอเราเอาไปใช้ | ผู้จัดการที่รับเป้าหมายแล้วไปจัดการเองจนจบ |
| ข้อดีเด่น | สร้างของได้เร็วและหลากหลาย | ทำงานเฉพาะทางได้ลึก สร้างได้เร็ว เหมาะกับการทดลอง และมักมั่วน้อยกว่า GenAI เพราะเน้นการแก้ปัญหาและตัดสินใจ |
| ความเสี่ยงเด่น | ผลลัพธ์ที่ปล่อยออกไป (มั่ว/ลิขสิทธิ์) | ขอบเขตอำนาจ — มันลงมือทำเอง ถ้าตั้งเป้าหมายไม่ชัด มันอาจทำพังเป็นชุด |
ตามแหล่งข้อมูล Agentic AI มีข้อดีน่าสนใจ 3 อย่าง: (1) ความเชี่ยวชาญเฉพาะทางสูง — สร้างเอเจนต์ให้ทำงานละเอียดเฉพาะจุดได้เร็ว, (2) เหมาะกับการทดลองและสร้างนวัตกรรม — เพราะมันแก้ปัญหาและตัดสินใจได้ดีขึ้น, (3) น่าเชื่อถือกว่า — มั่ว (hallucinate) น้อยกว่า GenAI เพราะเน้นการตัดสินใจที่สอดคล้องกับเป้าหมาย. ส่วนการใช้งานก็กว้าง ตั้งแต่บริการลูกค้า การแพทย์ การผลิต บริหาร workflow บริหารความเสี่ยงการเงิน ไปจนถึงงานขาย
แต่จุดที่แหล่งข้อมูลย้ำชัด และผมอยากให้เจ้าของกิจการขีดเส้นใต้ คือ “Agentic AI ต้องมีคนกำกับ (human oversight) เสมอ” ครับ. เป้าหมายที่ตั้งไว้คลุมเครือ จะทำให้เอเจนต์ทำงานพลาดได้ทันที. ลองนึกภาพง่ายๆ ครับ ถ้าคุณสั่งผู้จัดการคนใหม่ว่า “ทำให้ลูกค้าพอใจที่สุด” โดยไม่บอกขอบเขต เขาอาจไปลดราคาทิ้งจนเจ๊ง ก็ “ลูกค้าพอใจ” ตามที่สั่งเป๊ะนั่นแหละ Agentic AI ก็พลาดแบบนี้ได้ถ้าเราตั้งเป้าหมายลวกๆ
มุมผู้บริหาร: ความต่างระหว่าง GenAI กับ Agentic AI แปลตรงๆ เป็น “จุดที่ต้องวาง control” ครับ. GenAI = คุมที่ทางออก (output) — เพราะมันสร้างของแล้วส่งให้คนไปใช้ต่อ คนยังเป็นด่านตัดสินใจสุดท้าย ดังนั้นเน้นตรวจสอบเนื้อหาก่อนเอาไปใช้. แต่ Agentic AI = คุมที่ขอบเขตอำนาจ (authority) — เพราะมันลงมือทำเอง คนอาจไม่ทันได้ตรวจก่อนมันทำ ดังนั้น control ที่สำคัญที่สุดคือ “กำหนดให้ชัดว่ามันทำอะไรได้-ทำอะไรไม่ได้, วงเงิน/ขอบเขตแค่ไหน, และจุดไหนต้องหยุดถามคนก่อน”. ยิ่ง AI ลงมือทำเองได้มากเท่าไหร่ คุณยิ่งต้องคิดเรื่อง “เบรก” และ “คนกำกับ” มากขึ้นเท่านั้น
แถม: Predictive Models (AI ที่ “เดาอนาคต”)
อีกกลุ่มที่เจอบ่อยในธุรกิจคือ Predictive Model (โมเดลทำนาย) ครับ ใช้ข้อมูลในอดีต + ML หารูปแบบ แล้วพยากรณ์เหตุการณ์/แนวโน้มในอนาคต เช่น คาดการณ์ว่าเครื่องจักรจะเสียเมื่อไหร่ (predictive maintenance) พยากรณ์ยอดขาย หรือยกระดับการตรวจจับภัยไซเบอร์
ความเสี่ยงเด่นของกลุ่มนี้คือ คนมักเอาผลทำนายไปใช้ตัดสินใจธุรกิจทั้งที่ไม่เข้าใจว่ามันทำนายมาจากอะไร ครับ. ในมุมผู้บริหาร — ก่อนจะเชื่อตัวเลขพยากรณ์ใดๆ ต้องถามให้ได้ว่า “ตัวเลขนี้มาจากฐานข้อมูลและสมมติฐานอะไร” เพราะถ้าข้อมูลในอดีตเอนเอียง ผลทำนายก็จะพาเราตัดสินใจผิดอย่างมั่นใจ
เปิดฝาดู: เครื่องเรียนรู้ของ AI ทำงานยังไง (พอเข้าใจเพื่อคุม)
มาถึงส่วนที่เทคนิคที่สุดของตอนนี้ครับ แต่ผมจะเล่าแค่ “พอเข้าใจเพื่อเลือก control ได้ถูก” ตามที่สัญญาไว้ ไม่ลงลึกระดับสร้างโมเดล. หัวใจที่ผู้บริหารต้องเก็บกลับไปคือ AI เรียนรู้จากข้อมูลได้หลายแบบ และแต่ละแบบมีจุดอ่อนคนละจุด ซึ่งแปลว่าต้องคุมคนละแบบ
ML (Machine Learning) เรียนรู้ได้ 3 แบบหลัก ครับ ผมเทียบกับ “วิธีสอนพนักงานใหม่” 3 แบบ:
| แบบการเรียนรู้ | เปรียบกับการสอนคน | ภาษาคน |
|---|---|---|
| Supervised (มีคนเฉลย) | สอนโดยมีเฉลยให้ดูคู่กันทุกข้อ | ป้อนข้อมูลที่ ติดป้ายคำตอบ (label) ไว้แล้ว ให้โมเดลเรียนความสัมพันธ์ “เข้าแบบนี้ → ออกแบบนี้” |
| Unsupervised (ไม่มีเฉลย) | โยนข้อมูลดิบให้ แล้วให้ไปหาเองว่าจัดกลุ่มยังไง | ป้อนข้อมูล ดิบ ไม่มีป้าย ให้โมเดลหารูปแบบ/กลุ่มที่ซ่อนอยู่เอง |
| Reinforcement (ลองผิดลองถูก) | ให้ลองทำ ทำดีให้รางวัล ทำพลาดหักคะแนน | โมเดลลองทำในสภาพแวดล้อม แล้วเรียนจาก รางวัล/บทลงโทษ ค่อยๆ เก่งขึ้น |
ก่อนเจาะแต่ละแบบ มีคำหนึ่งที่ต้องเข้าใจคือ “ป้ายกำกับ (Label)” ครับ — คือคำตอบที่ถูกต้องที่เราติดไว้บนข้อมูลสอน เช่น โมเดลดูรูปสัตว์ ป้ายก็คือ “แมว/หมา/กระต่าย/งู”. ฟังดูง่าย แต่ในความจริง การติดป้ายเป็นงานหนักและแพง — เพราะข้อมูลมีเป็นล้านชิ้น ต้องใช้คนติดทีละชิ้น, บางทีคำตอบกำกวมต้องใช้ผู้เชี่ยวชาญ, และบางเรื่องไม่มี “คำตอบที่ถูก” ให้ติดด้วยซ้ำ. ความยากของการติดป้ายนี่แหละครับที่เป็นเหตุผลว่าทำไมต้องมีการเรียนรู้หลายแบบ
แบบที่ 1 — Supervised Learning (เรียนแบบมีเฉลย)
Supervised learning ใช้ข้อมูลที่นักวิทยาศาสตร์ข้อมูลติดป้ายคำตอบไว้ให้แล้ว สอนให้โมเดลเรียนความสัมพันธ์ระหว่าง “อินพุต → คำตอบ” จุดเด่นคือพอเรียนจบ มันเอาไปทำนายข้อมูลใหม่ที่ไม่เคยเห็นได้
Supervised แบ่งเป็น 2 งานหลัก:
- Regression (ทำนายค่าตัวเลข) — ทำนายค่าจากช่วงต่อเนื่อง เช่น ทำนายราคาบ้านจากขนาดพื้นที่ → ผลออกมาเป็น ตัวเลข (เชิงปริมาณ)
- Classification (จัดหมวด) — ทำนายว่าน่าจะอยู่หมวดไหน เช่น อีเมลนี้เป็น spam หรือไม่ → ผลออกมาเป็น หมวดหมู่ (เชิงคุณภาพ)
จุดที่ผู้บริหารต้องคุม: Supervised learning พึ่งคนและพึ่งข้อมูลคุณภาพสูงอย่างหนัก ครับ ความเสี่ยงใหญ่สุดสองเรื่องคือ คุณภาพข้อมูล กับ อคติ (bias) — เพราะมันเรียนตามป้ายที่คนติดให้ ถ้าป้ายผิดหรือเอนเอียง โมเดลก็จะเอนเอียงตาม. คิดง่ายๆ ว่า “สอนผิด ก็จำผิด”
มีลูกผสมที่ควรรู้จักด้วย: Semi-supervised (ใช้ข้อมูลทั้งมีป้ายและไม่มีป้ายผสมกัน — เหมาะตอนข้อมูลติดป้ายมีน้อยหรือติดป้ายแพง) และ Self-supervised (โมเดลสร้างป้ายให้ตัวเองจากข้อมูลดิบ — ใช้มากในงานคอมพิวเตอร์วิทัศน์ที่ติดป้ายยาก)
แบบที่ 2 — Unsupervised Learning (เรียนแบบไม่มีเฉลย)
Unsupervised learning เด่นตรงเรียนจากข้อมูล ดิบ ไม่มีป้าย โดยไม่ต้องมีคนคอยชี้แนะ มันเก่งเรื่องหารูปแบบ ความสัมพันธ์ และโครงสร้างที่ซ่อนอยู่ในข้อมูล. มี 3 งานหลัก:
| งาน | ภาษาคน | ตัวอย่างใช้งาน |
|---|---|---|
| Clustering (จับกลุ่ม) | จับข้อมูลที่คล้ายกันมารวมกลุ่ม โดยไม่ได้บอกล่วงหน้าว่าจะมีกี่กลุ่ม | แบ่งกลุ่มลูกค้าเพื่อทำการตลาด |
| Association rules (หาความเชื่อมโยง) | หาว่าของอะไรมักมาคู่กัน | ”คนซื้อ A มักซื้อ B ด้วย” |
| Dimensionality reduction (ลดมิติ) | ย่อข้อมูลที่ซับซ้อนมากๆ ให้เรียบง่ายลง โดยยังเก็บสาระสำคัญไว้ | ทำให้ข้อมูลก้อนใหญ่จัดการง่ายขึ้น |
จุดที่ผู้บริหารต้องคุม: เพราะมันหากลุ่ม/รูปแบบเองโดยไม่มีเฉลย ความเสี่ยงเด่นคือ อธิบายผลได้ยาก ครับ — มันบอกว่า “ลูกค้ากลุ่มนี้คล้ายกัน” แต่อาจอธิบายไม่ได้ชัดว่า “คล้ายเพราะอะไร”. ดังนั้นต้องมี คนคอยกำกับในวง (HITL — Human in the Loop) เพื่อตรวจว่าผลที่ได้สมเหตุสมผลและเชื่อถือได้จริง. ในโลกความปลอดภัย Unsupervised มักใช้ตรวจจับสิ่งผิดปกติ (anomaly detection) ใน log
แบบที่ 3 — Reinforcement Learning (เรียนแบบลองผิดลองถูก)
Reinforcement Learning (RL) เน้นการ ตัดสินใจและควบคุมด้วยตัวเอง ในสภาพแวดล้อมที่ซับซ้อนและไม่แน่นอน โดยพยายามทำให้ได้ “รางวัลสะสม” มากที่สุด
ภาพที่คลาสสิกที่สุดคือ การฝึกหมาให้ทำท่าใหม่ ครับ — ทำถูกทางให้ขนม ทำผิดทางไม่ให้ ทำซ้ำหลายๆ รอบ หมาก็เรียนรู้เองว่าทำท่าไหนถึงจะได้ขนม. RL ทำงานหลักการเดียวกันเป๊ะ แต่อยู่ในคอมพิวเตอร์. ในงานความปลอดภัย RL ใช้ทำระบบตรวจจับการบุกรุกที่ปรับตัวได้แบบเรียลไทม์ (adaptive intrusion detection) หรือใช้ศึกษามัลแวร์ในสภาพแวดล้อมควบคุมเพื่อหาทางรับมือ
จุดที่ผู้บริหารต้องคุม: ความเสี่ยงของ RL มาจาก ความเป็นอิสระของมัน ครับ — เพราะมันลองทำเองและเรียนจากผลลัพธ์. จุดอันตรายคือ “ช่วงสำรวจ” (exploration phase) ที่มันลองทำสิ่งใหม่ๆ ซึ่งอาจก่ออันตรายได้. ดังนั้นต้องคิดเรื่อง ความปลอดภัยและจริยธรรมตั้งแต่ตอนฝึก และใช้ HITL ตรวจว่าการกระทำที่มันจะใช้จริงในงานนั้น “ปลอดภัยแล้ว” ก่อนปล่อยลงสนามจริง
หัวใจที่อยู่ข้างใน: Neural Network (โครงข่ายประสาทเทียม)
ทีนี้มาดู “เครื่องยนต์” ที่อยู่เบื้องหลัง Deep Learning กันครับ — Neural Network (NN — โครงข่ายประสาทเทียม). อีกครั้ง ผมจะเล่าแค่ “พอเห็นภาพเพื่อเข้าใจความเสี่ยง” ส่วนกลไกเต็มๆ รอซีรีส์ AI 101 นะครับ
NN คือกลุ่มของอัลกอริทึมที่ออกแบบมา เลียนแบบวิธีทำงานของสมองมนุษย์ — เรียนรู้จากข้อมูลที่ป้อนเข้าไป ค่อยๆ ปรับความเข้าใจ และเก่งขึ้นทุกรอบ. มันมี 3 ชั้นหลัก ครับ:
[ ชั้นรับเข้า ] [ ชั้นซ่อน ] [ ชั้นส่งออก ] Input Layer →→→ Hidden Layer →→→ Output Layer (รับข้อมูลดิบ) (คิด/เรียนรู้) (ให้คำตอบ)- ชั้นรับเข้า (Input layer) — รับข้อมูลดิบเข้ามา
- ชั้นซ่อน (Hidden layer) — ที่เกิดการ “คิด” และเรียนรู้ เรียกว่า “ซ่อน” เพราะมันไม่ได้สัมผัสข้อมูลเข้าหรือคำตอบโดยตรง แต่ประมวลผลสัญญาณอยู่ตรงกลาง
- ชั้นส่งออก (Output layer) — ให้คำตอบหรือผลลัพธ์สุดท้าย
หน่วยย่อยในแต่ละชั้นเรียกว่า neuron (เซลล์ประสาทเทียม) — แต่ละตัวรับข้อมูลเข้ามา ทำการคำนวณ แล้วส่งต่อไปชั้นถัดไป
และนี่คือนิยามที่ผู้บริหารควรจำไว้ครับ ถ้า neural network มีมากกว่า 3 ชั้น (รวมชั้นเข้า-ออก) ก็นับเป็น Deep Learning นั่นคือที่มาของคำว่า “deep” (ลึก) มันลึกเพราะมีหลายชั้นซ้อนกันนั่นเอง
NN มีหลายแบบ ที่ควรรู้จักผิวๆ มี 3 แบบ:
| ชนิด NN | เหมาะกับ | ตัวอย่างงาน |
|---|---|---|
| FNN (Feedforward) | ข้อมูลไหลทางเดียวจากเข้าไปออก ไม่มีวนกลับ | กรองอีเมล, จดจำตัวอักษร, จดจำภาพ |
| RNN (Recurrent) | ข้อมูลที่เป็นลำดับ/เวลา มีการวนข้อมูลจากขั้นก่อนมาช่วยขั้นถัดไป | แปลภาษา, รู้จำเสียงพูด, สร้างข้อความ |
| CNN (Convolutional) | ข้อมูลแบบตาราง โดยเฉพาะภาพ จับขอบ พื้นผิว วัตถุได้ | แท็กรูป, ตรวจจับวัตถุ, ภาพการแพทย์ |
มุมผู้บริหาร: เหตุผลเดียวที่เจ้าของกิจการต้องรู้จัก neural network คือเพื่อเข้าใจว่า ทำไม Deep Learning ถึง “อธิบายยาก” (กล่องดำ) ครับ. ลองดูคำว่า “ชั้นซ่อน” — มันซ่อนจริงๆ คือต่อให้เป็นวิศวกรที่สร้างมันเอง ก็ยากที่จะชี้ชัดว่า “ทำไมข้อมูลนี้ผ่านชั้นซ่อนหลายสิบชั้นแล้วออกมาเป็นคำตอบนี้”. นี่คือเหตุผลที่ในงานสำคัญๆ (อนุมัติสินเชื่อ คัดคน วินิจฉัยโรค) ความเสี่ยงอันดับหนึ่งของ Deep Learning ไม่ใช่ราคาแพงหรือช้า แต่คือ “อธิบายการตัดสินใจไม่ได้” — ซึ่งเป็นปัญหาใหญ่เวลาต้องตอบลูกค้า ผู้กำกับดูแล หรือศาลว่า “ทำไมระบบถึงปฏิเสธคนนี้”. ยิ่งโมเดลลึก ยิ่งแม่น แต่ยิ่งอธิบายยาก — เป็นการแลกที่ผู้บริหารต้องชั่งน้ำหนักเอง
มีอีกคำที่ได้ยินบ่อยคือ Neural Architecture Search — การให้ AI ช่วยออกแบบโครงสร้าง neural network ที่ดีที่สุดสำหรับปัญหาหนึ่งๆ โดยอัตโนมัติ. ฟังดูเหมือน “AI สร้าง AI” แต่จุดที่ต้องจำคือ — มันยังต้องอาศัยคนกำกับและตั้งโจทย์ให้ ไม่ได้ทำเองลอยๆ ทั้งหมด
วัตถุดิบพื้นฐาน: Algorithm (อัลกอริทึม) กับ Hyperparameter
ลงลึกอีกชั้นหนึ่งครับ — เบื้องหลังโมเดลทุกตัวคือ Algorithm (อัลกอริทึม). ผมจะเล่าสั้นๆ พอให้ผู้บริหารเข้าใจว่ามันคืออะไรและเกี่ยวกับความเสี่ยงยังไง
Algorithm = ชุดขั้นตอน/กฎทีละสเต็ปเพื่อแก้ปัญหาหนึ่งๆ ครับ. ในโลก ML อัลกอริทึมคือ “ตัวต่อพื้นฐาน” ที่ทำให้โมเดลวิเคราะห์ข้อมูล จับรูปแบบ และทำนายได้. คิดง่ายๆ ว่าอัลกอริทึมคือ “สูตร/วิธีคิด” ส่วนโมเดลคือ “ผลลัพธ์ที่ได้หลังเอาสูตรไปเรียนกับข้อมูลจริง”
แต่ละอัลกอริทึมมีปุ่มปรับที่เรียกว่า Hyperparameter (ค่าตั้งต้น) — เป็นค่าที่เราตั้งไว้ ก่อน เริ่มฝึกโมเดล เพื่อกำกับว่าโมเดลจะเรียนยังไง เช่น เรียนเร็วแค่ไหน หรือต้นไม้ตัดสินใจลึกกี่ชั้น. แหล่งข้อมูลย้ำว่า “การเลือก hyperparameter ให้ถูก บางทีสำคัญพอๆ กับการเลือกอัลกอริทึมให้ถูกเลย”
ที่ผู้บริหารต้องเข้าใจคือ การเลือกอัลกอริทึมผิดประเภทกับงาน จะทำให้ผลลัพธ์ไม่แม่นหรือไม่มีประสิทธิภาพ ครับ. อัลกอริทึมแบ่งตามแบบการเรียนรู้ 3 แบบที่เราเพิ่งคุยกัน ผมยกตัวอย่างที่เจอบ่อยพอให้เห็นภาพ (ไม่ต้องจำชื่อครับ จำแค่ว่า “งานต่างกัน ใช้อัลกอริทึมต่างกัน”):
| กลุ่ม | ตัวอย่างอัลกอริทึม | ใช้ทำอะไร |
|---|---|---|
| Supervised | Linear regression | ทำนายราคาบ้าน |
| Logistic regression | กรอง spam (แยก 2 ทาง) | |
| Tree-based / Decision tree | จัดหมวด ทำนายค่า จากเงื่อนไขเป็นชั้นๆ | |
| Support Vector Machine | จัดหมวดภาพ (ใช้ข้อมูลน้อยก็ได้) | |
| K-Nearest Neighbor | จดจำใบหน้า (ดูจากเพื่อนบ้านที่คล้าย) | |
| Naïve Bayes | ตรวจ spam / จัดหมวดเอกสาร | |
| Unsupervised | K-means clustering | แบ่งกลุ่มลูกค้าทำการตลาด |
| Hierarchical clustering | จัดกลุ่มแบบลำดับชั้น (เช่น แผนที่ยีน) | |
| Principal Component Analysis | ลดมิติข้อมูล | |
| Reinforcement | Q-learning | วางเส้นทางหุ่นยนต์ |
| Deep Q-Network (DQN) | ขับขี่อัตโนมัติขั้นสูง | |
| Policy-based | ควบคุมแขนกลหุ่นยนต์ |
อีกเทคนิคที่ควรรู้จักชื่อคือ Ensemble modeling (การรวมหลายโมเดล) — แทนที่จะใช้โมเดลเดียว ก็ใช้หลายโมเดลช่วยกันทำนายเพื่อลดจุดอ่อนของโมเดลเดี่ยว (เช่น อคติ ความแปรปรวนสูง ความไม่แม่น) เทคนิคย่อยมีชื่ออย่าง Stacking, Bagging, Blending, Boosting — รายละเอียดไม่จำเป็นสำหรับผู้บริหาร แต่หลักคิด “หลายหัวดีกว่าหัวเดียว” นี่มีค่าครับ
มุมผู้บริหาร: คุณไม่ต้องรู้ว่า K-means ต่างจาก SVM ยังไงหรอกครับ — นั่นงานทีมเทคนิค. แต่สิ่งที่ผู้บริหารต้องเข้าใจคือ “อัลกอริทึมและ hyperparameter เป็นทางเลือกที่คนเลือก ไม่ใช่ของที่มาจากธรรมชาติ”. แปลว่ามันมี “คนตัดสินใจ” อยู่เบื้องหลังโมเดลทุกตัว — ใครสักคนเลือกว่าจะใช้อัลกอริทึมไหน ตั้งค่ายังไง. ความเข้าใจนี้สำคัญมากในมุม governance เพราะมันหมายความว่า ถ้าโมเดลออกผลเอนเอียงหรือพลาด — เราตามรอยกลับไปถามได้ว่า “ใครเลือก ทำไมเลือกแบบนี้ ทดสอบทางเลือกอื่นแล้วหรือยัง”. อย่ายอมรับคำตอบว่า “ก็มันเป็นอย่างนั้นเอง” — เพราะมันไม่ใช่ มันมีคนเลือก
คำที่ต้องรู้จัก: LLM, Transformer และศัพท์ที่ผู้บริหารเจอบ่อย
ปิดท้ายด้วยกลุ่มคำที่เจ้าของกิจการเจอบ่อยที่สุดในชีวิตจริง — โดยเฉพาะ LLM กับ Transformer ที่อยู่เบื้องหลัง ChatGPT และเครื่องมือ GenAI ทั้งหลายครับ
LLM และ Transformer — เครื่องยนต์ของ ChatGPT
LLM (Large Language Model — โมเดลภาษาขนาดใหญ่) คือ AI ที่ฝึกจากข้อมูล (ส่วนใหญ่เป็นข้อความ) จำนวนมหาศาล ทั้งหนังสือ บทความ คลังโค้ด เอกสาร เพื่อเรียนรู้ที่จะเข้าใจและสร้างข้อความแบบคน. ใช้ในงานสรุปความ แปลภาษา และแชตบอตต่างๆ
หัวใจที่ทำให้ LLM ทำงานได้คือสถาปัตยกรรมที่เรียกว่า Transformer ครับ ผมขออธิบายแบบภาษาคนที่สุด คือ Transformer ใช้กลไกชื่อ “attention” (การให้ความสนใจ) เพื่อดูว่าในประโยคหนึ่ง คำไหนเกี่ยวข้องและสำคัญกับคำไหน แล้วประมวลผลทุกคำ พร้อมกันทีเดียว (ไม่ใช่ทีละคำ) ทำให้เรียนรู้และทำงานได้เร็ว เหมาะกับงานแปลและสร้างข้อความมาก
ผมขอย้ำตรงนี้ครับ — กลไกลึกๆ ว่า transformer “ให้ความสนใจ” ยังไง, attention คำนวณยังไง, LLM ทำนายคำถัดไปจากอะไร — เรื่องพวกนี้ผมตั้งใจจะแยกไปเล่าเต็มๆ ในซีรีส์ AI 101 (ภาษาคน) ครับ เพราะมันสนุกแต่ลึก ไม่จำเป็นสำหรับการตัดสินใจระดับบริหาร. ตอนนี้รู้แค่ว่า “LLM = สมองภาษา, Transformer = เครื่องยนต์ที่ทำให้มันเร็วและเก่ง” ก็พอครับ
ศัพท์อื่นที่ผู้บริหารควรอ่านป้ายออก
นอกจาก LLM/Transformer ยังมีคำที่เจอบ่อยและมีนัยต่อการคุม control ผมรวบมาในตารางเดียวพร้อมแปลและ “จุดที่ต้องระวัง”:
| คำ | ภาษาคน | จุดที่ผู้บริหารต้องระวัง |
|---|---|---|
| Foundation Model / GPAI (โมเดลฐาน / AI อเนกประสงค์) | โมเดลขนาดใหญ่ที่ฝึกจากข้อมูลกว้างมาก แล้วเอาไปปรับใช้กับงานสารพัด | ตัวเดียวเอาไปใช้หลายงาน → จุดพลาดจุดเดียวกระทบหลายงานพร้อมกัน |
| Prompt (คำสั่ง/คำถามที่ป้อน) | อินพุตที่คน (มักเป็นคน) ป้อนเข้าไปเพื่อให้ GenAI สร้างผลลัพธ์ | ผลลัพธ์แย่บ่อยครั้งมาจาก prompt กำกวม ไม่ใช่โมเดลพัง → ต้องคุม/มาตรฐาน prompt |
| NLP (การประมวลผลภาษาธรรมชาติ) | สาขาที่ทำให้คอมเข้าใจ ตีความ และสร้างภาษามนุษย์ได้ | เป็นฐานของแชตบอต/รู้จำเสียง — ข้อมูลภาษาคือข้อมูลอ่อนไหวที่ต้องดูแล |
| Sentiment Analysis (วิเคราะห์อารมณ์/ความเห็น) | ดูว่าข้อความสื่ออารมณ์บวก ลบ หรือเป็นกลาง | ใช้ฟังเสียงลูกค้า แต่ระวังตีความอารมณ์ผิด โดยเฉพาะภาษาไทยที่มีบริบท/ประชด |
| Underfitting (เรียนน้อยไป) | โมเดลง่ายเกินไป จับรูปแบบในข้อมูลไม่ได้ → แม่นทั้งตอนสอนและตอนใช้จริงไม่ดีทั้งคู่ | สัญญาณว่าโมเดล “โง่เกินงาน” — ต้องมีกระบวนการตรวจจับ |
| Overfitting (เรียนมากเกิน/ท่องจำ) | โมเดล “ท่องจำ” ข้อมูลสอนเป๊ะเกินไป รวมทั้ง noise/ของแปลกปลอม → แม่นตอนสอนมาก แต่พังตอนเจอข้อมูลใหม่ | อันตรายเพราะ “ดูเหมือนเก่ง” ตอนทดสอบ แต่พลาดจริงตอนใช้งาน → ต้องทดสอบกับข้อมูลที่ไม่เคยเห็น |
| AIaaS (AI as a Service — AI แบบบริการเช่าใช้) | บริการ AI บนคลาวด์ที่เช่าใช้แบบ subscription. เราไม่รู้ว่าโมเดลถูกสร้างมายังไง และเข้าไม่ถึงโครงสร้างเบื้องหลัง | ติดตั้งง่ายที่สุดก็จริง แต่ “มองไม่เห็นข้างใน” — ความเสี่ยงเรื่องข้อมูลและการพึ่งพา vendor สูง |
สองคำที่ผมอยากให้เจ้าของกิจการจำเป็นพิเศษคือ Underfitting กับ Overfitting ครับ เพราะมันคือ “สองโรค” ของโมเดลที่อยู่คนละขั้ว — Underfitting คือเรียนน้อยไปจนโง่, Overfitting คือเรียนมากไปจนท่องจำแล้วใช้จริงไม่ได้. ตัวที่หลอกตาที่สุดคือ Overfitting เพราะตอนทดสอบมันดูเก่งมาก เลยทำให้คนมั่นใจผิดๆ ก่อนเอาไปใช้จริงแล้วพังครับ
มุมผู้บริหาร: ในกลุ่มศัพท์นี้ คำที่มีนัยต่อการตัดสินใจระดับบริหารมากที่สุดคือ AIaaS ครับ — เพราะเครื่องมือ AI ส่วนใหญ่ที่ SME หยิบมาใช้ (ผู้ช่วยเขียนงาน แชตบอต เครื่องมือวิเคราะห์) ล้วนเป็น AIaaS ทั้งนั้น. จุดสำคัญคือคำว่า “เราไม่รู้ว่าข้างในทำงานยังไง” — เราเช่าใช้ความสามารถ แต่มองไม่เห็นเครื่องยนต์. นี่แปลว่า control ของเราต้องย้ายไปอยู่ที่ “ขอบ” — คือคุมว่าจะป้อนข้อมูลอะไรเข้าไป (อย่าป้อนความลับ/ข้อมูลส่วนบุคคลพร่ำเพรื่อ) และคุมว่าจะเอาผลลัพธ์ไปใช้ยังไง (ตรวจก่อนเชื่อ) — เพราะ “ข้างใน” เราคุมไม่ได้เลย. ความเข้าใจเรื่อง build-vs-buy และความรับผิดร่วม (shared responsibility) ที่เราคุยกันใน Domain ก่อนๆ จะกลับมาสำคัญมากตรงนี้
สรุป Domain 3 ตอนเปิด — “รู้ type ก่อน เลือก control ทีหลัง”
เรามาไกลพอสมควรในตอนเปิด Domain 3 นี้ครับ ผมขอรวบทั้งหมดให้เหลือหลักคิดที่หยิบกลับไปใช้ได้จริง
ทั้งตอนนี้สรุปเป็นประโยคเดียวได้ว่า:
“ก่อนจะถามว่า ‘จะคุม AI ตัวนี้ด้วย control อะไร’ ต้องตอบให้ได้ก่อนว่า ‘มันเป็น AI แบบไหน’ — เพราะประเภทของ AI คือสิ่งที่บอกว่าจุดเสี่ยงอยู่ตรงไหน และต้องส่องไฟไปทางไหน”
ตารางสรุป “type → จุดที่ต้องคุม” ที่ผมอยากให้ติดไม้ติดมือไปจากตอนนี้:
| ประเภท AI | ลักษณะ | จุดที่ผู้บริหารต้องคุมเป็นหลัก |
|---|---|---|
| ML ทำนาย (Predictive/Supervised) | เรียนจากข้อมูลมีป้าย แล้วทำนาย | ข้อมูลเข้า — คุณภาพและอคติของข้อมูลสอน |
| Unsupervised | หากลุ่ม/รูปแบบจากข้อมูลดิบเอง | การอธิบายผล — ต้องมี HITL ตรวจว่าสมเหตุสมผล |
| Reinforcement (RL) | ลองผิดลองถูก ตัดสินใจเอง | ช่วงสำรวจ — ความปลอดภัย/จริยธรรมตอนฝึก + HITL |
| Deep Learning (NN ลึก) | neural network หลายชั้น แม่นแต่ทึบ | การอธิบาย (กล่องดำ) — ยิ่งลึกยิ่งอธิบายยาก |
| GenAI | สร้างเนื้อหาใหม่ | ทางออก (output) — มั่ว/ลิขสิทธิ์/เนื้อหาเป็นภัย |
| Agentic AI | ตัดสินใจ + ลงมือทำเอง | ขอบเขตอำนาจ — กำหนดเส้น + จุดหยุดถามคน |
| AIaaS (เช่าใช้) | มองไม่เห็นข้างใน | ขอบ (input/output) — คุมข้อมูลเข้า + ตรวจผลก่อนใช้ |
3 ข้อคิดที่อยากให้เก็บกลับไปจากตอนนี้:
- “AI” คำเดียวบอกอะไรไม่ได้ — ต้องถามต่อเสมอว่าเป็นวงไหน (ML/DL/GenAI) เรียนรู้แบบไหน (มีเฉลย/ไม่มีเฉลย/ลองผิดลองถูก) และทำอะไร (ทำนาย/สร้าง/ลงมือทำเอง). คำตอบเหล่านี้ชี้จุดควบคุมทันที
- เบื้องหลังโมเดลทุกตัวมี “คนเลือก” — เลือกข้อมูล เลือกอัลกอริทึม ตั้งค่า ติดป้าย. ดังนั้นเมื่อมันพลาด เราตามรอยและถามความรับผิดชอบได้เสมอ อย่ายอมรับว่า “มันเป็นอย่างนั้นเอง”
- ยิ่ง AI ลงมือเองได้มาก ยิ่งต้องคิดเรื่องเบรกมาก — จาก ML ทำนายเฉยๆ ที่คนยังตัดสินใจสุดท้าย ไปจนถึง Agentic AI ที่ทำเอง — เส้นทางนี้คือเส้นทางที่ “คนกำกับ (human oversight)” สำคัญขึ้นเรื่อยๆ
เกริ่นตอนหน้า — จาก “รู้จัก AI” สู่ “ออกแบบบ้านให้ AI อยู่อย่างปลอดภัย”
ตอนนี้เรารู้จัก “ผู้เช่า” ทุกแบบที่จะเข้ามาอยู่ในองค์กรแล้วครับ — รู้ว่าแต่ละแบบนิสัยยังไง เสี่ยงตรงไหน
ตอนต่อไปของ Domain 3 เราจะขยับจาก “รู้จักตัว AI” ไปสู่ “ออกแบบสถาปัตยกรรมความปลอดภัยให้ AI” (AI Security Architecture & Design) — คือเรื่องของการวางโครงสร้างบ้านให้พนักงาน AI เข้ามาอยู่ได้อย่างปลอดภัย ตั้งแต่บทบาทของเราในระบบนิเวศ AI (เราเป็นผู้สร้าง ผู้ให้บริการ หรือผู้ใช้?) ไปจนถึงแนวคิด Secure by Design — ฝังความปลอดภัยตั้งแต่ออกแบบ ไม่ใช่แปะทีหลัง
ถ้าตอนนี้คือ “รู้จักพนักงานใหม่ว่าเป็นคนแบบไหน” ตอนหน้าก็คือ “จัดโต๊ะ วางกฎห้อง และออกแบบทางเดินในออฟฟิศให้เขาทำงานได้โดยไม่ไปชนใคร” ครับ
แล้วเจอกันตอนหน้าครับ 🙂
อ้างอิงแนวคิด: AAISM — Domain 3: Section 3.1 (Types of AI) ครอบคลุม 3.1.1 ประเภทตามความสามารถ, 3.1.2 ประเภทตามระดับสติปัญญา (ANI/AGI/ASI), 3.1.3 Generative & Agentic Models, 3.1.4 Predictive Models, 3.1.5 Machine Learning Models (supervised/unsupervised/reinforcement + neural networks), 3.1.6 Algorithms และ 3.1.7 Additional AI Considerations (LLM/Transformer/NLP ฯลฯ). กรอบแนวคิดสาธารณะที่เกี่ยวข้องและจะอ้างถึงในตอนเทคนิคถัดไป: NIST AI RMF 1.0, MITRE ATLAS, OWASP Top 10 for LLM Applications. ตัวอย่างทั้งหมดในบทเป็นกรณีสมมติเพื่อประกอบความเข้าใจ ไม่ได้อ้างอิงบุคคลหรือเหตุการณ์จริง