สารบัญ
AI 101 — ปัญญาประดิษฐ์ฉบับภาษาคน · Part 1 (เบื้องหลัง: AI ทำงานยังไง) ภาคนี้ผมเขียนให้เจ้าของกิจการกับคนทำงานทั่วไปที่ไม่ใช่สาย IT ได้แอบเปิดฝาดูว่า “ข้างใน AI มันทำงานยังไง” แบบไม่ต้องกลัวศัพท์ ไม่ต้องเรียนเลข ตอนนี้เป็นเรื่อง “Supervised Learning — การเรียนแบบมีเฉลย” กับลูกของมันสองตัวที่คนสับสนกันบ่อยมาก คือ regression (ทำนายตัวเลข) กับ classification (จัดกลุ่ม) (สารบัญเต็มของซีรีส์จะตามมาทีหลังนะครับ)
ลองนึกภาพเด็กคนนึงกำลังหัดดูผลไม้
ลองนึกภาพเด็กเล็กๆ คนนึงที่ยังแยกผลไม้ไม่เป็นเลยครับ แล้วมีผู้ใหญ่นั่งสอนข้างๆ หยิบของขึ้นมาทีละลูก หยิบส้มขึ้นมาบอกว่า “นี่ส้มนะ” หยิบแอปเปิลบอกว่า “นี่แอปเปิล” หยิบกล้วยบอกว่า “นี่กล้วย” ทำซ้ำไปเรื่อยๆ เป็นร้อยลูกพันลูก
ทีนี้พอวันนึงเอาผลไม้ลูกใหม่ที่เด็กไม่เคยเห็นมาวางตรงหน้า แล้วถามว่า “นี่อะไรเอ่ย” — เด็กที่ดูมาเยอะพอ ก็จะเดาได้ว่า “อันนี้น่าจะส้มนะ เพราะมันกลมๆ สีส้มๆ เหมือนที่เคยเห็น”
นี่แหละครับคือหัวใจของสิ่งที่วงการเรียกว่า Supervised Learning (อ่านว่า ซู-เปอร์-ไวซ์ด เลิร์นนิ่ง แปลแบบบ้านๆ คือ “การเรียนแบบมีคนคอยเฉลยให้”) คำว่า supervise มันแปลว่า “คอยกำกับดูแล” ฉะนั้นภาพง่ายที่สุดคือ มีครูนั่งข้างๆ คอยบอกเฉลยให้ทุกข้อ ระหว่างที่ AI กำลังหัด ไม่ได้ปล่อยให้มันเดาเองมั่วๆ
แล้ว “เฉลย” ที่ว่าเนี่ย ในวงการเขาเรียกว่า label (เลเบล แปลว่า “ป้ายกำกับ”) ครับ — ก็คือป้ายที่บอกว่าของชิ้นนี้คำตอบที่ถูกคืออะไร เหมือนผู้ใหญ่ที่ติดป้ายในใจให้ผลไม้แต่ละลูกว่า “นี่คือส้ม” นั่นแหละ AI เรียนจากข้อมูลที่ “ติดป้ายเฉลยไว้แล้ว” พวกนี้
ผมจะพาไปดูทีละเรื่องนะครับ ว่ามันเรียนยังไง แล้วทำไมงานสองแบบที่ดูคล้ายกัน (regression กับ classification) จริงๆ มันคนละเรื่องกันเลย
”มีเฉลย” สำคัญตรงไหน — เทียบกับเรียนแบบไม่มีเฉลย
ก่อนจะลงรายละเอียด ผมอยากให้เห็นภาพก่อนว่าทำไมคำว่า “มีเฉลย” มันถึงเป็นเรื่องใหญ่
ลองนึกภาพการเรียนสองแบบนะครับ
แบบแรก คุณนั่งเรียนกับติวเตอร์ที่มีเฉลยอยู่ในมือ คุณลองทำโจทย์ ติวเตอร์ก็บอกทันทีว่า “ข้อนี้ถูก ข้อนี้ผิด ที่ถูกคืออันนี้นะ” คุณก็ค่อยๆ ปรับ ค่อยๆ เก่งขึ้นเพราะรู้ว่าคำตอบจริงคืออะไร
แบบที่สอง คุณได้กล่องรูปภาพมาเป็นพันใบ แต่ไม่มีใครบอกว่าแต่ละใบคืออะไรเลย คุณได้แต่นั่งดูแล้วจัดกองเองว่า “พวกนี้หน้าตาคล้ายกัน เอาไว้กองเดียวกัน พวกนั้นคล้ายกันอีกแบบ เอาไว้อีกกอง” — คุณแบ่งกลุ่มได้นะ แต่คุณไม่รู้หรอกว่าแต่ละกองมัน “ชื่ออะไร” หรือ “ถูกหรือเปล่า” เพราะไม่มีเฉลย
แบบแรกนั่นแหละครับคือ supervised learning (มีเฉลย) ส่วนแบบที่สองเขาเรียกว่า unsupervised learning (อันซู-เปอร์-ไวซ์ด คือ “เรียนแบบไม่มีเฉลย”) ซึ่งผมจะเก็บไว้เล่ายาวๆ ตอนหลังนะครับ ตอนนี้ขอโฟกัสตัว “มีเฉลย” ก่อน เพราะมันเป็นพื้นฐานที่ธุรกิจส่วนใหญ่ได้ใช้จริงเยอะที่สุด
มาดูเป็นตารางเทียบให้เห็นชัดๆ ครับ
| เรียนแบบมีเฉลย (Supervised) | เรียนแบบไม่มีเฉลย (Unsupervised) | |
|---|---|---|
| มีคนติดป้ายเฉลยให้ไหม | มี — บอกคำตอบที่ถูกทุกตัว | ไม่มี — ปล่อยให้หากลุ่มเอง |
| เหมือนการเรียนแบบ | ติวเตอร์มีเฉลยคอยบอก | นั่งจัดกองรูปเองโดยไม่รู้ชื่อ |
| ใช้ทำอะไรได้ | ทำนาย/ตัดสินคำตอบที่เรารู้ว่าอยากได้อะไร | ค้นหากลุ่ม/รูปแบบที่เรายังไม่รู้ว่ามี |
เห็นความต่างไหมครับ จุดสำคัญคือคำว่า “เรารู้ไหมว่าคำตอบที่ถูกควรเป็นอะไร” ถ้าเรามีตัวอย่างที่รู้คำตอบอยู่แล้วเอามาให้ AI ดู — นั่นแหละ supervised งานวันนี้
เฉลยมาจากไหน — งานติดป้ายที่คนชอบลืมว่ามันมีต้นทุน
ตรงนี้ผมอยากแทรกเรื่องที่เจ้าของกิจการมักจะมองข้ามนิดนึงครับ — ก็คือ “เฉลย” หรือ label พวกนี้ มันไม่ได้ลอยมาเองจากฟ้า ต้องมีคนนั่งติดป้ายให้
ลองนึกภาพแบบนี้ครับ สมมติคุณอยากให้ AI ดูรูปแล้วบอกว่า “อันนี้สินค้าเสีย อันนี้สินค้าดี” ก่อนที่ AI จะเรียนเป็น คุณต้องมีกองรูปที่ คนติดป้ายเฉลยไว้แล้ว ว่ารูปไหนเสียรูปไหนดี เป็นพันเป็นหมื่นรูป แล้วงานนั่งติดป้ายเนี่ยมันก็คืองานคนล้วนๆ ใช้เวลา ใช้แรง ใช้เงิน
นี่คือเหตุผลที่ในโลกจริง คนพูดกันว่า “ข้อมูลที่ติดป้ายแล้ว (labeled data) มันแพงและหายาก” — เพราะข้อมูลดิบมีเยอะแยะ แต่ข้อมูลที่ “มีเฉลยถูกต้องแปะไว้” ต่างหากที่ต้องลงแรงทำ และคุณภาพของเฉลยก็สำคัญมากด้วย ถ้าคนติดป้ายมั่วๆ ติดผิดเยอะ AI ก็เรียนผิดตามไปด้วย เหมือนติวเตอร์ที่เฉลยผิด — ยิ่งสอน เด็กยิ่งเข้าใจผิดหนักเข้าไปอีก
💡 มุมเจ้าของกิจการ: ถ้า vendor มาเสนอทำ AI ให้คุณ แล้วงานมันเป็นแบบ “เรียนจากเฉลย” ลองถามสั้นๆ ว่า “แล้วข้อมูลที่ติดป้ายเฉลยไว้แล้วเอามาจากไหน ใครเป็นคนติด ติดไว้เยอะแค่ไหน” — เพราะนี่คือต้นทุนจริงที่มักถูกซ่อนไว้ ถ้าไม่มีข้อมูลเฉลยเลย แปลว่ายังต้องลงแรง (และเงิน) ทำตรงนี้ก่อนอีกเยอะ
เอาล่ะครับ ทีนี้พอเข้าใจว่า “เรียนแบบมีเฉลย” คืออะไรแล้ว เรามาดูกันว่ามันแตกออกเป็นงานสองแบบยังไง ซึ่งสองแบบนี้แหละที่คนชอบสับสน
งานแบบที่ 1 — Regression: “ทำนายเป็นตัวเลข”
งานแบบแรกเรียกว่า regression (อ่านว่า รี-เกรซ-ชั่น — คำนี้แปลตรงตัวไม่ค่อยช่วยให้เข้าใจหรอกครับ เอาเป็นว่ามันคือ “งานทำนายออกมาเป็นตัวเลข” ก็พอ)
หัวใจของ regression คือ คำตอบที่ออกมาเป็นตัวเลขที่ไล่ระดับได้ — เลขอะไรก็ได้บนเส้นยาวๆ ไม่ใช่แค่ “ใช่/ไม่ใช่”
ตัวอย่างคลาสสิกที่สุดคือ การทำนายราคาบ้าน ครับ ลองนึกภาพแบบนี้
สมมติว่ามีนายหน้าขายบ้านคนนึง ทำงานในย่านเดิมมาหลายปี เขาดูบ้านมาเยอะมากจนพอใครพามาดูบ้านหลังนึง เขากวาดตามองแป๊บเดียวก็เดาราคาได้ใกล้เคียงเลยว่า “หลังนี้น่าจะราวๆ เท่านี้” เขาเดาจากอะไร? ก็จากสิ่งที่เขาเคยเห็นมาทั้งชีวิตการทำงานไงครับ — บ้านยิ่งใหญ่ยิ่งแพง อยู่ใกล้รถไฟฟ้ายิ่งแพง มีที่จอดรถเพิ่มราคา ทำเลในซอยลึกราคาลด ฯลฯ
AI ที่ทำ regression ก็ทำงานคล้ายนายหน้าคนนี้เป๊ะเลยครับ เราป้อนข้อมูลบ้านที่ “ขายไปแล้วจริงและรู้ราคา” ให้มันดูเยอะๆ (นี่แหละครับคือ “เฉลย” — ราคาที่ขายไปจริงคือ label) แต่ละหลังก็มีรายละเอียดประกอบ เช่น ขนาดกี่ตารางเมตร กี่ห้องนอน อยู่ห่างรถไฟฟ้าแค่ไหน มีที่จอดรถไหม พอมันดูเยอะพอ มันก็จับทางได้ว่า “อะไรทำให้ราคาขึ้น อะไรทำให้ราคาลง” แล้วพอเจอบ้านหลังใหม่ที่ยังไม่รู้ราคา มันก็ทำนายออกมาเป็นตัวเลขได้
รายละเอียดที่เอามาป้อนพวกนี้ (ขนาด ห้องนอน ทำเล ฯลฯ) วงการเขาเรียกว่า feature (ฟีเจอร์ ในที่นี้แปลว่า “ปัจจัย/คุณสมบัติที่เอามาดู”) ครับ ยิ่งเราเลือก feature ที่เกี่ยวกับราคาจริงๆ มาให้มันดู มันก็ยิ่งทำนายแม่น
ขอยกตัวอย่างเป็นตารางบ้านสมมติให้เห็นภาพนะครับ — ย้ำว่าตัวเลขทั้งหมดในตารางนี้ผมแต่งขึ้นมาลอยๆ เพื่อให้เห็นภาพเท่านั้น ไม่ใช่ราคาตลาดจริงของที่ไหน
| ขนาด (ตร.ม. สมมติ) | ห้องนอน | ใกล้รถไฟฟ้า | ราคาที่ขายจริง (สมมติ) |
|---|---|---|---|
| 30 | 1 | ไกล | (ราคาต่ำ) |
| 45 | 2 | ปานกลาง | (ราคากลาง) |
| 80 | 3 | ใกล้ | (ราคาสูง) |
| 60 | 2 | ใกล้ | ← หลังนี้ยังไม่รู้ราคา ให้ AI ทำนาย |
สามแถวบนคือ “ตัวอย่างที่มีเฉลย” (รู้ราคาจริง) ที่เอาไว้สอน AI ส่วนแถวล่างคือบ้านใหม่ที่เราอยากให้มันเดาราคาให้ — และเพราะคำตอบที่เราอยากได้คือ “ตัวเลขราคา” ที่ไล่ระดับได้ มันถึงเป็นงาน regression ครับ
งานแบบ regression ในธุรกิจมีให้เห็นเยอะมาก เช่น (ทั้งหมดนี้เป็นตัวอย่างประเภทงานนะครับ ไม่ได้แปลว่าทำได้แม่นเสมอไป)
- ทำนายว่าเดือนหน้าจะขายได้ราวๆ กี่บาท
- ประเมินว่าควรสต็อกของไว้ราวๆ กี่ชิ้น
- คาดการณ์ว่าค่าไฟเดือนนี้น่าจะอยู่ราวๆ เท่าไหร่
จุดร่วมของมันคือ คำตอบเป็น “ตัวเลขบนเส้น” ไม่ใช่ตัวเลือกแบบมีหรือไม่มี
งานแบบที่ 2 — Classification: “จัดเข้ากลุ่ม”
ทีนี้มาดูงานอีกแบบที่หน้าตาคล้ายกันแต่จริงๆ คนละเรื่อง คือ classification (อ่านว่า แคลส-สิ-ฟิ-เค-ชั่น แปลว่า “การจัดกลุ่ม/จัดประเภท”)
หัวใจของ classification คือ คำตอบที่ออกมาเป็น “กลุ่ม” หรือ “ป้าย” ไม่ใช่ตัวเลขไล่ระดับ — เช่น “ใช่/ไม่ใช่” “กลุ่ม A/B/C” “สแปม/ไม่สแปม”
ตัวอย่างที่ทุกคนเจอทุกวันคือ การกรองอีเมลสแปม ครับ ลองนึกถึงกล่องอีเมลของคุณดู มันมีตัวอะไรสักอย่างคอยคัดว่า “เมลฉบับนี้เป็นสแปม โยนเข้าถังขยะ” หรือ “เมลฉบับนี้ปกติ ปล่อยเข้ากล่องหลัก” — นี่แหละครับงาน classification เพราะคำตอบมีแค่สองกลุ่มให้เลือก: สแปม หรือ ไม่สแปม จบ ไม่มี “สแปม 73.5 บาท” หรืออะไรแบบนั้น
แล้วมันเรียนจัดกลุ่มยังไง? ก็แบบเดียวกับ regression เลยครับ คือมีเฉลยมาให้ดู — เราป้อนอีเมลเก่าๆ ที่ “คนเคยติดป้ายไว้แล้ว” ว่าฉบับไหนสแปมฉบับไหนปกติ (อีกแล้ว นี่คือ label) ให้มันดูเยอะๆ มันก็ค่อยๆ จับทางได้ว่าเมลสแปมมักมีหน้าตายังไง เช่น ชอบมีคำว่า “ถูกรางวัล” “คลิกด่วน” “โอนเงินมาก่อน” มาเป็นชุดๆ พอเจอเมลใหม่ มันก็ดูแล้วตัดสินว่าน่าจะเข้ากลุ่มไหน
ลองนึกภาพอีกตัวอย่างที่ใกล้ตัวเจ้าของกิจการไทย — สมมติว่าร้านค้าออนไลน์ร้านหนึ่งมีรีวิวลูกค้าเข้ามาวันละเป็นร้อย เจ้าของอยากให้ระบบช่วยคัดว่ารีวิวไหน “ชม” รีวิวไหน “บ่น” จะได้รีบไปดูแลคนที่บ่นก่อน — งานนี้ก็คือ classification ครับ เพราะคำตอบคือการจัดเข้ากลุ่ม “ชม” หรือ “บ่น” (จะมีกลุ่มที่สามว่า “เฉยๆ” ด้วยก็ได้ ก็ยังเป็นการจัดกลุ่มอยู่ดี)
มาดูตารางตัวอย่างรีวิวสมมติกันครับ — ข้อความรีวิวพวกนี้ผมแต่งขึ้นเองเพื่อยกตัวอย่าง ไม่ใช่ของลูกค้าจริงรายไหน
| ข้อความรีวิว (สมมติ) | กลุ่มที่ติดป้ายไว้ (เฉลย) |
|---|---|
| “ของดีมากกก ส่งไวด้วย ประทับใจ” | ชม |
| ”รอของตั้งสองอาทิตย์ ไม่โอเคเลย” | บ่น |
| ”ได้รับของแล้วครับ ขอบคุณ” | เฉยๆ |
| ”สินค้าโอเคนะ แต่กล่องบุบนิดหน่อย” | ← อันนี้ให้ AI ลองจัดกลุ่มดู |
สามแถวบนคือตัวอย่างที่มีเฉลยเอาไว้สอน ส่วนแถวล่างคือรีวิวใหม่ที่อยากให้ AI ลองคัดให้ — และเพราะคำตอบที่ต้องการคือ “กลุ่ม” ไม่ใช่ “ตัวเลข” มันจึงเป็นงาน classification ครับ
งานแบบ classification ในธุรกิจก็เยอะไม่แพ้กัน เช่น
- คัดว่าลูกค้ารายนี้ “น่าจะกลับมาซื้อซ้ำ” หรือ “น่าจะหายไป”
- ดูรูปสินค้าแล้วบอกว่า “ผ่าน QC” หรือ “ไม่ผ่าน”
- จัดเอกสารที่เข้ามาว่าเป็น “ใบสั่งซื้อ / ใบเสร็จ / ใบเคลม”
จุดร่วมคือ คำตอบเป็น “ตัวเลือกที่นับได้” ไม่ใช่ตัวเลขไล่ระดับ
เส้นแบ่งง่ายๆ — regression vs classification
เอาล่ะครับ ถึงตรงนี้หลายคนน่าจะเริ่มเห็นภาพแล้วว่าทำไมสองตัวนี้ดูคล้ายแต่ไม่เหมือน ผมขอสรุปเป็นเส้นแบ่งสั้นๆ ที่จำง่ายที่สุด
ถามตัวเองคำเดียวครับ: “คำตอบที่อยากได้ มันเป็นตัวเลขไล่ระดับ หรือเป็นกลุ่มให้เลือก?”
- ถ้าคำตอบเป็น ตัวเลขที่ไล่ระดับได้ (ราคา ยอดขาย จำนวนชิ้น อุณหภูมิ) → regression
- ถ้าคำตอบเป็น กลุ่ม/ป้ายที่นับได้ (ใช่/ไม่ใช่ สแปม/ไม่สแปม ชม/บ่น/เฉยๆ) → classification
มาดูเทียบกันชัดๆ เป็นตารางครับ
| Regression (ทำนายตัวเลข) | Classification (จัดกลุ่ม) | |
|---|---|---|
| คำตอบหน้าตาเป็นยังไง | ตัวเลขบนเส้น เช่น 2.85 ล้านบาท | กลุ่ม เช่น “สแปม” / “ไม่สแปม” |
| คำถามที่มันตอบ | ”เท่าไหร่?” / “ราวๆ กี่?" | "อันไหน?” / “ใช่หรือเปล่า?” |
| ตัวอย่างใกล้ตัว | ทำนายราคาบ้าน, คาดยอดขาย | กรองสแปม, คัดรีวิวชม/บ่น |
| เฉลยที่ใช้สอน (label) | ราคาจริงที่เคยขายได้ | กลุ่มที่คนเคยติดป้ายไว้ |
มีกับดักเล็กๆ ที่คนชอบงงอยู่อย่างนึงครับ — บางทีคำตอบมัน “ดูเหมือนตัวเลข” แต่จริงๆ เป็นกลุ่ม เช่น ถ้าผมให้ AI ตอบว่าลูกค้าควรได้ “ดาว 1 / 2 / 3 / 4 / 5” — อันนี้ดูเป็นตัวเลขใช่ไหมครับ แต่จริงๆ มันคือ “กลุ่มห้ากลุ่ม” ที่เลือกได้แค่ห้าค่า ไม่มี 3.7 ดาว ฉะนั้นถ้ามองว่ามันต้องเลือก “หนึ่งในกลุ่มที่กำหนดไว้” — อันนี้เอนไปทาง classification ครับ
แต่เอาจริงๆ นะครับ คุณในฐานะเจ้าของกิจการไม่ต้องเครียดเรื่องเส้นแบ่งเป๊ะๆ ขนาดนั้นหรอก คนที่ต้องเป๊ะคือทีมที่ทำระบบ ส่วนคุณแค่เข้าใจภาพรวมว่า “งานของฉันต้องการคำตอบแบบไหน — เป็นตัวเลข หรือเป็นกลุ่ม” เท่านี้ก็คุยกับ vendor หรือทีมงานได้รู้เรื่องขึ้นเยอะแล้ว
💡 มุมเจ้าของกิจการ: เวลาคุณอยากให้ AI ช่วยงานอะไรสักอย่าง ลองตั้งต้นด้วยการเขียนคำถามที่คุณอยากให้มันตอบออกมาก่อนครับ ถ้าคำถามลงท้ายด้วย ”…เท่าไหร่” — งานคุณมีกลิ่น regression ถ้าลงท้ายด้วย ”…อันไหน / …ใช่ไหม” — มีกลิ่น classification รู้แค่นี้ก่อนคุยก็ช่วยให้สื่อสารกับคนทำระบบตรงจุดขึ้นเยอะ
แล้วมันรู้ได้ไงว่าตัวเองเก่งขึ้นหรือยัง
มีเรื่องนึงที่ผมว่าน่าสนใจและช่วยให้เข้าใจภาพรวมมากขึ้น คือ — ระหว่างที่ AI หัดอยู่เนี่ย มันรู้ได้ไงว่าตัวเองเดาแม่นขึ้นหรือยัง?
คำตอบง่ายมากครับ เพราะมัน “มีเฉลย” ไงล่ะ ลองนึกภาพแบบนี้ — ระหว่างฝึก AI มันเดาคำตอบออกมา แล้วเอาไปเทียบกับเฉลยที่เรามีอยู่ ถ้าเดาผิด มันก็รู้ว่า “เออ รอบนี้พลาดไปเท่านี้” แล้วก็ค่อยๆ ปรับตัวเองให้เดารอบหน้าใกล้เฉลยขึ้น ทำซ้ำแบบนี้เป็นพันเป็นหมื่นรอบ มันก็ค่อยๆ เก่งขึ้นเรื่อยๆ
เหมือนเด็กที่ติวกับติวเตอร์มีเฉลยนั่นแหละครับ ทำโจทย์ผิด ติวเตอร์เฉลย เด็กก็ปรับ ทำใหม่ ผิดน้อยลง ปรับอีก — วนไปจนแม่น นี่คือข้อดีใหญ่ของการ “มีเฉลย” คือ AI วัดตัวเองได้ตลอดว่ายังห่างจากคำตอบจริงแค่ไหน
แต่มันก็มีกับดักที่ต้องระวังนะครับ — ถ้า AI “ท่องเฉลยเก่งเกินไป” จนจำตัวอย่างเก่าได้หมดเป๊ะ แต่พอเจอของใหม่จริงๆ กลับเดาไม่ได้เรื่อง อาการแบบนี้เปรียบเหมือนเด็กที่ท่องเฉลยข้อสอบเก่าได้ทุกข้อ แต่พอเจอโจทย์พลิกนิดเดียวก็ทำไม่ได้ เพราะมันจำมาเฉยๆ ไม่ได้เข้าใจจริง วงการมีศัพท์เรียกอาการนี้อยู่ ผมขอเก็บรายละเอียดไว้เล่าตอนหลังนะครับ ตอนนี้แค่จำภาพว่า “ท่องเก่งไป ก็ไม่ดี ต้องเข้าใจ ไม่ใช่ท่อง” ก็พอ
เอามาใช้กับร้านได้ยังไง — ตัวอย่างร้านไทยสมมติ
ทีนี้ลองมาประกอบภาพรวมกันครับ สมมติว่ามีร้านขายของชำออนไลน์เล็กๆ ร้านหนึ่ง เจ้าของอยากเอา AI มาช่วยงาน — ผมจะลองไล่ให้ดูว่างานแต่ละอย่างมันเป็น regression หรือ classification (ย้ำว่าทั้งหมดเป็นฉาก สมมติ ที่ผมแต่งขึ้นเพื่ออธิบายนะครับ)
| งานที่อยากให้ AI ช่วย (ร้านสมมติ) | คำตอบที่อยากได้ | เป็นงานแบบ |
|---|---|---|
| เดือนหน้าน่าจะขายข้าวสารได้กี่กระสอบ จะได้สั่งสต็อกไม่ขาดไม่เกิน | ตัวเลข (กี่กระสอบ) | Regression |
| ลูกค้ารายนี้น่าจะกลับมาซื้อซ้ำไหม จะได้ส่งโปรไปดึง | กลุ่ม (ซื้อซ้ำ/ไม่ซื้อซ้ำ) | Classification |
| บิลค่าส่งของรอบหน้าน่าจะราวๆ เท่าไหร่ | ตัวเลข (กี่บาท) | Regression |
| ข้อความที่ลูกค้าทักมา เป็นการ “ถามของ / ร้องเรียน / ทักเล่น” | กลุ่ม (สามประเภท) | Classification |
เห็นไหมครับว่าพองานเดียวกันคือ “ให้ AI ช่วยร้าน” แต่พอแยกดูทีละงาน มันคนละแบบกันชัดเจน บางงานต้องการตัวเลข บางงานต้องการให้จัดกลุ่ม — และทั้งสองแบบนี้ ถ้าจะให้ AI ทำได้ดี ก็ต้องมี “เฉลยเก่าๆ” (ข้อมูลขายเก่า ข้อมูลลูกค้าเก่า ข้อความเก่าที่เคยจัดกลุ่มไว้) มาสอนมันก่อนทั้งนั้น ไม่มีเฉลย = ไม่มีของให้เรียน
และนี่ก็วนกลับไปที่ประเด็นต้นเรื่องครับ ของพวกนี้ทำได้หรือไม่ได้ ไม่ได้อยู่ที่ “AI เก่งแค่ไหน” อย่างเดียว แต่อยู่ที่ว่า ร้านคุณมีข้อมูลเก่าที่ติดป้ายเฉลยไว้ดีพอหรือเปล่า ร้านที่เก็บข้อมูลขายดีๆ มาตลอด จะมีของให้ AI เรียนเยอะ ส่วนร้านที่ไม่เคยเก็บอะไรเลย ต่อให้อยากใช้ AI ก็เริ่มยากกว่า เพราะไม่มีเฉลยให้มันดู
สรุปสั้นๆ ส่งท้าย
ถ้าให้ย่อทั้งตอนนี้เหลือไม่กี่บรรทัดเอาไว้จำง่ายๆ คือแบบนี้ครับ
- Supervised Learning = เรียนแบบมีเฉลย มีคนติดป้าย (label) บอกคำตอบที่ถูกให้ AI ดูเยอะๆ แล้วมันค่อยจับทางเอาไปเดาของใหม่ (เหมือนเด็กหัดดูผลไม้โดยมีผู้ใหญ่คอยบอกชื่อ)
- เฉลยไม่ได้มาฟรี ต้องมีคนนั่งติดป้าย ใช้เวลาใช้เงิน และคุณภาพเฉลยสำคัญมาก — เฉลยมั่ว AI ก็เรียนผิด
- Regression = ทำนายเป็นตัวเลขไล่ระดับ ตอบคำถามว่า “เท่าไหร่?” (เช่น ราคาบ้าน, ยอดขายเดือนหน้า)
- Classification = จัดเข้ากลุ่ม ตอบคำถามว่า “อันไหน / ใช่ไหม?” (เช่น สแปม/ไม่สแปม, ชม/บ่น)
- เส้นแบ่ง: คำตอบที่อยากได้เป็น “ตัวเลข” หรือ “กลุ่ม” — แค่นี้ก็แยกออกแล้ว
- กุญแจของทั้งคู่คือข้อมูลเฉลยเก่า ร้านที่เก็บข้อมูลดี เริ่มต้นกับ AI ได้ง่ายกว่า
ผมไม่ใช่ผู้เชี่ยวชาญด้าน AI อะไรหรอกนะครับ เป็นแค่คนที่พยายามนั่งทำความเข้าใจเรื่องพวกนี้ด้วยตัวเอง แล้วก็เลยอยากเล่าต่อแบบภาษาคนๆ ตรงไหนผมเข้าใจคลาดเคลื่อนไป ทักท้วงกันเข้ามาได้เลยนะครับ ยินดีมากๆ
ตอนหน้าของ Part 1 ผมว่าจะเล่าต่ออีกฝั่งของเหรียญ คือเจ้า “เรียนแบบไม่มีเฉลย” (unsupervised) ที่เกริ่นไว้ตอนต้นเนี่ย จริงๆ มันทำงานยังไง แล้วมันช่วยให้เราเห็นกลุ่มลูกค้าที่เราไม่เคยรู้ว่ามีได้ยังไง ไว้เจอกันตอนหน้าครับ