AI 101 EP.03 — Supervised Learning — เรียนแบบมีเฉลย (regression vs classification)

AI 101 — ปัญญาประดิษฐ์ฉบับภาษาคน · Part 1 (เบื้องหลัง: AI ทำงานยังไง) ภาคนี้ผมเขียนให้เจ้าของกิจการกับคนทำงานทั่วไปที่ไม่ใช่สาย IT ได้แอบเปิดฝาดูว่า “ข้างใน AI มันทำงานยังไง” แบบไม่ต้องกลัวศัพท์ ไม่ต้องเรียนเลข ตอนนี้เป็นเรื่อง “Supervised Learning — การเรียนแบบมีเฉลย” กับลูกของมันสองตัวที่คนสับสนกันบ่อยมาก คือ regression (ทำนายตัวเลข) กับ classification (จัดกลุ่ม) (สารบัญเต็มของซีรีส์จะตามมาทีหลังนะครับ)

ลองนึกภาพเด็กคนนึงกำลังหัดดูผลไม้#

ลองนึกภาพเด็กเล็กๆ คนนึงที่ยังแยกผลไม้ไม่เป็นเลยครับ แล้วมีผู้ใหญ่นั่งสอนข้างๆ หยิบของขึ้นมาทีละลูก หยิบส้มขึ้นมาบอกว่า “นี่ส้มนะ” หยิบแอปเปิลบอกว่า “นี่แอปเปิล” หยิบกล้วยบอกว่า “นี่กล้วย” ทำซ้ำไปเรื่อยๆ เป็นร้อยลูกพันลูก

ทีนี้พอวันนึงเอาผลไม้ลูกใหม่ที่เด็กไม่เคยเห็นมาวางตรงหน้า แล้วถามว่า “นี่อะไรเอ่ย” — เด็กที่ดูมาเยอะพอ ก็จะเดาได้ว่า “อันนี้น่าจะส้มนะ เพราะมันกลมๆ สีส้มๆ เหมือนที่เคยเห็น”

นี่แหละครับคือหัวใจของสิ่งที่วงการเรียกว่า Supervised Learning (อ่านว่า ซู-เปอร์-ไวซ์ด เลิร์นนิ่ง แปลแบบบ้านๆ คือ “การเรียนแบบมีคนคอยเฉลยให้”) คำว่า supervise มันแปลว่า “คอยกำกับดูแล” ฉะนั้นภาพง่ายที่สุดคือ มีครูนั่งข้างๆ คอยบอกเฉลยให้ทุกข้อ ระหว่างที่ AI กำลังหัด ไม่ได้ปล่อยให้มันเดาเองมั่วๆ

แล้ว “เฉลย” ที่ว่าเนี่ย ในวงการเขาเรียกว่า label (เลเบล แปลว่า “ป้ายกำกับ”) ครับ — ก็คือป้ายที่บอกว่าของชิ้นนี้คำตอบที่ถูกคืออะไร เหมือนผู้ใหญ่ที่ติดป้ายในใจให้ผลไม้แต่ละลูกว่า “นี่คือส้ม” นั่นแหละ AI เรียนจากข้อมูลที่ “ติดป้ายเฉลยไว้แล้ว” พวกนี้

ผมจะพาไปดูทีละเรื่องนะครับ ว่ามันเรียนยังไง แล้วทำไมงานสองแบบที่ดูคล้ายกัน (regression กับ classification) จริงๆ มันคนละเรื่องกันเลย

”มีเฉลย” สำคัญตรงไหน — เทียบกับเรียนแบบไม่มีเฉลย#

ก่อนจะลงรายละเอียด ผมอยากให้เห็นภาพก่อนว่าทำไมคำว่า “มีเฉลย” มันถึงเป็นเรื่องใหญ่

ลองนึกภาพการเรียนสองแบบนะครับ

แบบแรก คุณนั่งเรียนกับติวเตอร์ที่มีเฉลยอยู่ในมือ คุณลองทำโจทย์ ติวเตอร์ก็บอกทันทีว่า “ข้อนี้ถูก ข้อนี้ผิด ที่ถูกคืออันนี้นะ” คุณก็ค่อยๆ ปรับ ค่อยๆ เก่งขึ้นเพราะรู้ว่าคำตอบจริงคืออะไร

แบบที่สอง คุณได้กล่องรูปภาพมาเป็นพันใบ แต่ไม่มีใครบอกว่าแต่ละใบคืออะไรเลย คุณได้แต่นั่งดูแล้วจัดกองเองว่า “พวกนี้หน้าตาคล้ายกัน เอาไว้กองเดียวกัน พวกนั้นคล้ายกันอีกแบบ เอาไว้อีกกอง” — คุณแบ่งกลุ่มได้นะ แต่คุณไม่รู้หรอกว่าแต่ละกองมัน “ชื่ออะไร” หรือ “ถูกหรือเปล่า” เพราะไม่มีเฉลย

แบบแรกนั่นแหละครับคือ supervised learning (มีเฉลย) ส่วนแบบที่สองเขาเรียกว่า unsupervised learning (อันซู-เปอร์-ไวซ์ด คือ “เรียนแบบไม่มีเฉลย”) ซึ่งผมจะเก็บไว้เล่ายาวๆ ตอนหลังนะครับ ตอนนี้ขอโฟกัสตัว “มีเฉลย” ก่อน เพราะมันเป็นพื้นฐานที่ธุรกิจส่วนใหญ่ได้ใช้จริงเยอะที่สุด

มาดูเป็นตารางเทียบให้เห็นชัดๆ ครับ

	เรียนแบบมีเฉลย (Supervised)	เรียนแบบไม่มีเฉลย (Unsupervised)
มีคนติดป้ายเฉลยให้ไหม	มี — บอกคำตอบที่ถูกทุกตัว	ไม่มี — ปล่อยให้หากลุ่มเอง
เหมือนการเรียนแบบ	ติวเตอร์มีเฉลยคอยบอก	นั่งจัดกองรูปเองโดยไม่รู้ชื่อ
ใช้ทำอะไรได้	ทำนาย/ตัดสินคำตอบที่เรารู้ว่าอยากได้อะไร	ค้นหากลุ่ม/รูปแบบที่เรายังไม่รู้ว่ามี

เห็นความต่างไหมครับ จุดสำคัญคือคำว่า “เรารู้ไหมว่าคำตอบที่ถูกควรเป็นอะไร” ถ้าเรามีตัวอย่างที่รู้คำตอบอยู่แล้วเอามาให้ AI ดู — นั่นแหละ supervised งานวันนี้

เฉลยมาจากไหน — งานติดป้ายที่คนชอบลืมว่ามันมีต้นทุน#

ตรงนี้ผมอยากแทรกเรื่องที่เจ้าของกิจการมักจะมองข้ามนิดนึงครับ — ก็คือ “เฉลย” หรือ label พวกนี้ มันไม่ได้ลอยมาเองจากฟ้า ต้องมีคนนั่งติดป้ายให้

ลองนึกภาพแบบนี้ครับ สมมติคุณอยากให้ AI ดูรูปแล้วบอกว่า “อันนี้สินค้าเสีย อันนี้สินค้าดี” ก่อนที่ AI จะเรียนเป็น คุณต้องมีกองรูปที่ คนติดป้ายเฉลยไว้แล้ว ว่ารูปไหนเสียรูปไหนดี เป็นพันเป็นหมื่นรูป แล้วงานนั่งติดป้ายเนี่ยมันก็คืองานคนล้วนๆ ใช้เวลา ใช้แรง ใช้เงิน

นี่คือเหตุผลที่ในโลกจริง คนพูดกันว่า “ข้อมูลที่ติดป้ายแล้ว (labeled data) มันแพงและหายาก” — เพราะข้อมูลดิบมีเยอะแยะ แต่ข้อมูลที่ “มีเฉลยถูกต้องแปะไว้” ต่างหากที่ต้องลงแรงทำ และคุณภาพของเฉลยก็สำคัญมากด้วย ถ้าคนติดป้ายมั่วๆ ติดผิดเยอะ AI ก็เรียนผิดตามไปด้วย เหมือนติวเตอร์ที่เฉลยผิด — ยิ่งสอน เด็กยิ่งเข้าใจผิดหนักเข้าไปอีก

💡 มุมเจ้าของกิจการ: ถ้า vendor มาเสนอทำ AI ให้คุณ แล้วงานมันเป็นแบบ “เรียนจากเฉลย” ลองถามสั้นๆ ว่า “แล้วข้อมูลที่ติดป้ายเฉลยไว้แล้วเอามาจากไหน ใครเป็นคนติด ติดไว้เยอะแค่ไหน” — เพราะนี่คือต้นทุนจริงที่มักถูกซ่อนไว้ ถ้าไม่มีข้อมูลเฉลยเลย แปลว่ายังต้องลงแรง (และเงิน) ทำตรงนี้ก่อนอีกเยอะ

เอาล่ะครับ ทีนี้พอเข้าใจว่า “เรียนแบบมีเฉลย” คืออะไรแล้ว เรามาดูกันว่ามันแตกออกเป็นงานสองแบบยังไง ซึ่งสองแบบนี้แหละที่คนชอบสับสน

งานแบบที่ 1 — Regression: “ทำนายเป็นตัวเลข”#

งานแบบแรกเรียกว่า regression (อ่านว่า รี-เกรซ-ชั่น — คำนี้แปลตรงตัวไม่ค่อยช่วยให้เข้าใจหรอกครับ เอาเป็นว่ามันคือ “งานทำนายออกมาเป็นตัวเลข” ก็พอ)

หัวใจของ regression คือ คำตอบที่ออกมาเป็นตัวเลขที่ไล่ระดับได้ — เลขอะไรก็ได้บนเส้นยาวๆ ไม่ใช่แค่ “ใช่/ไม่ใช่”

ตัวอย่างคลาสสิกที่สุดคือ การทำนายราคาบ้าน ครับ ลองนึกภาพแบบนี้

สมมติว่ามีนายหน้าขายบ้านคนนึง ทำงานในย่านเดิมมาหลายปี เขาดูบ้านมาเยอะมากจนพอใครพามาดูบ้านหลังนึง เขากวาดตามองแป๊บเดียวก็เดาราคาได้ใกล้เคียงเลยว่า “หลังนี้น่าจะราวๆ เท่านี้” เขาเดาจากอะไร? ก็จากสิ่งที่เขาเคยเห็นมาทั้งชีวิตการทำงานไงครับ — บ้านยิ่งใหญ่ยิ่งแพง อยู่ใกล้รถไฟฟ้ายิ่งแพง มีที่จอดรถเพิ่มราคา ทำเลในซอยลึกราคาลด ฯลฯ

AI ที่ทำ regression ก็ทำงานคล้ายนายหน้าคนนี้เป๊ะเลยครับ เราป้อนข้อมูลบ้านที่ “ขายไปแล้วจริงและรู้ราคา” ให้มันดูเยอะๆ (นี่แหละครับคือ “เฉลย” — ราคาที่ขายไปจริงคือ label) แต่ละหลังก็มีรายละเอียดประกอบ เช่น ขนาดกี่ตารางเมตร กี่ห้องนอน อยู่ห่างรถไฟฟ้าแค่ไหน มีที่จอดรถไหม พอมันดูเยอะพอ มันก็จับทางได้ว่า “อะไรทำให้ราคาขึ้น อะไรทำให้ราคาลง” แล้วพอเจอบ้านหลังใหม่ที่ยังไม่รู้ราคา มันก็ทำนายออกมาเป็นตัวเลขได้

รายละเอียดที่เอามาป้อนพวกนี้ (ขนาด ห้องนอน ทำเล ฯลฯ) วงการเขาเรียกว่า feature (ฟีเจอร์ ในที่นี้แปลว่า “ปัจจัย/คุณสมบัติที่เอามาดู”) ครับ ยิ่งเราเลือก feature ที่เกี่ยวกับราคาจริงๆ มาให้มันดู มันก็ยิ่งทำนายแม่น

ขอยกตัวอย่างเป็นตารางบ้านสมมติให้เห็นภาพนะครับ — ย้ำว่าตัวเลขทั้งหมดในตารางนี้ผมแต่งขึ้นมาลอยๆ เพื่อให้เห็นภาพเท่านั้น ไม่ใช่ราคาตลาดจริงของที่ไหน

ขนาด (ตร.ม. สมมติ)	ห้องนอน	ใกล้รถไฟฟ้า	ราคาที่ขายจริง (สมมติ)
30	1	ไกล	(ราคาต่ำ)
45	2	ปานกลาง	(ราคากลาง)
80	3	ใกล้	(ราคาสูง)
60	2	ใกล้	← หลังนี้ยังไม่รู้ราคา ให้ AI ทำนาย

สามแถวบนคือ “ตัวอย่างที่มีเฉลย” (รู้ราคาจริง) ที่เอาไว้สอน AI ส่วนแถวล่างคือบ้านใหม่ที่เราอยากให้มันเดาราคาให้ — และเพราะคำตอบที่เราอยากได้คือ “ตัวเลขราคา” ที่ไล่ระดับได้ มันถึงเป็นงาน regression ครับ

งานแบบ regression ในธุรกิจมีให้เห็นเยอะมาก เช่น (ทั้งหมดนี้เป็นตัวอย่างประเภทงานนะครับ ไม่ได้แปลว่าทำได้แม่นเสมอไป)

ทำนายว่าเดือนหน้าจะขายได้ราวๆ กี่บาท
ประเมินว่าควรสต็อกของไว้ราวๆ กี่ชิ้น
คาดการณ์ว่าค่าไฟเดือนนี้น่าจะอยู่ราวๆ เท่าไหร่

จุดร่วมของมันคือ คำตอบเป็น “ตัวเลขบนเส้น” ไม่ใช่ตัวเลือกแบบมีหรือไม่มี

งานแบบที่ 2 — Classification: “จัดเข้ากลุ่ม”#

ทีนี้มาดูงานอีกแบบที่หน้าตาคล้ายกันแต่จริงๆ คนละเรื่อง คือ classification (อ่านว่า แคลส-สิ-ฟิ-เค-ชั่น แปลว่า “การจัดกลุ่ม/จัดประเภท”)

หัวใจของ classification คือ คำตอบที่ออกมาเป็น “กลุ่ม” หรือ “ป้าย” ไม่ใช่ตัวเลขไล่ระดับ — เช่น “ใช่/ไม่ใช่” “กลุ่ม A/B/C” “สแปม/ไม่สแปม”

ตัวอย่างที่ทุกคนเจอทุกวันคือ การกรองอีเมลสแปม ครับ ลองนึกถึงกล่องอีเมลของคุณดู มันมีตัวอะไรสักอย่างคอยคัดว่า “เมลฉบับนี้เป็นสแปม โยนเข้าถังขยะ” หรือ “เมลฉบับนี้ปกติ ปล่อยเข้ากล่องหลัก” — นี่แหละครับงาน classification เพราะคำตอบมีแค่สองกลุ่มให้เลือก: สแปม หรือ ไม่สแปม จบ ไม่มี “สแปม 73.5 บาท” หรืออะไรแบบนั้น

แล้วมันเรียนจัดกลุ่มยังไง? ก็แบบเดียวกับ regression เลยครับ คือมีเฉลยมาให้ดู — เราป้อนอีเมลเก่าๆ ที่ “คนเคยติดป้ายไว้แล้ว” ว่าฉบับไหนสแปมฉบับไหนปกติ (อีกแล้ว นี่คือ label) ให้มันดูเยอะๆ มันก็ค่อยๆ จับทางได้ว่าเมลสแปมมักมีหน้าตายังไง เช่น ชอบมีคำว่า “ถูกรางวัล” “คลิกด่วน” “โอนเงินมาก่อน” มาเป็นชุดๆ พอเจอเมลใหม่ มันก็ดูแล้วตัดสินว่าน่าจะเข้ากลุ่มไหน

ลองนึกภาพอีกตัวอย่างที่ใกล้ตัวเจ้าของกิจการไทย — สมมติว่าร้านค้าออนไลน์ร้านหนึ่งมีรีวิวลูกค้าเข้ามาวันละเป็นร้อย เจ้าของอยากให้ระบบช่วยคัดว่ารีวิวไหน “ชม” รีวิวไหน “บ่น” จะได้รีบไปดูแลคนที่บ่นก่อน — งานนี้ก็คือ classification ครับ เพราะคำตอบคือการจัดเข้ากลุ่ม “ชม” หรือ “บ่น” (จะมีกลุ่มที่สามว่า “เฉยๆ” ด้วยก็ได้ ก็ยังเป็นการจัดกลุ่มอยู่ดี)

มาดูตารางตัวอย่างรีวิวสมมติกันครับ — ข้อความรีวิวพวกนี้ผมแต่งขึ้นเองเพื่อยกตัวอย่าง ไม่ใช่ของลูกค้าจริงรายไหน

ข้อความรีวิว (สมมติ)	กลุ่มที่ติดป้ายไว้ (เฉลย)
“ของดีมากกก ส่งไวด้วย ประทับใจ”	ชม
”รอของตั้งสองอาทิตย์ ไม่โอเคเลย”	บ่น
”ได้รับของแล้วครับ ขอบคุณ”	เฉยๆ
”สินค้าโอเคนะ แต่กล่องบุบนิดหน่อย”	← อันนี้ให้ AI ลองจัดกลุ่มดู

สามแถวบนคือตัวอย่างที่มีเฉลยเอาไว้สอน ส่วนแถวล่างคือรีวิวใหม่ที่อยากให้ AI ลองคัดให้ — และเพราะคำตอบที่ต้องการคือ “กลุ่ม” ไม่ใช่ “ตัวเลข” มันจึงเป็นงาน classification ครับ

งานแบบ classification ในธุรกิจก็เยอะไม่แพ้กัน เช่น

คัดว่าลูกค้ารายนี้ “น่าจะกลับมาซื้อซ้ำ” หรือ “น่าจะหายไป”
ดูรูปสินค้าแล้วบอกว่า “ผ่าน QC” หรือ “ไม่ผ่าน”
จัดเอกสารที่เข้ามาว่าเป็น “ใบสั่งซื้อ / ใบเสร็จ / ใบเคลม”

จุดร่วมคือ คำตอบเป็น “ตัวเลือกที่นับได้” ไม่ใช่ตัวเลขไล่ระดับ

เส้นแบ่งง่ายๆ — regression vs classification#

เอาล่ะครับ ถึงตรงนี้หลายคนน่าจะเริ่มเห็นภาพแล้วว่าทำไมสองตัวนี้ดูคล้ายแต่ไม่เหมือน ผมขอสรุปเป็นเส้นแบ่งสั้นๆ ที่จำง่ายที่สุด

ถามตัวเองคำเดียวครับ: “คำตอบที่อยากได้ มันเป็นตัวเลขไล่ระดับ หรือเป็นกลุ่มให้เลือก?”

ถ้าคำตอบเป็น ตัวเลขที่ไล่ระดับได้ (ราคา ยอดขาย จำนวนชิ้น อุณหภูมิ) → regression
ถ้าคำตอบเป็น กลุ่ม/ป้ายที่นับได้ (ใช่/ไม่ใช่ สแปม/ไม่สแปม ชม/บ่น/เฉยๆ) → classification

มาดูเทียบกันชัดๆ เป็นตารางครับ

	Regression (ทำนายตัวเลข)	Classification (จัดกลุ่ม)
คำตอบหน้าตาเป็นยังไง	ตัวเลขบนเส้น เช่น 2.85 ล้านบาท	กลุ่ม เช่น “สแปม” / “ไม่สแปม”
คำถามที่มันตอบ	”เท่าไหร่?” / “ราวๆ กี่?"	"อันไหน?” / “ใช่หรือเปล่า?”
ตัวอย่างใกล้ตัว	ทำนายราคาบ้าน, คาดยอดขาย	กรองสแปม, คัดรีวิวชม/บ่น
เฉลยที่ใช้สอน (label)	ราคาจริงที่เคยขายได้	กลุ่มที่คนเคยติดป้ายไว้

มีกับดักเล็กๆ ที่คนชอบงงอยู่อย่างนึงครับ — บางทีคำตอบมัน “ดูเหมือนตัวเลข” แต่จริงๆ เป็นกลุ่ม เช่น ถ้าผมให้ AI ตอบว่าลูกค้าควรได้ “ดาว 1 / 2 / 3 / 4 / 5” — อันนี้ดูเป็นตัวเลขใช่ไหมครับ แต่จริงๆ มันคือ “กลุ่มห้ากลุ่ม” ที่เลือกได้แค่ห้าค่า ไม่มี 3.7 ดาว ฉะนั้นถ้ามองว่ามันต้องเลือก “หนึ่งในกลุ่มที่กำหนดไว้” — อันนี้เอนไปทาง classification ครับ

แต่เอาจริงๆ นะครับ คุณในฐานะเจ้าของกิจการไม่ต้องเครียดเรื่องเส้นแบ่งเป๊ะๆ ขนาดนั้นหรอก คนที่ต้องเป๊ะคือทีมที่ทำระบบ ส่วนคุณแค่เข้าใจภาพรวมว่า “งานของฉันต้องการคำตอบแบบไหน — เป็นตัวเลข หรือเป็นกลุ่ม” เท่านี้ก็คุยกับ vendor หรือทีมงานได้รู้เรื่องขึ้นเยอะแล้ว

💡 มุมเจ้าของกิจการ: เวลาคุณอยากให้ AI ช่วยงานอะไรสักอย่าง ลองตั้งต้นด้วยการเขียนคำถามที่คุณอยากให้มันตอบออกมาก่อนครับ ถ้าคำถามลงท้ายด้วย ”…เท่าไหร่” — งานคุณมีกลิ่น regression ถ้าลงท้ายด้วย ”…อันไหน / …ใช่ไหม” — มีกลิ่น classification รู้แค่นี้ก่อนคุยก็ช่วยให้สื่อสารกับคนทำระบบตรงจุดขึ้นเยอะ

แล้วมันรู้ได้ไงว่าตัวเองเก่งขึ้นหรือยัง#

มีเรื่องนึงที่ผมว่าน่าสนใจและช่วยให้เข้าใจภาพรวมมากขึ้น คือ — ระหว่างที่ AI หัดอยู่เนี่ย มันรู้ได้ไงว่าตัวเองเดาแม่นขึ้นหรือยัง?

คำตอบง่ายมากครับ เพราะมัน “มีเฉลย” ไงล่ะ ลองนึกภาพแบบนี้ — ระหว่างฝึก AI มันเดาคำตอบออกมา แล้วเอาไปเทียบกับเฉลยที่เรามีอยู่ ถ้าเดาผิด มันก็รู้ว่า “เออ รอบนี้พลาดไปเท่านี้” แล้วก็ค่อยๆ ปรับตัวเองให้เดารอบหน้าใกล้เฉลยขึ้น ทำซ้ำแบบนี้เป็นพันเป็นหมื่นรอบ มันก็ค่อยๆ เก่งขึ้นเรื่อยๆ

เหมือนเด็กที่ติวกับติวเตอร์มีเฉลยนั่นแหละครับ ทำโจทย์ผิด ติวเตอร์เฉลย เด็กก็ปรับ ทำใหม่ ผิดน้อยลง ปรับอีก — วนไปจนแม่น นี่คือข้อดีใหญ่ของการ “มีเฉลย” คือ AI วัดตัวเองได้ตลอดว่ายังห่างจากคำตอบจริงแค่ไหน

แต่มันก็มีกับดักที่ต้องระวังนะครับ — ถ้า AI “ท่องเฉลยเก่งเกินไป” จนจำตัวอย่างเก่าได้หมดเป๊ะ แต่พอเจอของใหม่จริงๆ กลับเดาไม่ได้เรื่อง อาการแบบนี้เปรียบเหมือนเด็กที่ท่องเฉลยข้อสอบเก่าได้ทุกข้อ แต่พอเจอโจทย์พลิกนิดเดียวก็ทำไม่ได้ เพราะมันจำมาเฉยๆ ไม่ได้เข้าใจจริง วงการมีศัพท์เรียกอาการนี้อยู่ ผมขอเก็บรายละเอียดไว้เล่าตอนหลังนะครับ ตอนนี้แค่จำภาพว่า “ท่องเก่งไป ก็ไม่ดี ต้องเข้าใจ ไม่ใช่ท่อง” ก็พอ

เอามาใช้กับร้านได้ยังไง — ตัวอย่างร้านไทยสมมติ#

ทีนี้ลองมาประกอบภาพรวมกันครับ สมมติว่ามีร้านขายของชำออนไลน์เล็กๆ ร้านหนึ่ง เจ้าของอยากเอา AI มาช่วยงาน — ผมจะลองไล่ให้ดูว่างานแต่ละอย่างมันเป็น regression หรือ classification (ย้ำว่าทั้งหมดเป็นฉาก สมมติ ที่ผมแต่งขึ้นเพื่ออธิบายนะครับ)

งานที่อยากให้ AI ช่วย (ร้านสมมติ)	คำตอบที่อยากได้	เป็นงานแบบ
เดือนหน้าน่าจะขายข้าวสารได้กี่กระสอบ จะได้สั่งสต็อกไม่ขาดไม่เกิน	ตัวเลข (กี่กระสอบ)	Regression
ลูกค้ารายนี้น่าจะกลับมาซื้อซ้ำไหม จะได้ส่งโปรไปดึง	กลุ่ม (ซื้อซ้ำ/ไม่ซื้อซ้ำ)	Classification
บิลค่าส่งของรอบหน้าน่าจะราวๆ เท่าไหร่	ตัวเลข (กี่บาท)	Regression
ข้อความที่ลูกค้าทักมา เป็นการ “ถามของ / ร้องเรียน / ทักเล่น”	กลุ่ม (สามประเภท)	Classification

เห็นไหมครับว่าพองานเดียวกันคือ “ให้ AI ช่วยร้าน” แต่พอแยกดูทีละงาน มันคนละแบบกันชัดเจน บางงานต้องการตัวเลข บางงานต้องการให้จัดกลุ่ม — และทั้งสองแบบนี้ ถ้าจะให้ AI ทำได้ดี ก็ต้องมี “เฉลยเก่าๆ” (ข้อมูลขายเก่า ข้อมูลลูกค้าเก่า ข้อความเก่าที่เคยจัดกลุ่มไว้) มาสอนมันก่อนทั้งนั้น ไม่มีเฉลย = ไม่มีของให้เรียน

และนี่ก็วนกลับไปที่ประเด็นต้นเรื่องครับ ของพวกนี้ทำได้หรือไม่ได้ ไม่ได้อยู่ที่ “AI เก่งแค่ไหน” อย่างเดียว แต่อยู่ที่ว่า ร้านคุณมีข้อมูลเก่าที่ติดป้ายเฉลยไว้ดีพอหรือเปล่า ร้านที่เก็บข้อมูลขายดีๆ มาตลอด จะมีของให้ AI เรียนเยอะ ส่วนร้านที่ไม่เคยเก็บอะไรเลย ต่อให้อยากใช้ AI ก็เริ่มยากกว่า เพราะไม่มีเฉลยให้มันดู

สรุปสั้นๆ ส่งท้าย#

ถ้าให้ย่อทั้งตอนนี้เหลือไม่กี่บรรทัดเอาไว้จำง่ายๆ คือแบบนี้ครับ

Supervised Learning = เรียนแบบมีเฉลย มีคนติดป้าย (label) บอกคำตอบที่ถูกให้ AI ดูเยอะๆ แล้วมันค่อยจับทางเอาไปเดาของใหม่ (เหมือนเด็กหัดดูผลไม้โดยมีผู้ใหญ่คอยบอกชื่อ)
เฉลยไม่ได้มาฟรี ต้องมีคนนั่งติดป้าย ใช้เวลาใช้เงิน และคุณภาพเฉลยสำคัญมาก — เฉลยมั่ว AI ก็เรียนผิด
Regression = ทำนายเป็นตัวเลขไล่ระดับ ตอบคำถามว่า “เท่าไหร่?” (เช่น ราคาบ้าน, ยอดขายเดือนหน้า)
Classification = จัดเข้ากลุ่ม ตอบคำถามว่า “อันไหน / ใช่ไหม?” (เช่น สแปม/ไม่สแปม, ชม/บ่น)
เส้นแบ่ง: คำตอบที่อยากได้เป็น “ตัวเลข” หรือ “กลุ่ม” — แค่นี้ก็แยกออกแล้ว
กุญแจของทั้งคู่คือข้อมูลเฉลยเก่า ร้านที่เก็บข้อมูลดี เริ่มต้นกับ AI ได้ง่ายกว่า

ผมไม่ใช่ผู้เชี่ยวชาญด้าน AI อะไรหรอกนะครับ เป็นแค่คนที่พยายามนั่งทำความเข้าใจเรื่องพวกนี้ด้วยตัวเอง แล้วก็เลยอยากเล่าต่อแบบภาษาคนๆ ตรงไหนผมเข้าใจคลาดเคลื่อนไป ทักท้วงกันเข้ามาได้เลยนะครับ ยินดีมากๆ

ตอนหน้าของ Part 1 ผมว่าจะเล่าต่ออีกฝั่งของเหรียญ คือเจ้า “เรียนแบบไม่มีเฉลย” (unsupervised) ที่เกริ่นไว้ตอนต้นเนี่ย จริงๆ มันทำงานยังไง แล้วมันช่วยให้เราเห็นกลุ่มลูกค้าที่เราไม่เคยรู้ว่ามีได้ยังไง ไว้เจอกันตอนหน้าครับ