AI 101 EP.04 — Unsupervised Learning — เรียนแบบไม่มีเฉลย (จับกลุ่ม/หาของแปลก)

AI 101 — ปัญญาประดิษฐ์ฉบับภาษาคน · Part 1 (เบื้องหลัง: AI ทำงานยังไง) ซีรีส์นี้ผมเขียนให้เจ้าของกิจการกับคนทำงานทั่วไปที่ไม่ใช่สาย IT อ่านสนุกๆ แต่ได้ของกลับไปใช้จริง ไม่มีศัพท์ยากๆ ขู่ให้กลัว ตอนนี้เป็นเรื่อง “Unsupervised Learning — เรียนแบบไม่มีเฉลย” — วิธีที่ AI จัดกลุ่มลูกค้าให้เราเอง และจับของแปลกๆ ได้ทั้งที่ไม่มีใครบอกมันว่าอะไรคือแปลก (สารบัญเต็มของซีรีส์จะตามมาทีหลังนะครับ)

ลองนึกภาพฉากนี้ดูก่อนครับ#

สมมติว่าเจ้าของร้านคนหนึ่งเดินมาวางกองนามบัตรลูกค้าเก่าสองพันใบไว้บนโต๊ะคุณ แล้วบอกสั้นๆ ว่า “ช่วยจัดกองพวกนี้ให้หน่อย”

คุณถามกลับว่า “จัดยังไงครับ จัดตามอะไร — ตามจังหวัด? ตามอายุ? ตามยอดซื้อ?”

เขาส่ายหน้า แล้วบอกว่า “ไม่รู้สิ ผมก็ไม่รู้ว่าควรแบ่งเป็นกี่กอง แบ่งตามอะไรดี เอาเป็นว่า… คุณลองดูเองว่าใครคล้ายใคร แล้วจัดให้มันเข้าพวกกันก็พอ”

ฟังดูกวนนิดๆ ใช่ไหมครับ 555+ แต่จริงๆ แล้วนี่แหละคือโจทย์ที่เจ้าของกิจการเจอกันทุกวัน — เรามีข้อมูลกองโต แต่เราไม่รู้ด้วยซ้ำว่าควรมองมันยังไง ไม่มีใครมานั่งบอกเราว่า “ลูกค้าคนนี้คือประเภท A คนนั้นคือประเภท B” เราก็ได้แต่เดาๆ เอาเอง

ตอนที่แล้วของซีรีส์นี้ เราคุยกันเรื่อง Supervised Learning (ซูเปอร์ไวซด์ เลิร์นนิ่ง — “เรียนแบบมีเฉลย”) ซึ่งเหมือนติวเด็กด้วยข้อสอบที่มีเฉลยกำกับมาทุกข้อ เด็กเห็นโจทย์คู่กับเฉลยเยอะๆ พอเจอโจทย์ใหม่ก็เดาคำตอบได้ แต่ตอนนี้ผมอยากชวนคุยอีกแบบหนึ่ง — แบบที่ ไม่มีเฉลยมาให้เลย มีแต่ข้อมูลดิบกองโตๆ แล้วปล่อยให้เครื่องไปงมเอาเองว่ามีอะไรซ่อนอยู่ในกองนั้น

ภาษาวงการเรียกการเรียนแบบนี้ว่า Unsupervised Learning (อันซูเปอร์ไวซด์ เลิร์นนิ่ง — แปลแบบบ้านๆ คือ “การเรียนแบบไม่มีคนคุม / ไม่มีเฉลย”) ฟังชื่อแล้วเหมือนยาก แต่ผมว่าพออ่านจบตอนนี้ คุณจะร้องอ๋อเลยครับ เพราะมันคือสิ่งที่อยู่เบื้องหลังหลายอย่างที่เราใช้กันทุกวันโดยไม่รู้ตัว

มี “เฉลย” กับ “ไม่มีเฉลย” ต่างกันตรงไหน#

ก่อนจะไปต่อ ผมขอปูพื้นคำว่า label (เลเบล — แปลว่า “ป้ายเฉลย” หรือ “ป้ายกำกับ”) ให้ชัดก่อนนะครับ เพราะมันคือหัวใจของเรื่องทั้งหมดวันนี้

ลองนึกถึงกองรูปภาพ สมมติว่าคุณมีรูปสัตว์อยู่พันรูป —

ถ้ามี label ก็คือทุกรูปมีป้ายแปะไว้แล้วว่า “อันนี้หมา” “อันนี้แมว” “อันนี้นก” เครื่องแค่ดูรูปคู่กับป้าย แล้วจำว่าหน้าตาแบบไหนเรียกว่าอะไร — นี่คือ Supervised แบบที่เราคุยกันตอนที่แล้ว
ถ้าไม่มี label ก็คือมีแต่รูปเปล่าๆ พันรูป ไม่มีใครบอกว่าอันไหนคืออะไรเลย — งานของเครื่องเปลี่ยนไปทันที มันบอกไม่ได้หรอกว่า “นี่คือหมา” เพราะไม่มีใครเคยสอนคำว่าหมาให้มัน แต่สิ่งที่มันทำได้คือ มองออกว่ารูปกลุ่มนี้หน้าตาคล้ายกัน รูปอีกกลุ่มหน้าตาคล้ายกันอีกแบบ แล้วแยกกองให้

เห็นความต่างไหมครับ Supervised มีครูคอยเฉลยข้างๆ ตลอด ส่วน Unsupervised เหมือนโยนเด็กเข้าไปในห้องที่เต็มไปด้วยของ แล้วบอกว่า “ลองจัดของพวกนี้ให้เป็นหมวดหมู่หน่อย” โดยไม่บอกว่าควรมีกี่หมวด หรือหมวดอะไรบ้าง เด็กต้องใช้สายตาตัวเองสังเกตว่า “อันนี้กับอันนี้น่าจะพวกเดียวกันนะ”

	มีเฉลย (Supervised)	ไม่มีเฉลย (Unsupervised)
ข้อมูลที่ป้อน	โจทย์ + เฉลย (มี label)	โจทย์ล้วนๆ (ไม่มี label)
งานที่เครื่องทำ	จำว่าโจทย์แบบนี้ตอบแบบไหน	หาว่าอะไรคล้ายอะไร / อะไรแปลกแยก
เหมือนอะไร	ติวด้วยข้อสอบมีเฉลย	จัดของในห้องรกๆ ให้เป็นหมวด
คำถามที่ตอบได้	”อันนี้คืออะไร” (ทายป้าย)	“ในกองนี้มีกี่พวก / อะไรผิดปกติ”

ทีนี้พอไม่มีเฉลย เครื่องมันเอาไปทำอะไรได้บ้าง? หลักๆ มีสองงานที่เจ้าของกิจการน่าจะได้ใช้บ่อยที่สุด คือ จับกลุ่ม กับ หาของแปลก ครับ แต่เดี๋ยวก่อน ก่อนจะไปดูสองงานนั้น ผมอยากตอบคำถามที่หลายคนน่าจะค้างคาใจอยู่ก่อน —

“ก็แค่แปะป้ายเฉลยให้มันสิ จะยากตรงไหน?”#

พอผมเล่าว่าแบบมีเฉลยมันเช็คง่ายกว่า เรียนง่ายกว่า หลายคนน่าจะคิดในใจว่า “อ้าว งั้นก็แปะป้ายเฉลยให้มันทุกอันไปเลยสิ จะมานั่งเรียนแบบไม่มีเฉลยให้ลำบากทำไม”

คำถามดีมากครับ และคำตอบคือ — การแปะป้ายเฉลยมันแพงและเหนื่อยกว่าที่คิดเยอะ

ลองนึกภาพง่ายๆ ครับ สมมติคุณมีรูปลูกค้าถ่ายสินค้าส่งเข้ามาในเพจวันละพันรูป ถ้าจะทำข้อมูลแบบมีเฉลย แปลว่าต้องมีคน นั่งดูทีละรูป แล้วพิมพ์กำกับ ว่ารูปนี้คือสินค้าอะไร สีอะไร ตำหนิตรงไหน — พันรูปต่อวัน ใช้คนเท่าไหร่ เหนื่อยแค่ไหน เสียเงินเท่าไหร่ ลองคิดดู และนั่นยังเป็นงานที่ “พอจะรู้คำตอบ” นะครับ

แต่ของจริงในธุรกิจ หลายครั้งเรา ไม่รู้ด้วยซ้ำว่าเฉลยที่ถูกคืออะไร เหมือนเจ้าของร้านในฉากเปิดเรื่องที่บอกว่า “ผมก็ไม่รู้ว่าควรแบ่งลูกค้าเป็นกี่กอง แบ่งตามอะไรดี” — ในเมื่อตัวเรายังไม่รู้คำตอบ เราจะไปแปะป้ายเฉลยให้เครื่องได้ยังไงล่ะครับ? นี่แหละคือเหตุผลที่ Unsupervised Learning มันมีค่า — มันทำงานได้ในสถานการณ์ที่ เราเองก็ยังงงๆ อยู่ ว่ามองข้อมูลกองนี้ยังไงดี

พูดง่ายๆ คือ —

มีเฉลยอยู่แล้ว และคุ้มที่จะแปะ → ใช้ Supervised (ตอนที่แล้ว)
ไม่มีเฉลย / แปะไม่ไหว / ยังไม่รู้ด้วยซ้ำว่าเฉลยคืออะไร → นี่แหละงานของ Unsupervised

โอเค ทีนี้พร้อมแล้ว ไปดูสองงานหลักทีละอันเลยครับ

เดี๋ยวนะ เครื่องมัน “รู้ได้ไง” ว่าอะไรคล้ายอะไร#

ก่อนเข้าสองงานหลัก ผมขอเคลียร์อีกนิดนึง เพราะทั้ง clustering และ anomaly detection มันยืนอยู่บนคำเดียวกันคือ “ความคล้าย” — แล้วเครื่องที่ไม่มีสายตาแบบคน มันวัด “ความคล้าย” ได้ยังไง?

อุปมาบ้านๆ ที่ผมชอบคือ แผนที่กับระยะห่าง ครับ ลองนึกภาพว่าเราเอาลูกค้าแต่ละคนไปวางเป็นจุดบนแผนที่ใหญ่ๆ แผ่นหนึ่ง โดยตำแหน่งของแต่ละจุดมาจากพฤติกรรมของเขา เช่นแกนนอนคือ “ซื้อบ่อยแค่ไหน” แกนตั้งคือ “ซื้อทีละเท่าไหร่” — ลูกค้าที่พฤติกรรมคล้ายกันก็จะไปอยู่ใกล้ๆ กันบนแผนที่ ส่วนคนที่พฤติกรรมต่างกันมากก็จะอยู่ห่างกันออกไป

พอคิดเป็นแบบนี้แล้ว คำว่า “คล้าย” มันก็กลายเป็นเรื่องง่ายสำหรับเครื่องทันทีครับ — คล้าย = อยู่ใกล้กัน, ไม่คล้าย = อยู่ไกลกัน เครื่องเก่งเรื่องวัดระยะอยู่แล้ว มันเลยทำงานต่อได้สบาย จุดที่เกาะกลุ่มกันแน่นๆ บนแผนที่ = หนึ่งกอง (นั่นคืองาน clustering) ส่วนจุดที่อยู่โดดเดี่ยวไกลจากทุกกอง = ตัวประหลาด (นั่นคืองาน anomaly detection)

ไม่ต้องจำรายละเอียดอะไรลึกกว่านี้นะครับ เอาแค่ภาพ “เปลี่ยนทุกอย่างเป็นจุดบนแผนที่ แล้ววัดว่าใครอยู่ใกล้ใครไกล” ก็พอเข้าใจทั้งตอนแล้ว ไปดูสองงานจริงกันเลย

งานที่หนึ่ง: จับกลุ่ม (Clustering) — “แยกกองให้เองโดยไม่ต้องบอกว่ามีกี่กอง”#

งานแรกเรียกว่า Clustering (คลัสเตอริง — แปลว่า “การจับกลุ่ม / การแบ่งกอง”) ครับ

อุปมาที่ผมชอบที่สุดสำหรับเรื่องนี้คือ ตะกร้าผ้าซักรวมกองโต ลองนึกภาพว่าคุณเทผ้าที่ซักเสร็จทั้งบ้านลงกองเดียวบนเตียง เสื้อ กางเกง ถุงเท้า ผ้าเช็ดตัว ปนกันมั่วไปหมด แล้วคุณก็เริ่มหยิบมาจัด — โดยที่ไม่มีใครบอกคุณว่า “ต้องแบ่งเป็น 4 กองนะ” คุณแค่หยิบขึ้นมาแล้วรู้สึกเองว่า “อันนี้เป็นเสื้อ ไปกองนี้ อันนี้เป็นถุงเท้า ไปกองนั้น” สุดท้ายกองมันก็ค่อยๆ เกิดขึ้นเอง ตามความ “คล้ายกัน” ของแต่ละชิ้น

Clustering ก็คือแบบนี้เป๊ะเลยครับ เครื่องดูข้อมูลทีละชิ้น แล้วจับชิ้นที่ “หน้าตาใกล้เคียงกัน” ไปอยู่กองเดียวกัน ชิ้นที่ต่างกันมากก็แยกไปอีกกอง โดยที่ เราไม่ต้องตั้งชื่อกองล่วงหน้าให้มันเลย มันงมหากองเองจากความคล้าย แล้วเราค่อยมาดูว่ากองที่ได้มันคือใคร

จุดสำคัญที่อยากให้จับไว้คือคำว่า “คล้าย” นี่แหละครับ — มันไม่ได้คล้ายเรื่องเดียว แต่คล้ายกันได้หลายมุมพร้อมกัน เหมือนเวลาคุณจัดผ้า คุณไม่ได้ดูแค่ “สี” อย่างเดียว แต่ดูทั้งขนาด ทั้งเนื้อผ้า ทั้งว่าเป็นของใคร ปนๆ กันไปในหัวโดยอัตโนมัติ เครื่องก็มองหลายมุมพร้อมกันแบบนั้นเหมือนกัน เช่นจับลูกค้าโดยดูทั้งความถี่ในการซื้อ ยอดต่อครั้ง และความสดใหม่ของการซื้อล่าสุด ไปพร้อมๆ กัน แล้วถึงค่อยตัดสินว่าใครเข้าพวกใคร

ลองนึกภาพในร้านจริงๆ ดูครับ#

สมมติว่าเจ้าของร้านค้าออนไลน์คนหนึ่งมีข้อมูลลูกค้าอยู่ในมือ — ใครซื้อบ่อยแค่ไหน ซื้อทีละเท่าไหร่ ซื้อครั้งสุดท้ายเมื่อไหร่ ปกติเจ้าของก็มองลูกค้าเป็นกองเดียวว่า “ลูกค้าร้านเรา” ใช่ไหมครับ แต่พอเอาข้อมูลพวกนี้โยนให้ระบบ clustering มันอาจจะค่อยๆ แยกออกมาเป็นกองๆ ที่เรามองไม่เห็นด้วยตาเปล่า เช่น (ขอย้ำว่ากองพวกนี้เป็นแค่ ตัวอย่างสมมติ ที่ผมแต่งขึ้นให้เห็นภาพนะครับ ไม่ใช่ผลจริงของร้านใคร) —

กองที่เครื่องจับได้ (สมมติ)	หน้าตาของกองนี้	เจ้าของเอาไปทำอะไรต่อได้
ขาประจำตัวจริง	ซื้อบ่อย ซื้อสม่ำเสมอ ยอดต่อครั้งไม่สูงมาก	ทำบัตรสมาชิก ดูแลให้ดี อย่าให้หนีไปไหน
สายซื้อทีเดียวจัดหนัก	นานๆ ซื้อที แต่ซื้อทีเป็นก้อนใหญ่	ส่งโปรช่วงเทศกาล/ตุนของ จับจังหวะให้ถูก
ลูกค้าใกล้หาย	เคยซื้อบ่อย แต่หายไปนานแล้ว	ส่งคูปองดึงกลับมาก่อนจะลืมร้านเราถาวร
มือใหม่เพิ่งลอง	เพิ่งซื้อครั้งแรก ยังไม่กลับมา	ส่งข้อความต้อนรับ ชวนซื้อครั้งที่สอง

จุดที่เจ๋งคือ ไม่มีใครบอกเครื่องไว้ก่อนว่าให้แบ่งเป็น 4 กองนี้ เราไม่ได้ตั้งชื่อกองให้มันด้วยซ้ำ — ชื่อกองพวกนี้เป็นสิ่งที่เจ้าของมานั่งตั้งทีหลังเองเพราะเห็นแล้วว่า “อ๋อ กองนี้มันคือพวกขาประจำนี่นา” เครื่องแค่บอกว่า “ลูกค้าพวกนี้พฤติกรรมคล้ายกัน ผมจัดให้อยู่ด้วยกันแล้วนะ” ส่วนจะแปลว่าอะไร เอาไปทำอะไรต่อ เป็นหน้าที่ของคนครับ

นี่คือเสน่ห์ของ clustering — มันช่วย เปิดตา ให้เราเห็นโครงสร้างที่ซ่อนอยู่ในข้อมูลของตัวเอง ทั้งที่เราจ้องมันมาทั้งชีวิตแต่มองไม่ออก เหมือนมีคนช่วยจัดบ้านรกๆ ให้เป็นระเบียบ แล้วเราถึงเพิ่งเห็นว่า “เฮ้ย ของกลุ่มนี้มันเยอะกว่าที่คิดนี่หว่า”

แล้วมันรู้ได้ไงว่าควรมีกี่กอง?#

ตรงนี้เป็นจุดที่คนชอบเข้าใจผิด เลยอยากเคลียร์หน่อยครับ — clustering มัน ไม่ได้ผุดเลขกองออกมาจากอากาศ เป๊ะๆ แบบที่หลายคนคิด

ความจริงคือ ระบบ clustering หลายแบบ เราต้องเป็นคนบอกมันก่อน ว่าอยากได้กี่กอง เช่นเราบอกว่า “ลองแบ่งเป็น 3 กองดู” มันก็จัดมาให้ 3 กอง พอเราบอกว่า “ลองแบ่งเป็น 5 กองดู” มันก็จัดมาให้ 5 กอง — แล้วเราค่อยมานั่งดูว่าจำนวนไหนมันสมเหตุสมผล ใช้ประโยชน์ได้จริงกับร้านเรา

เปรียบเหมือนจัดกองผ้าซักอีกทีครับ ถ้าคุณตั้งใจจะแบ่งแค่ 2 กอง (ผ้าของผู้ใหญ่ / ผ้าของเด็ก) มันก็ได้ ถ้าจะแบ่งละเอียดเป็น 6 กอง (เสื้อ-กางเกง-ถุงเท้า-ผ้าเช็ดตัว-ผ้าปูที่นอน-อื่นๆ) ก็ได้อีก ไม่มีคำตอบเดียวที่ถูกร้อยเปอร์เซ็นต์ มันขึ้นกับว่า คุณจะเอากองพวกนั้นไปทำอะไรต่อ ถ้าแบ่งละเอียดเกินไปจนแต่ละกองมีของอยู่ชิ้นสองชิ้น มันก็ไม่มีประโยชน์ ถ้าแบ่งหยาบไปจนทุกอย่างกองรวมกันก็ไม่ช่วยอะไรเหมือนกัน

ฉะนั้นเวลาทำ clustering จริงๆ มันเลยเป็นการ ลองหลายๆ จำนวนกอง แล้วเลือกอันที่ดูเข้าท่าที่สุด ไม่ใช่กดปุ่มทีเดียวได้คำตอบเป๊ะ และคนที่ตัดสินว่า “อันนี้แหละเข้าท่า” ก็คือเจ้าของธุรกิจที่รู้จักลูกค้าตัวเอง ไม่ใช่ตัวเครื่องครับ

นี่คือเสน่ห์ของ clustering — มันช่วยเปิดตาให้เรา แต่มันไม่ได้มาแทนสมองเรา

💡 มุมเจ้าของกิจการ: clustering ไม่ได้ให้ “คำตอบสำเร็จรูป” นะครับ มันให้ “กองที่จัดไว้ให้แล้ว” ต่างหาก — แล้วคนต้องเป็นคนตีความว่าแต่ละกองคือใคร มีค่าแค่ไหน ควรดูแลยังไง ฉะนั้นเวลามี vendor มาเสนอระบบ “แบ่งกลุ่มลูกค้าอัตโนมัติด้วย AI” ก็อย่าคาดหวังว่าเสียบปุ๊บได้กลยุทธ์การตลาดออกมาเลย มันแค่จัดกองให้ ส่วนสมองที่เอาไปใช้ยังต้องเป็นของคุณอยู่ดี

งานที่สอง: หาของแปลก (Anomaly Detection) — “ตัวที่ไม่เข้าพวก สะดุดตาขึ้นมาเอง”#

งานที่สองเป็นงานที่ผมว่าน่าตื่นเต้นกว่าด้วยซ้ำ เรียกว่า Anomaly Detection (อะนอมาลี ดีเทกชั่น — แปลแบบบ้านๆ คือ “การจับของผิดปกติ / ตรวจจับสิ่งแปลกแยก”) ครับ

ถ้า clustering คือการมองหา “ความคล้าย” แล้วจับเข้ากอง anomaly detection ก็คือการมองหา “ความไม่คล้าย” — คือตัวไหนที่มันโดดออกมาจากพวก ไม่เข้ากับใครเลย ตัวนั้นแหละที่น่าสงสัย

อุปมาที่เห็นภาพง่ายที่สุดคือ เกมจับผิดในห้องเรียน ลองนึกภาพห้องเรียนที่เด็กทุกคนใส่ชุดนักเรียนสีขาวเหมือนกันหมด แล้วจู่ๆ มีคนนึงเดินเข้ามาใส่ชุดสีแดงแปร๊ดกลางห้อง — คุณไม่ต้องมีใครมาสอนเลยว่า “สีแดงคือผิด” คุณแค่เห็นปุ๊บก็รู้สึกเองทันทีว่า “เอ๊ะ คนนี้ไม่เข้าพวก” เพราะทุกคนรอบตัวมันเหมือนกันหมด พอมีตัวที่ต่างออกไปมันเลยสะดุดตา

Anomaly detection ทำงานแบบนี้เป๊ะเลยครับ มันไม่ได้ถูกสอนว่า “อะไรคือของแปลก” (เพราะถ้าสอนได้แสดงว่าเรารู้หน้าตาของแปลกอยู่แล้ว ก็ไม่ต้องใช้มันแล้วสิ) — มันแค่ดูข้อมูลส่วนใหญ่จนรู้ว่า “หน้าตาปกติเป็นแบบนี้นะ” พอมีตัวไหนหลุดออกจากความปกตินั้นมากๆ มันก็ยกมือบอกว่า “อันนี้แปลกนะ ลองมาดูหน่อย”

เคสที่ทุกคนน่าจะเคยเจอ — ธุรกรรมบัตรที่โดนระงับ#

ตัวอย่างที่ใกล้ตัวที่สุดคือเรื่องบัตรเครดิต/บัตรเดบิตครับ สมมติว่าปกติเจ้าของบัตรคนหนึ่งใช้จ่ายแบบเดิมๆ ทุกเดือน — รูดซื้อกาแฟแถวออฟฟิศ จ่ายค่าน้ำค่าไฟ ซื้อของในห้างใกล้บ้าน ยอดต่อครั้งหลักร้อยหลักพัน อยู่ในเมืองเดียวตลอด นี่คือ “หน้าตาปกติ” ของคนคนนี้

แล้วจู่ๆ คืนหนึ่งตอนตีสาม มีรายการรูดบัตรใบนี้ก้อนใหญ่มากจากร้านในต่างประเทศที่เจ้าตัวไม่เคยไป — ระบบมันจะสะดุดทันทีครับ ไม่ใช่เพราะมีใครเขียนกฎไว้ว่า “ตีสาม + ต่างประเทศ + ยอดสูง = โกง” (เพราะเขียนกฎดักทุกแบบไม่ไหวหรอก โจรมันพลิกแพลงตลอด) แต่เพราะรายการนี้มัน ไม่เข้าพวก กับพฤติกรรมปกติของคนคนนี้อย่างชัดเจน เหมือนชุดแดงในห้องที่ใส่ขาวกันหมดนั่นแหละ ระบบเลยขอเบรกไว้ก่อน โทรมาถามเจ้าของว่า “ใช่คุณรูดเองไหม” — นี่แหละครับคือ anomaly detection ทำงานอยู่เบื้องหลัง

จุดที่ผมอยากให้สังเกตคือ มันไม่ได้ทำงานแบบ “มีบัญชีดำรายชื่อโจร” แล้วไล่จับตามรายชื่อ แต่มันทำงานแบบ “รู้จักความปกติของแต่ละคน แล้วจับตัวที่หลุดจากความปกตินั้น” ซึ่งยืดหยุ่นกว่ามาก เพราะของแปลกหน้าใหม่ๆ ที่ไม่เคยเห็นมาก่อน มันก็ยังจับได้ ขอแค่มัน “ต่างจากปกติ” พอ

ตรงนี้แหละครับคือข้อได้เปรียบที่ใหญ่ที่สุดของ anomaly detection เมื่อเทียบกับการ “เขียนกฎดักเอง” แบบเดิมๆ — ลองนึกภาพว่าถ้าเราจะกันโจรด้วยการเขียนกฎเอง เราต้องนั่งคิดทุกท่าที่โจรอาจจะใช้ แล้วเขียนดักไว้ทีละข้อ “ถ้ารูดเกินแสน → เตือน” “ถ้ารูดต่างประเทศ → เตือน” “ถ้ารูดตอนดึก → เตือน” … เขียนเท่าไหร่ก็ไม่มีวันครบ เพราะพอเราอุดช่องนี้ โจรก็ไปหาช่องใหม่ที่เราคิดไม่ถึง เหมือนเล่นตีตัวตุ่นไม่จบไม่สิ้น แต่ anomaly detection มันพลิกมุมคิดเลยครับ — แทนที่จะไล่จำว่า “อะไรคือผิด” (ซึ่งมีล้านแบบ) มันจำแค่ว่า “อะไรคือปกติ” (ซึ่งมีไม่กี่แบบ) แล้วอะไรที่ไม่ใช่ปกติก็คือน่าสงสัยหมด วิธีนี้เลยดักของแปลกหน้าใหม่ที่ไม่เคยเจอได้ด้วย

แล้วมัน “รู้จักความปกติ” ได้ยังไง?#

หลายคนอาจสงสัยว่ามันไปเอา “ความปกติ” มาจากไหน คำตอบง่ายมากครับ — จากการดูเยอะๆ เครื่องเฝ้าดูพฤติกรรมที่เกิดขึ้นซ้ำๆ เป็นพันเป็นหมื่นครั้ง จนมันเห็นภาพว่า “ส่วนใหญ่แล้วมันหน้าตาประมาณนี้นะ” เหมือนยามหน้าหมู่บ้านที่ยืนเฝ้าหน้าประตูมาหลายปี จนจำได้ว่ารถคันไหนคนในหมู่บ้าน เวลาไหนใครเข้าออกเป็นปกติ พอมีรถแปลกหน้าเข้ามาตอนตีสอง ยามไม่ต้องมีใครสอนหรอกครับว่าให้สงสัย เพราะมันต่างจากภาพที่เห็นจนชินไปเอง

นั่นแปลว่า anomaly detection จะแม่นหรือไม่แม่น ขึ้นอยู่กับว่า “ความปกติ” ที่มันเรียนมามันตรงกับความจริงแค่ไหนด้วย ถ้าธุรกิจคุณเพิ่งเริ่ม ข้อมูลยังน้อย เครื่องก็ยังไม่ค่อยรู้จักความปกติดีนัก อาจจะตื่นตูมบ่อยหน่อยในช่วงแรก แต่พอเวลาผ่านไป เห็นข้อมูลมากขึ้น มันก็จะค่อยๆ จับทางได้แม่นขึ้นเรื่อยๆ ครับ

เอาไปใช้ในธุรกิจทั่วๆ ไปได้อีกเยอะ#

ของแปลกไม่ได้มีแค่เรื่องโกงนะครับ เจ้าของกิจการเอาแนวคิดนี้ไปจับอะไรได้อีกหลายอย่าง (ตัวอย่างสมมติทั้งหมดนะครับ) —

จับของแปลกเรื่องอะไร (สมมติ)	“ปกติ” หน้าตาเป็นยังไง	”แปลก” ที่ระบบจะสะดุด
ยอดขายรายวันของสาขา	ขึ้นๆ ลงๆ อยู่ในกรอบที่คุ้นเคย	วันนึงตกฮวบผิดปกติ → ของขาด? เครื่องเสีย?
การใช้ไฟของเครื่องจักรในโรงงาน	กินไฟสม่ำเสมอตอนทำงาน	จู่ๆ กินไฟพุ่งผิดปกติ → เครื่องใกล้พัง?
พฤติกรรมล็อกอินของพนักงาน	เข้าระบบช่วงเวลางาน จากที่เดิม	ล็อกอินตีสองจากที่แปลกๆ → บัญชีโดนแฮ็ก?
สต็อกสินค้าในคลัง	ลดลงตามยอดขายปกติ	หายไปเร็วกว่ายอดขาย → ของหาย/บันทึกพลาด?

เห็นไหมครับว่าหัวใจมันเหมือนกันหมด — เรียนรู้ว่าอะไรคือปกติก่อน แล้วคอยสะกิดเราเวลามีอะไรหลุดออกจากปกตินั้น มันเหมือนมียามเฝ้าที่ไม่เคยหลับ คอยจ้องว่ามีอะไรผิดสังเกตไหม โดยที่เราไม่ต้องนั่งไล่ดูตัวเลขเป็นพันๆ แถวเองทุกวัน

แล้วทำไมต้องให้เครื่องทำ ในเมื่อคนก็ดูเองได้?#

คำถามนี้ดีครับ และคำตอบคือเรื่อง “ปริมาณ” กับ “ความสม่ำเสมอ” ล้วนๆ

ถ้าร้านคุณมีออเดอร์วันละสิบรายการ คุณนั่งไล่ดูเองได้สบาย ของแปลกหลุดมาก็เห็นทันที ตรงนี้ไม่ต้องพึ่งเครื่องเลยครับ แต่พอธุรกิจโตขึ้น มีรายการวันละพันวันละหมื่น หรือมีเครื่องจักรหลายสิบเครื่องส่งค่ามาตลอดเวลา ตามนุษย์ก็จ้องไม่ไหวแล้ว แล้วของแปลกที่หลุดมาตอนตีสามวันหยุด ใครจะนั่งเฝ้าล่ะ?

อีกอย่างคือคนเรา เหนื่อยเป็น เผลอเป็น อคติเป็น ดูตัวเลขเป็นพันแถวไปสักพักตาก็ลาย เริ่มมองข้ามของที่ควรเห็น แต่เครื่องมันดูทุกแถวด้วยมาตรฐานเดียวกันเป๊ะ ไม่มีเบื่อ ไม่มีหลับ ตรงนี้แหละที่มันมาเสริมคนได้สวยมาก — ไม่ใช่มาแทนคน แต่มาทำงานน่าเบื่อที่คนทำได้ไม่ทน แล้วยกเคสที่น่าสงสัยส่งให้คนตัดสินใจขั้นสุดท้าย

💡 มุมเจ้าของกิจการ: ของดีของ anomaly detection คือมันจับ “เรื่องที่เราไม่เคยคิดว่าจะต้องระวัง” ได้ด้วย เพราะมันไม่ได้ไล่ตามรายการกฎที่เราเขียน แต่… ข้อควรระวังคือมันชอบ ตื่นตูม ครับ ของแปลกบางอย่างมันก็แปลกจริงแต่ไม่ได้เป็นปัญหา (เช่นวันที่ยอดพุ่งเพราะมีโปรฯ พอดี) ระบบก็อาจเด้งเตือนมาเหมือนกัน ฉะนั้นอย่าเชื่อมันร้อยเปอร์เซ็นต์ ให้มองมันเป็น “ตัวช่วยกรองว่าจุดไหนควรเอาตามนุษย์ไปดู” จะเวิร์กกว่า

ที่จริงคุณเจอสองตัวนี้อยู่ทุกวันแล้วนะครับ#

อ่านมาถึงตรงนี้บางคนอาจรู้สึกว่า “ฟังดูเป็นเรื่องของบริษัทใหญ่ๆ จัง” — เปล่าเลยครับ จริงๆ แล้ว clustering กับ anomaly detection มันแอบทำงานอยู่รอบตัวเราทุกวัน เราแค่ไม่เคยรู้ว่ามันชื่อนี้ ลองดูตัวอย่างที่น่าจะคุ้นๆ —

แอปฟังเพลง/ดูหนัง ที่จัด “เพลย์ลิสต์สำหรับคุณ” — เบื้องหลังคือมันจับกลุ่มคนที่รสนิยมคล้ายๆ กันไว้ด้วยกัน (clustering) แล้วเดาว่าคนในกองเดียวกับคุณน่าจะชอบอะไร
อีเมลที่เด้งเข้าโฟลเดอร์ “สแปม” หรือ “โปรโมชั่น” เอง — ส่วนหนึ่งมาจากการมองว่าอีเมลนี้หน้าตา “เข้าพวก” กับกองไหน
ข้อความเตือนจากแอปธนาคารว่า “พบการใช้จ่ายผิดปกติ” — นี่คือ anomaly detection ตรงๆ เลยครับ มันจับได้ว่ารายการนี้หลุดจากพฤติกรรมปกติของคุณ
เว็บช้อปปิ้งที่ขึ้นว่า “ลูกค้าที่ซื้อสินค้านี้ มักซื้อสิ่งนี้ด้วย” — เบื้องหลังก็มีการจับกลุ่มพฤติกรรมการซื้อที่คล้ายๆ กัน

เห็นไหมครับว่ามันไม่ใช่เรื่องไกลตัวเลย ที่ผมเล่ามาทั้งหมดนี้ก็เพื่อให้คราวหน้าเวลาคุณเห็นฟีเจอร์พวกนี้ คุณจะร้องอ๋อว่า “อ๋อ ข้างในมันก็คือเรื่องที่อ่านมานั่นเอง” และพอเข้าใจหลักการแล้ว เวลาจะเอามาใช้กับธุรกิจตัวเองก็จะไม่กลัวมันอีกต่อไป

และที่ผมว่าสำคัญที่สุดคือ — พอคุณเข้าใจว่าเบื้องหลังมันคือแค่ “จับความคล้าย” กับ “จับของแปลก” ไม่ใช่เวทมนตร์อะไร คุณก็จะมีภูมิคุ้มกันเวลามี vendor มาขายของด้วยคำหรูๆ ครับ เขาอาจจะใช้คำว่า “AI แบ่งกลุ่มลูกค้าอัจฉริยะ” หรือ “ระบบ AI ตรวจจับการทุจริตอัตโนมัติ” ฟังดูล้ำมาก แต่พออ่านตอนนี้จบแล้ว คุณจะรู้ว่าหัวใจมันก็คือ clustering กับ anomaly detection ที่เราคุยกันนี่แหละ ไม่ได้ลึกลับ และไม่ได้วิเศษเกินจริง — มันมีจุดเด่นจุดอ่อนของมันอยู่ ซึ่งเดี๋ยวผมจะเล่ากับดักให้ฟังต่อ

สรุปทีว่า “ตกลงงานของฉันควรใช้แบบมีเฉลยหรือไม่มีเฉลย”#

พอคุยมาถึงตรงนี้ บางคนอาจเริ่มงงนิดๆ ว่า “ตกลงงานของฉันมันควรใช้แบบไหน” ผมขอให้เส้นแบ่งง่ายๆ ที่จำไปใช้ได้เลยนะครับ —

ถ้าคุณ “รู้คำตอบที่ถูกอยู่แล้ว” และอยากให้เครื่องทายคำตอบนั้นกับของใหม่ → ใช้แบบมีเฉลย (Supervised)

เช่น คุณมีรูปสินค้าดี/สินค้าตำหนิที่คนคัดไว้แล้วเป็นพันรูป อยากให้เครื่องคัดตำหนิแทนคนต่อไป — แบบนี้คุณรู้เฉลย (ดี/ตำหนิ) อยู่แล้ว ก็เอาไปสอนมันได้เลย

ถ้าคุณ “ยังไม่รู้ด้วยซ้ำว่าคำตอบควรเป็นยังไง” และอยากให้เครื่องช่วยหาแพตเทิร์นที่ซ่อนอยู่ → ใช้แบบไม่มีเฉลย (Unsupervised)

เช่น คุณมีลูกค้าเป็นพัน แต่ไม่รู้ว่าควรแบ่งเป็นกี่ประเภท หรือคุณอยากให้เครื่องคอยสะกิดเวลามีอะไรผิดปกติโดยที่คุณยังไม่รู้ว่า “ผิดปกติ” หน้าตาเป็นยังไง — แบบนี้แหละงานของ Unsupervised

คำถามที่ถามตัวเอง	ถ้าตอบ “ใช่”	แปลว่า
ฉันมีตัวอย่างคู่กับเฉลยที่ถูกอยู่แล้วไหม	ใช่ → Supervised	สอนด้วยเฉลย แล้วให้มันทายของใหม่
ฉันแค่อยากเห็นว่าข้อมูลมีกี่กลุ่ม / ใครเข้าพวกใคร	ใช่ → Clustering	จัดกองให้ แล้วเราตีความเอง
ฉันอยากให้คอยจับของผิดปกติที่คาดเดาไม่ได้	ใช่ → Anomaly Detection	เรียนความปกติ แล้วสะกิดของแปลก

ของจริงในธุรกิจหลายทีมเขา ใช้ทั้งสองแบบผสมกัน ด้วยซ้ำครับ เช่นใช้ clustering แบ่งกลุ่มลูกค้าก่อน พอเห็นกลุ่มชัดแล้วค่อยเอาไปทำระบบแบบมีเฉลยต่อ ไม่ต้องเลือกอย่างใดอย่างหนึ่งตายตัว — เอาที่มันแก้โจทย์เราได้จริงเป็นพอ

กับดักที่อยากเตือนไว้ก่อน#

ก่อนปิดตอน ผมขอเตือนกับดักสองสามอันที่เจ้าของกิจการมักพลาด เวลาเริ่มเอาเรื่องพวกนี้ไปใช้ —

กับดักที่ 1 — คิดว่ามันให้ “คำตอบ” ทั้งที่มันให้แค่ “เบาะแส”

นี่คือกับดักที่ใหญ่ที่สุดครับ ขอย้ำอีกรอบเพราะสำคัญมาก — clustering ไม่ได้บอกว่า “นี่คือลูกค้า VIP ของคุณ” มันแค่บอกว่า “ลูกค้าพวกนี้คล้ายกัน” ส่วนคำว่า VIP เป็นสิ่งที่คุณตีความเองทีหลัง เช่นเดียวกับ anomaly detection ที่ไม่ได้บอกว่า “นี่คือการโกง” มันแค่บอกว่า “อันนี้แปลก” ฉะนั้นถ้าใครเอาผลที่มันชี้มาเชื่อทั้งดุ้นโดยไม่กลั่นกรอง มีโอกาสพลาดสูงครับ

กับดักที่ 2 — ข้อมูลขยะเข้า ผลขยะออก

เรื่องนี้จริงกับ AI ทุกแบบ แต่กับ unsupervised มันเจ็บเป็นพิเศษ เพราะไม่มีเฉลยมาคอยถ่วงดุล ถ้าข้อมูลลูกค้าของคุณมันมั่ว เช่นกรอกยอดผิด วันที่ผิด มีข้อมูลซ้ำเต็มไปหมด — กองที่เครื่องจัดออกมาก็จะมั่วตามไปด้วย แล้วคุณจะตีความผิดไปกันใหญ่ ฉะนั้นก่อนจะตื่นเต้นกับ AI ลองกลับไปดูก่อนว่าข้อมูลในมือเราสะอาดพอไหม

กับดักที่ 3 — เห็นกลุ่มแล้วรีบด่วนสรุป

บางทีเครื่องจัดกองมาให้ แล้วเราดันไปเห็นแพตเทิร์นที่มัน “ดูเหมือนจะมีความหมาย” ทั้งที่จริงๆ มันอาจเป็นเรื่องบังเอิญ — คนเราชอบมองเห็นรูปร่างในก้อนเมฆครับ 555+ ฉะนั้นพอเห็นกองที่น่าสนใจ อย่าเพิ่งทุ่มงบทั้งก้อนตามทันที ลองเอาไปทดสอบเล็กๆ ก่อนว่ามันจริงไหม

จับกลุ่ม กับ หาของแปลก — จริงๆ มันคือเหรียญสองด้านของเรื่องเดียวกัน#

ก่อนปิด ผมอยากชวนถอยมามองภาพรวมสักนิด เพราะพอเล่าแยกกันสองงาน บางคนอาจคิดว่ามันคนละเรื่องกัน — แต่จริงๆ แล้ว clustering กับ anomaly detection มันคือ เหรียญสองด้านของเรื่องเดียวกัน ครับ คือเรื่อง “ความคล้าย” ที่เราคุยกันตั้งแต่ต้นนั่นแหละ

จำภาพแผนที่ที่เราเอาลูกค้าไปวางเป็นจุดได้ไหมครับ —

มองหา จุดที่เกาะกลุ่มกันแน่นๆ → นั่นคือ clustering (จับกลุ่ม)
มองหา จุดที่อยู่โดดเดี่ยว ไกลจากทุกกอง → นั่นคือ anomaly detection (หาของแปลก)

เห็นไหมครับว่ามันมองแผนที่แผ่นเดียวกันเลย แค่สนใจคนละมุม อันนึงสนใจ “พวกที่อยู่ด้วยกัน” อีกอันสนใจ “ตัวที่ไม่มีพวก” ลองดูเทียบกันชัดๆ —

	Clustering (จับกลุ่ม)	Anomaly Detection (หาของแปลก)
มองหาอะไร	ความคล้าย — ใครเข้าพวกใคร	ความต่าง — ใครไม่เข้าพวกใคร
สนใจ	จุดที่เกาะกลุ่มกัน	จุดที่อยู่โดดเดี่ยว
เอาไปใช้	แบ่งกลุ่มลูกค้า, จัดหมวดสินค้า	จับโกง, จับเครื่องใกล้พัง, จับของหาย
คำถามที่ตอบ	”ในกองนี้มีกี่พวก ใครอยู่พวกไหน"	"มีอะไรผิดปกติให้ต้องดูไหม”
อุปมาบ้านๆ	แยกกองผ้าซัก	ชุดแดงในห้องที่ใส่ขาวกันหมด

พอเห็นภาพนี้แล้วผมว่าทั้งตอนมันร้อยเป็นเรื่องเดียวกันสวยงามเลยครับ — Unsupervised Learning ทั้งหมดก็คือการที่เครื่องดูข้อมูลกองโตๆ โดยไม่มีเฉลย แล้วใช้แค่ “ความคล้าย/ไม่คล้าย” เป็นไม้บรรทัด มาช่วยเราจัดระเบียบและสะกิดของน่าสงสัย เท่านั้นเอง

ลองนึกภาพว่าเราเอามาใช้จริงดูครับ#

เพื่อให้เห็นภาพว่ามันต่อยอดยังไง ผมขอสมมติสถานการณ์ขึ้นมาให้ดูสักอันนะครับ (ย้ำว่า สมมติ ล้วนๆ ไม่ใช่เคสจริงของใคร) —

ลองนึกภาพว่าเจ้าของร้านขายเสื้อผ้าออนไลน์คนหนึ่งทำมาสามปี มีลูกค้าในระบบหลายพันคน ที่ผ่านมาเวลายิงโฆษณาหรือส่งโปรโมชั่น เขาก็ ส่งเหมือนกันหมดทุกคน เพราะมองลูกค้าเป็นกองเดียว ผลคือบางทีก็ได้ผลบ้างไม่ได้ผลบ้าง งบโฆษณาหายไปเรื่อยๆ โดยไม่รู้ว่ารั่วตรงไหน

วันหนึ่งเขาลองเอาข้อมูลลูกค้าทั้งหมดไปให้ระบบ clustering จัดกองดู ปรากฏว่ามันแยกออกมาได้ประมาณ 3-4 กองที่ต่างกันชัดเจน เขาเปิดดูแล้วก็ค่อยๆ เข้าใจว่าแต่ละกองคือใคร — กองหนึ่งเป็นขาประจำที่ซื้อทุกเดือน อีกกองเป็นคนที่ซื้อทีเดียวเยอะตอนมีโปรฯ ใหญ่ อีกกองเป็นลูกค้าที่หายไปนานแล้ว

พอเห็นภาพชัดแบบนี้ การตัดสินใจก็เปลี่ยนไปเลยครับ — แทนที่จะส่งข้อความเดียวให้ทุกคนเหมือนเดิม เขาเริ่ม คุยกับแต่ละกองคนละแบบ: ขาประจำก็ดูแลด้วยสิทธิพิเศษ ไม่ต้องลดราคาให้เปลืองเพราะเขาซื้ออยู่แล้ว, สายโปรฯ ใหญ่ก็เก็บไว้ยิงตอนแคมเปญใหญ่, ส่วนลูกค้าที่หายไปก็ส่งคูปองดึงกลับมา จะได้ไม่เสียงบไปส่งโปรฯ ให้คนที่ยังไงก็ซื้ออยู่แล้ว

สังเกตนะครับว่าในเรื่องนี้ เครื่องไม่ได้คิดกลยุทธ์การตลาดให้เลย มันแค่จัดกองมาให้ ส่วนไอเดียทั้งหมดว่าจะคุยกับแต่ละกองยังไง มาจากสมองของเจ้าของร้านที่รู้จักธุรกิจตัวเองดี — clustering แค่ “เปิดตา” ให้เขาเห็นว่าลูกค้ามันมีหลายแบบ ที่เหลือเป็นฝีมือคนล้วนๆ นี่แหละครับคือวิธีที่ Unsupervised Learning มันช่วยธุรกิจจริงๆ ไม่ใช่ของวิเศษ แต่เป็นแว่นขยายที่ช่วยให้เรามองข้อมูลตัวเองได้คมขึ้น

แล้วถ้าไม่มีเฉลย เครื่องมันรู้ได้ไงว่าตัวเองทำถูก?#

ตรงนี้เป็นคำถามที่ดีมากครับ และเป็นจุดที่ผมอยากให้เข้าใจตรงกันก่อนจะปิดตอน —

ใน Supervised (เรียนแบบมีเฉลย) เราเช็คได้ง่ายว่าเครื่องเก่งไหม เพราะมีเฉลยให้เทียบ มันทายว่า “หมา” แล้วเฉลยบอกว่าหมา ก็ถูก จบ คะแนนชัดเจน

แต่ใน Unsupervised มัน ไม่มีเฉลยให้เทียบเลย ฉะนั้นคำว่า “ถูก/ผิด” มันเลยคลุมเครือกว่ามาก เครื่องมันแค่บอกว่า “ผมจัดกองมาแบบนี้นะ” หรือ “ผมว่าตัวนี้แปลกนะ” — แต่จะจัดดีไหม จะแปลกจริงไหม คนต้องเป็นคนตัดสินอยู่ดี เพราะมันไม่มีกระดาษคำตอบมายืนยัน

ผมเลยอยากย้ำสิ่งที่สำคัญที่สุดของตอนนี้ คือ Unsupervised Learning มันเก่งเรื่อง “ชี้เป้าให้เราดู” ครับ — มันชี้ว่า “เฮ้ย ในกองข้อมูลของคุณ มันมีกลุ่มซ่อนอยู่นะ / มีตัวประหลาดอยู่นะ” แต่มันไม่ได้บอกว่ากลุ่มนั้นแปลว่าอะไร หรือตัวประหลาดนั้นเป็นปัญหาหรือเปล่า ส่วนนั้นยังเป็นงานของสมองคนที่เอาไปคิดต่อ มันไม่ใช่ของวิเศษที่เสียบแล้วได้คำตอบสำเร็จรูป แต่เป็นเหมือน ผู้ช่วยที่ขยันจัดของและช่างสังเกต ช่วยให้เรามองเห็นสิ่งที่ตาเปล่ามองไม่เห็นในกองข้อมูลมหาศาล

สรุปสั้นๆ ส่งท้าย#

ถ้าให้ย่อทั้งตอนนี้เหลือไม่กี่บรรทัดเอาไว้จำง่ายๆ คือแบบนี้ครับ —

Unsupervised Learning = เรียนแบบไม่มีเฉลย ไม่มี label มาบอกว่าอะไรคืออะไร มีแต่ข้อมูลดิบให้เครื่องไปงมเอาเองว่ามีอะไรซ่อนอยู่
Clustering (จับกลุ่ม) = มองหา “ความคล้าย” แล้วจัดของเข้ากองให้เอง โดยไม่ต้องบอกล่วงหน้าว่ามีกี่กอง — เหมือนแยกกองผ้าซัก เอาไปจัดกลุ่มลูกค้าได้สวยมาก
Anomaly Detection (หาของแปลก) = มองหา “ความไม่คล้าย” จับตัวที่หลุดจากความปกติ — เหมือนชุดแดงในห้องที่ใส่ขาวกันหมด เอาไปจับธุรกรรมโกง เครื่องจักรใกล้พัง ของหายในคลัง ฯลฯ
หัวใจร่วมกัน: เครื่อง “ชี้เป้า” ให้ ส่วนการ “ตีความ” ว่ามันแปลว่าอะไร เอาไปทำอะไรต่อ — ยังเป็นงานของคนเสมอ
อย่าลืมกับดัก: มันให้แค่เบาะแสไม่ใช่คำตอบ, ข้อมูลขยะเข้าผลขยะออก, และอย่าด่วนสรุปจากแพตเทิร์นที่อาจบังเอิญ

และถ้าจะให้ผมสรุปด้วยประโยคเดียวจริงๆ คือ — Unsupervised Learning ไม่ใช่หมอดูที่ทายอนาคตให้ แต่เป็นแว่นขยายที่ช่วยให้เรามองข้อมูลที่เรามีอยู่แล้วได้ชัดขึ้น ของที่เคยซ่อนอยู่ในกองตัวเลขจนเรามองข้าม มันช่วยดึงขึ้นมาวางตรงหน้า ส่วนจะเอาไปทำอะไรต่อ ยังต้องอาศัยคนที่รู้จักธุรกิจตัวเองดีที่สุดเป็นคนตัดสินใจครับ

ผมไม่ใช่ผู้เชี่ยวชาญด้าน AI อะไรหรอกนะครับ เป็นแค่คนที่พยายามทำเรื่องพวกนี้ให้มันเข้าใจง่ายแบบภาษาคนๆ ตรงไหนผมเล่าคลาดเคลื่อนไป ทักท้วงกันเข้ามาได้เลย ยินดีมากๆ ครับ

ตอนที่แล้วเราคุยเรื่องเรียนแบบมีเฉลย ตอนนี้เรียนแบบไม่มีเฉลย — ตอนหน้าผมว่าจะเล่าการเรียนอีกแบบที่แปลกกว่าทั้งคู่ คือแบบ “ลองผิดลองถูกเอาเอง” ที่เครื่องไม่มีทั้งเฉลยและไม่มีข้อมูลตั้งต้น แต่ค่อยๆ เก่งขึ้นจากการได้รางวัลกับโดนหักคะแนน เหมือนฝึกหมาให้นั่งด้วยขนมนั่นแหละครับ ไว้เจอกันตอนหน้า