สารบัญ
AI 101 — ปัญญาประดิษฐ์ฉบับภาษาคน · Part 1 (เบื้องหลัง: AI ทำงานยังไง) ซีรีส์นี้ผมเขียนให้เจ้าของกิจการกับคนทำงานทั่วไปที่ไม่ใช่สาย IT อ่านสนุกๆ แต่ได้ของกลับไปใช้จริง ไม่มีศัพท์ยากๆ ขู่ให้กลัว ตอนนี้เป็นเรื่อง “Unsupervised Learning — เรียนแบบไม่มีเฉลย” — วิธีที่ AI จัดกลุ่มลูกค้าให้เราเอง และจับของแปลกๆ ได้ทั้งที่ไม่มีใครบอกมันว่าอะไรคือแปลก (สารบัญเต็มของซีรีส์จะตามมาทีหลังนะครับ)
ลองนึกภาพฉากนี้ดูก่อนครับ
สมมติว่าเจ้าของร้านคนหนึ่งเดินมาวางกองนามบัตรลูกค้าเก่าสองพันใบไว้บนโต๊ะคุณ แล้วบอกสั้นๆ ว่า “ช่วยจัดกองพวกนี้ให้หน่อย”
คุณถามกลับว่า “จัดยังไงครับ จัดตามอะไร — ตามจังหวัด? ตามอายุ? ตามยอดซื้อ?”
เขาส่ายหน้า แล้วบอกว่า “ไม่รู้สิ ผมก็ไม่รู้ว่าควรแบ่งเป็นกี่กอง แบ่งตามอะไรดี เอาเป็นว่า… คุณลองดูเองว่าใครคล้ายใคร แล้วจัดให้มันเข้าพวกกันก็พอ”
ฟังดูกวนนิดๆ ใช่ไหมครับ 555+ แต่จริงๆ แล้วนี่แหละคือโจทย์ที่เจ้าของกิจการเจอกันทุกวัน — เรามีข้อมูลกองโต แต่เราไม่รู้ด้วยซ้ำว่าควรมองมันยังไง ไม่มีใครมานั่งบอกเราว่า “ลูกค้าคนนี้คือประเภท A คนนั้นคือประเภท B” เราก็ได้แต่เดาๆ เอาเอง
ตอนที่แล้วของซีรีส์นี้ เราคุยกันเรื่อง Supervised Learning (ซูเปอร์ไวซด์ เลิร์นนิ่ง — “เรียนแบบมีเฉลย”) ซึ่งเหมือนติวเด็กด้วยข้อสอบที่มีเฉลยกำกับมาทุกข้อ เด็กเห็นโจทย์คู่กับเฉลยเยอะๆ พอเจอโจทย์ใหม่ก็เดาคำตอบได้ แต่ตอนนี้ผมอยากชวนคุยอีกแบบหนึ่ง — แบบที่ ไม่มีเฉลยมาให้เลย มีแต่ข้อมูลดิบกองโตๆ แล้วปล่อยให้เครื่องไปงมเอาเองว่ามีอะไรซ่อนอยู่ในกองนั้น
ภาษาวงการเรียกการเรียนแบบนี้ว่า Unsupervised Learning (อันซูเปอร์ไวซด์ เลิร์นนิ่ง — แปลแบบบ้านๆ คือ “การเรียนแบบไม่มีคนคุม / ไม่มีเฉลย”) ฟังชื่อแล้วเหมือนยาก แต่ผมว่าพออ่านจบตอนนี้ คุณจะร้องอ๋อเลยครับ เพราะมันคือสิ่งที่อยู่เบื้องหลังหลายอย่างที่เราใช้กันทุกวันโดยไม่รู้ตัว
มี “เฉลย” กับ “ไม่มีเฉลย” ต่างกันตรงไหน
ก่อนจะไปต่อ ผมขอปูพื้นคำว่า label (เลเบล — แปลว่า “ป้ายเฉลย” หรือ “ป้ายกำกับ”) ให้ชัดก่อนนะครับ เพราะมันคือหัวใจของเรื่องทั้งหมดวันนี้
ลองนึกถึงกองรูปภาพ สมมติว่าคุณมีรูปสัตว์อยู่พันรูป —
- ถ้ามี label ก็คือทุกรูปมีป้ายแปะไว้แล้วว่า “อันนี้หมา” “อันนี้แมว” “อันนี้นก” เครื่องแค่ดูรูปคู่กับป้าย แล้วจำว่าหน้าตาแบบไหนเรียกว่าอะไร — นี่คือ Supervised แบบที่เราคุยกันตอนที่แล้ว
- ถ้าไม่มี label ก็คือมีแต่รูปเปล่าๆ พันรูป ไม่มีใครบอกว่าอันไหนคืออะไรเลย — งานของเครื่องเปลี่ยนไปทันที มันบอกไม่ได้หรอกว่า “นี่คือหมา” เพราะไม่มีใครเคยสอนคำว่าหมาให้มัน แต่สิ่งที่มันทำได้คือ มองออกว่ารูปกลุ่มนี้หน้าตาคล้ายกัน รูปอีกกลุ่มหน้าตาคล้ายกันอีกแบบ แล้วแยกกองให้
เห็นความต่างไหมครับ Supervised มีครูคอยเฉลยข้างๆ ตลอด ส่วน Unsupervised เหมือนโยนเด็กเข้าไปในห้องที่เต็มไปด้วยของ แล้วบอกว่า “ลองจัดของพวกนี้ให้เป็นหมวดหมู่หน่อย” โดยไม่บอกว่าควรมีกี่หมวด หรือหมวดอะไรบ้าง เด็กต้องใช้สายตาตัวเองสังเกตว่า “อันนี้กับอันนี้น่าจะพวกเดียวกันนะ”
| มีเฉลย (Supervised) | ไม่มีเฉลย (Unsupervised) | |
|---|---|---|
| ข้อมูลที่ป้อน | โจทย์ + เฉลย (มี label) | โจทย์ล้วนๆ (ไม่มี label) |
| งานที่เครื่องทำ | จำว่าโจทย์แบบนี้ตอบแบบไหน | หาว่าอะไรคล้ายอะไร / อะไรแปลกแยก |
| เหมือนอะไร | ติวด้วยข้อสอบมีเฉลย | จัดของในห้องรกๆ ให้เป็นหมวด |
| คำถามที่ตอบได้ | ”อันนี้คืออะไร” (ทายป้าย) | “ในกองนี้มีกี่พวก / อะไรผิดปกติ” |
ทีนี้พอไม่มีเฉลย เครื่องมันเอาไปทำอะไรได้บ้าง? หลักๆ มีสองงานที่เจ้าของกิจการน่าจะได้ใช้บ่อยที่สุด คือ จับกลุ่ม กับ หาของแปลก ครับ แต่เดี๋ยวก่อน ก่อนจะไปดูสองงานนั้น ผมอยากตอบคำถามที่หลายคนน่าจะค้างคาใจอยู่ก่อน —
“ก็แค่แปะป้ายเฉลยให้มันสิ จะยากตรงไหน?”
พอผมเล่าว่าแบบมีเฉลยมันเช็คง่ายกว่า เรียนง่ายกว่า หลายคนน่าจะคิดในใจว่า “อ้าว งั้นก็แปะป้ายเฉลยให้มันทุกอันไปเลยสิ จะมานั่งเรียนแบบไม่มีเฉลยให้ลำบากทำไม”
คำถามดีมากครับ และคำตอบคือ — การแปะป้ายเฉลยมันแพงและเหนื่อยกว่าที่คิดเยอะ
ลองนึกภาพง่ายๆ ครับ สมมติคุณมีรูปลูกค้าถ่ายสินค้าส่งเข้ามาในเพจวันละพันรูป ถ้าจะทำข้อมูลแบบมีเฉลย แปลว่าต้องมีคน นั่งดูทีละรูป แล้วพิมพ์กำกับ ว่ารูปนี้คือสินค้าอะไร สีอะไร ตำหนิตรงไหน — พันรูปต่อวัน ใช้คนเท่าไหร่ เหนื่อยแค่ไหน เสียเงินเท่าไหร่ ลองคิดดู และนั่นยังเป็นงานที่ “พอจะรู้คำตอบ” นะครับ
แต่ของจริงในธุรกิจ หลายครั้งเรา ไม่รู้ด้วยซ้ำว่าเฉลยที่ถูกคืออะไร เหมือนเจ้าของร้านในฉากเปิดเรื่องที่บอกว่า “ผมก็ไม่รู้ว่าควรแบ่งลูกค้าเป็นกี่กอง แบ่งตามอะไรดี” — ในเมื่อตัวเรายังไม่รู้คำตอบ เราจะไปแปะป้ายเฉลยให้เครื่องได้ยังไงล่ะครับ? นี่แหละคือเหตุผลที่ Unsupervised Learning มันมีค่า — มันทำงานได้ในสถานการณ์ที่ เราเองก็ยังงงๆ อยู่ ว่ามองข้อมูลกองนี้ยังไงดี
พูดง่ายๆ คือ —
- มีเฉลยอยู่แล้ว และคุ้มที่จะแปะ → ใช้ Supervised (ตอนที่แล้ว)
- ไม่มีเฉลย / แปะไม่ไหว / ยังไม่รู้ด้วยซ้ำว่าเฉลยคืออะไร → นี่แหละงานของ Unsupervised
โอเค ทีนี้พร้อมแล้ว ไปดูสองงานหลักทีละอันเลยครับ
เดี๋ยวนะ เครื่องมัน “รู้ได้ไง” ว่าอะไรคล้ายอะไร
ก่อนเข้าสองงานหลัก ผมขอเคลียร์อีกนิดนึง เพราะทั้ง clustering และ anomaly detection มันยืนอยู่บนคำเดียวกันคือ “ความคล้าย” — แล้วเครื่องที่ไม่มีสายตาแบบคน มันวัด “ความคล้าย” ได้ยังไง?
อุปมาบ้านๆ ที่ผมชอบคือ แผนที่กับระยะห่าง ครับ ลองนึกภาพว่าเราเอาลูกค้าแต่ละคนไปวางเป็นจุดบนแผนที่ใหญ่ๆ แผ่นหนึ่ง โดยตำแหน่งของแต่ละจุดมาจากพฤติกรรมของเขา เช่นแกนนอนคือ “ซื้อบ่อยแค่ไหน” แกนตั้งคือ “ซื้อทีละเท่าไหร่” — ลูกค้าที่พฤติกรรมคล้ายกันก็จะไปอยู่ใกล้ๆ กันบนแผนที่ ส่วนคนที่พฤติกรรมต่างกันมากก็จะอยู่ห่างกันออกไป
พอคิดเป็นแบบนี้แล้ว คำว่า “คล้าย” มันก็กลายเป็นเรื่องง่ายสำหรับเครื่องทันทีครับ — คล้าย = อยู่ใกล้กัน, ไม่คล้าย = อยู่ไกลกัน เครื่องเก่งเรื่องวัดระยะอยู่แล้ว มันเลยทำงานต่อได้สบาย จุดที่เกาะกลุ่มกันแน่นๆ บนแผนที่ = หนึ่งกอง (นั่นคืองาน clustering) ส่วนจุดที่อยู่โดดเดี่ยวไกลจากทุกกอง = ตัวประหลาด (นั่นคืองาน anomaly detection)
ไม่ต้องจำรายละเอียดอะไรลึกกว่านี้นะครับ เอาแค่ภาพ “เปลี่ยนทุกอย่างเป็นจุดบนแผนที่ แล้ววัดว่าใครอยู่ใกล้ใครไกล” ก็พอเข้าใจทั้งตอนแล้ว ไปดูสองงานจริงกันเลย
งานที่หนึ่ง: จับกลุ่ม (Clustering) — “แยกกองให้เองโดยไม่ต้องบอกว่ามีกี่กอง”
งานแรกเรียกว่า Clustering (คลัสเตอริง — แปลว่า “การจับกลุ่ม / การแบ่งกอง”) ครับ
อุปมาที่ผมชอบที่สุดสำหรับเรื่องนี้คือ ตะกร้าผ้าซักรวมกองโต ลองนึกภาพว่าคุณเทผ้าที่ซักเสร็จทั้งบ้านลงกองเดียวบนเตียง เสื้อ กางเกง ถุงเท้า ผ้าเช็ดตัว ปนกันมั่วไปหมด แล้วคุณก็เริ่มหยิบมาจัด — โดยที่ไม่มีใครบอกคุณว่า “ต้องแบ่งเป็น 4 กองนะ” คุณแค่หยิบขึ้นมาแล้วรู้สึกเองว่า “อันนี้เป็นเสื้อ ไปกองนี้ อันนี้เป็นถุงเท้า ไปกองนั้น” สุดท้ายกองมันก็ค่อยๆ เกิดขึ้นเอง ตามความ “คล้ายกัน” ของแต่ละชิ้น
Clustering ก็คือแบบนี้เป๊ะเลยครับ เครื่องดูข้อมูลทีละชิ้น แล้วจับชิ้นที่ “หน้าตาใกล้เคียงกัน” ไปอยู่กองเดียวกัน ชิ้นที่ต่างกันมากก็แยกไปอีกกอง โดยที่ เราไม่ต้องตั้งชื่อกองล่วงหน้าให้มันเลย มันงมหากองเองจากความคล้าย แล้วเราค่อยมาดูว่ากองที่ได้มันคือใคร
จุดสำคัญที่อยากให้จับไว้คือคำว่า “คล้าย” นี่แหละครับ — มันไม่ได้คล้ายเรื่องเดียว แต่คล้ายกันได้หลายมุมพร้อมกัน เหมือนเวลาคุณจัดผ้า คุณไม่ได้ดูแค่ “สี” อย่างเดียว แต่ดูทั้งขนาด ทั้งเนื้อผ้า ทั้งว่าเป็นของใคร ปนๆ กันไปในหัวโดยอัตโนมัติ เครื่องก็มองหลายมุมพร้อมกันแบบนั้นเหมือนกัน เช่นจับลูกค้าโดยดูทั้งความถี่ในการซื้อ ยอดต่อครั้ง และความสดใหม่ของการซื้อล่าสุด ไปพร้อมๆ กัน แล้วถึงค่อยตัดสินว่าใครเข้าพวกใคร
ลองนึกภาพในร้านจริงๆ ดูครับ
สมมติว่าเจ้าของร้านค้าออนไลน์คนหนึ่งมีข้อมูลลูกค้าอยู่ในมือ — ใครซื้อบ่อยแค่ไหน ซื้อทีละเท่าไหร่ ซื้อครั้งสุดท้ายเมื่อไหร่ ปกติเจ้าของก็มองลูกค้าเป็นกองเดียวว่า “ลูกค้าร้านเรา” ใช่ไหมครับ แต่พอเอาข้อมูลพวกนี้โยนให้ระบบ clustering มันอาจจะค่อยๆ แยกออกมาเป็นกองๆ ที่เรามองไม่เห็นด้วยตาเปล่า เช่น (ขอย้ำว่ากองพวกนี้เป็นแค่ ตัวอย่างสมมติ ที่ผมแต่งขึ้นให้เห็นภาพนะครับ ไม่ใช่ผลจริงของร้านใคร) —
| กองที่เครื่องจับได้ (สมมติ) | หน้าตาของกองนี้ | เจ้าของเอาไปทำอะไรต่อได้ |
|---|---|---|
| ขาประจำตัวจริง | ซื้อบ่อย ซื้อสม่ำเสมอ ยอดต่อครั้งไม่สูงมาก | ทำบัตรสมาชิก ดูแลให้ดี อย่าให้หนีไปไหน |
| สายซื้อทีเดียวจัดหนัก | นานๆ ซื้อที แต่ซื้อทีเป็นก้อนใหญ่ | ส่งโปรช่วงเทศกาล/ตุนของ จับจังหวะให้ถูก |
| ลูกค้าใกล้หาย | เคยซื้อบ่อย แต่หายไปนานแล้ว | ส่งคูปองดึงกลับมาก่อนจะลืมร้านเราถาวร |
| มือใหม่เพิ่งลอง | เพิ่งซื้อครั้งแรก ยังไม่กลับมา | ส่งข้อความต้อนรับ ชวนซื้อครั้งที่สอง |
จุดที่เจ๋งคือ ไม่มีใครบอกเครื่องไว้ก่อนว่าให้แบ่งเป็น 4 กองนี้ เราไม่ได้ตั้งชื่อกองให้มันด้วยซ้ำ — ชื่อกองพวกนี้เป็นสิ่งที่เจ้าของมานั่งตั้งทีหลังเองเพราะเห็นแล้วว่า “อ๋อ กองนี้มันคือพวกขาประจำนี่นา” เครื่องแค่บอกว่า “ลูกค้าพวกนี้พฤติกรรมคล้ายกัน ผมจัดให้อยู่ด้วยกันแล้วนะ” ส่วนจะแปลว่าอะไร เอาไปทำอะไรต่อ เป็นหน้าที่ของคนครับ
นี่คือเสน่ห์ของ clustering — มันช่วย เปิดตา ให้เราเห็นโครงสร้างที่ซ่อนอยู่ในข้อมูลของตัวเอง ทั้งที่เราจ้องมันมาทั้งชีวิตแต่มองไม่ออก เหมือนมีคนช่วยจัดบ้านรกๆ ให้เป็นระเบียบ แล้วเราถึงเพิ่งเห็นว่า “เฮ้ย ของกลุ่มนี้มันเยอะกว่าที่คิดนี่หว่า”
แล้วมันรู้ได้ไงว่าควรมีกี่กอง?
ตรงนี้เป็นจุดที่คนชอบเข้าใจผิด เลยอยากเคลียร์หน่อยครับ — clustering มัน ไม่ได้ผุดเลขกองออกมาจากอากาศ เป๊ะๆ แบบที่หลายคนคิด
ความจริงคือ ระบบ clustering หลายแบบ เราต้องเป็นคนบอกมันก่อน ว่าอยากได้กี่กอง เช่นเราบอกว่า “ลองแบ่งเป็น 3 กองดู” มันก็จัดมาให้ 3 กอง พอเราบอกว่า “ลองแบ่งเป็น 5 กองดู” มันก็จัดมาให้ 5 กอง — แล้วเราค่อยมานั่งดูว่าจำนวนไหนมันสมเหตุสมผล ใช้ประโยชน์ได้จริงกับร้านเรา
เปรียบเหมือนจัดกองผ้าซักอีกทีครับ ถ้าคุณตั้งใจจะแบ่งแค่ 2 กอง (ผ้าของผู้ใหญ่ / ผ้าของเด็ก) มันก็ได้ ถ้าจะแบ่งละเอียดเป็น 6 กอง (เสื้อ-กางเกง-ถุงเท้า-ผ้าเช็ดตัว-ผ้าปูที่นอน-อื่นๆ) ก็ได้อีก ไม่มีคำตอบเดียวที่ถูกร้อยเปอร์เซ็นต์ มันขึ้นกับว่า คุณจะเอากองพวกนั้นไปทำอะไรต่อ ถ้าแบ่งละเอียดเกินไปจนแต่ละกองมีของอยู่ชิ้นสองชิ้น มันก็ไม่มีประโยชน์ ถ้าแบ่งหยาบไปจนทุกอย่างกองรวมกันก็ไม่ช่วยอะไรเหมือนกัน
ฉะนั้นเวลาทำ clustering จริงๆ มันเลยเป็นการ ลองหลายๆ จำนวนกอง แล้วเลือกอันที่ดูเข้าท่าที่สุด ไม่ใช่กดปุ่มทีเดียวได้คำตอบเป๊ะ และคนที่ตัดสินว่า “อันนี้แหละเข้าท่า” ก็คือเจ้าของธุรกิจที่รู้จักลูกค้าตัวเอง ไม่ใช่ตัวเครื่องครับ
นี่คือเสน่ห์ของ clustering — มันช่วยเปิดตาให้เรา แต่มันไม่ได้มาแทนสมองเรา
💡 มุมเจ้าของกิจการ: clustering ไม่ได้ให้ “คำตอบสำเร็จรูป” นะครับ มันให้ “กองที่จัดไว้ให้แล้ว” ต่างหาก — แล้วคนต้องเป็นคนตีความว่าแต่ละกองคือใคร มีค่าแค่ไหน ควรดูแลยังไง ฉะนั้นเวลามี vendor มาเสนอระบบ “แบ่งกลุ่มลูกค้าอัตโนมัติด้วย AI” ก็อย่าคาดหวังว่าเสียบปุ๊บได้กลยุทธ์การตลาดออกมาเลย มันแค่จัดกองให้ ส่วนสมองที่เอาไปใช้ยังต้องเป็นของคุณอยู่ดี
งานที่สอง: หาของแปลก (Anomaly Detection) — “ตัวที่ไม่เข้าพวก สะดุดตาขึ้นมาเอง”
งานที่สองเป็นงานที่ผมว่าน่าตื่นเต้นกว่าด้วยซ้ำ เรียกว่า Anomaly Detection (อะนอมาลี ดีเทกชั่น — แปลแบบบ้านๆ คือ “การจับของผิดปกติ / ตรวจจับสิ่งแปลกแยก”) ครับ
ถ้า clustering คือการมองหา “ความคล้าย” แล้วจับเข้ากอง anomaly detection ก็คือการมองหา “ความไม่คล้าย” — คือตัวไหนที่มันโดดออกมาจากพวก ไม่เข้ากับใครเลย ตัวนั้นแหละที่น่าสงสัย
อุปมาที่เห็นภาพง่ายที่สุดคือ เกมจับผิดในห้องเรียน ลองนึกภาพห้องเรียนที่เด็กทุกคนใส่ชุดนักเรียนสีขาวเหมือนกันหมด แล้วจู่ๆ มีคนนึงเดินเข้ามาใส่ชุดสีแดงแปร๊ดกลางห้อง — คุณไม่ต้องมีใครมาสอนเลยว่า “สีแดงคือผิด” คุณแค่เห็นปุ๊บก็รู้สึกเองทันทีว่า “เอ๊ะ คนนี้ไม่เข้าพวก” เพราะทุกคนรอบตัวมันเหมือนกันหมด พอมีตัวที่ต่างออกไปมันเลยสะดุดตา
Anomaly detection ทำงานแบบนี้เป๊ะเลยครับ มันไม่ได้ถูกสอนว่า “อะไรคือของแปลก” (เพราะถ้าสอนได้แสดงว่าเรารู้หน้าตาของแปลกอยู่แล้ว ก็ไม่ต้องใช้มันแล้วสิ) — มันแค่ดูข้อมูลส่วนใหญ่จนรู้ว่า “หน้าตาปกติเป็นแบบนี้นะ” พอมีตัวไหนหลุดออกจากความปกตินั้นมากๆ มันก็ยกมือบอกว่า “อันนี้แปลกนะ ลองมาดูหน่อย”
เคสที่ทุกคนน่าจะเคยเจอ — ธุรกรรมบัตรที่โดนระงับ
ตัวอย่างที่ใกล้ตัวที่สุดคือเรื่องบัตรเครดิต/บัตรเดบิตครับ สมมติว่าปกติเจ้าของบัตรคนหนึ่งใช้จ่ายแบบเดิมๆ ทุกเดือน — รูดซื้อกาแฟแถวออฟฟิศ จ่ายค่าน้ำค่าไฟ ซื้อของในห้างใกล้บ้าน ยอดต่อครั้งหลักร้อยหลักพัน อยู่ในเมืองเดียวตลอด นี่คือ “หน้าตาปกติ” ของคนคนนี้
แล้วจู่ๆ คืนหนึ่งตอนตีสาม มีรายการรูดบัตรใบนี้ก้อนใหญ่มากจากร้านในต่างประเทศที่เจ้าตัวไม่เคยไป — ระบบมันจะสะดุดทันทีครับ ไม่ใช่เพราะมีใครเขียนกฎไว้ว่า “ตีสาม + ต่างประเทศ + ยอดสูง = โกง” (เพราะเขียนกฎดักทุกแบบไม่ไหวหรอก โจรมันพลิกแพลงตลอด) แต่เพราะรายการนี้มัน ไม่เข้าพวก กับพฤติกรรมปกติของคนคนนี้อย่างชัดเจน เหมือนชุดแดงในห้องที่ใส่ขาวกันหมดนั่นแหละ ระบบเลยขอเบรกไว้ก่อน โทรมาถามเจ้าของว่า “ใช่คุณรูดเองไหม” — นี่แหละครับคือ anomaly detection ทำงานอยู่เบื้องหลัง
จุดที่ผมอยากให้สังเกตคือ มันไม่ได้ทำงานแบบ “มีบัญชีดำรายชื่อโจร” แล้วไล่จับตามรายชื่อ แต่มันทำงานแบบ “รู้จักความปกติของแต่ละคน แล้วจับตัวที่หลุดจากความปกตินั้น” ซึ่งยืดหยุ่นกว่ามาก เพราะของแปลกหน้าใหม่ๆ ที่ไม่เคยเห็นมาก่อน มันก็ยังจับได้ ขอแค่มัน “ต่างจากปกติ” พอ
ตรงนี้แหละครับคือข้อได้เปรียบที่ใหญ่ที่สุดของ anomaly detection เมื่อเทียบกับการ “เขียนกฎดักเอง” แบบเดิมๆ — ลองนึกภาพว่าถ้าเราจะกันโจรด้วยการเขียนกฎเอง เราต้องนั่งคิดทุกท่าที่โจรอาจจะใช้ แล้วเขียนดักไว้ทีละข้อ “ถ้ารูดเกินแสน → เตือน” “ถ้ารูดต่างประเทศ → เตือน” “ถ้ารูดตอนดึก → เตือน” … เขียนเท่าไหร่ก็ไม่มีวันครบ เพราะพอเราอุดช่องนี้ โจรก็ไปหาช่องใหม่ที่เราคิดไม่ถึง เหมือนเล่นตีตัวตุ่นไม่จบไม่สิ้น แต่ anomaly detection มันพลิกมุมคิดเลยครับ — แทนที่จะไล่จำว่า “อะไรคือผิด” (ซึ่งมีล้านแบบ) มันจำแค่ว่า “อะไรคือปกติ” (ซึ่งมีไม่กี่แบบ) แล้วอะไรที่ไม่ใช่ปกติก็คือน่าสงสัยหมด วิธีนี้เลยดักของแปลกหน้าใหม่ที่ไม่เคยเจอได้ด้วย
แล้วมัน “รู้จักความปกติ” ได้ยังไง?
หลายคนอาจสงสัยว่ามันไปเอา “ความปกติ” มาจากไหน คำตอบง่ายมากครับ — จากการดูเยอะๆ เครื่องเฝ้าดูพฤติกรรมที่เกิดขึ้นซ้ำๆ เป็นพันเป็นหมื่นครั้ง จนมันเห็นภาพว่า “ส่วนใหญ่แล้วมันหน้าตาประมาณนี้นะ” เหมือนยามหน้าหมู่บ้านที่ยืนเฝ้าหน้าประตูมาหลายปี จนจำได้ว่ารถคันไหนคนในหมู่บ้าน เวลาไหนใครเข้าออกเป็นปกติ พอมีรถแปลกหน้าเข้ามาตอนตีสอง ยามไม่ต้องมีใครสอนหรอกครับว่าให้สงสัย เพราะมันต่างจากภาพที่เห็นจนชินไปเอง
นั่นแปลว่า anomaly detection จะแม่นหรือไม่แม่น ขึ้นอยู่กับว่า “ความปกติ” ที่มันเรียนมามันตรงกับความจริงแค่ไหนด้วย ถ้าธุรกิจคุณเพิ่งเริ่ม ข้อมูลยังน้อย เครื่องก็ยังไม่ค่อยรู้จักความปกติดีนัก อาจจะตื่นตูมบ่อยหน่อยในช่วงแรก แต่พอเวลาผ่านไป เห็นข้อมูลมากขึ้น มันก็จะค่อยๆ จับทางได้แม่นขึ้นเรื่อยๆ ครับ
เอาไปใช้ในธุรกิจทั่วๆ ไปได้อีกเยอะ
ของแปลกไม่ได้มีแค่เรื่องโกงนะครับ เจ้าของกิจการเอาแนวคิดนี้ไปจับอะไรได้อีกหลายอย่าง (ตัวอย่างสมมติทั้งหมดนะครับ) —
| จับของแปลกเรื่องอะไร (สมมติ) | “ปกติ” หน้าตาเป็นยังไง | ”แปลก” ที่ระบบจะสะดุด |
|---|---|---|
| ยอดขายรายวันของสาขา | ขึ้นๆ ลงๆ อยู่ในกรอบที่คุ้นเคย | วันนึงตกฮวบผิดปกติ → ของขาด? เครื่องเสีย? |
| การใช้ไฟของเครื่องจักรในโรงงาน | กินไฟสม่ำเสมอตอนทำงาน | จู่ๆ กินไฟพุ่งผิดปกติ → เครื่องใกล้พัง? |
| พฤติกรรมล็อกอินของพนักงาน | เข้าระบบช่วงเวลางาน จากที่เดิม | ล็อกอินตีสองจากที่แปลกๆ → บัญชีโดนแฮ็ก? |
| สต็อกสินค้าในคลัง | ลดลงตามยอดขายปกติ | หายไปเร็วกว่ายอดขาย → ของหาย/บันทึกพลาด? |
เห็นไหมครับว่าหัวใจมันเหมือนกันหมด — เรียนรู้ว่าอะไรคือปกติก่อน แล้วคอยสะกิดเราเวลามีอะไรหลุดออกจากปกตินั้น มันเหมือนมียามเฝ้าที่ไม่เคยหลับ คอยจ้องว่ามีอะไรผิดสังเกตไหม โดยที่เราไม่ต้องนั่งไล่ดูตัวเลขเป็นพันๆ แถวเองทุกวัน
แล้วทำไมต้องให้เครื่องทำ ในเมื่อคนก็ดูเองได้?
คำถามนี้ดีครับ และคำตอบคือเรื่อง “ปริมาณ” กับ “ความสม่ำเสมอ” ล้วนๆ
ถ้าร้านคุณมีออเดอร์วันละสิบรายการ คุณนั่งไล่ดูเองได้สบาย ของแปลกหลุดมาก็เห็นทันที ตรงนี้ไม่ต้องพึ่งเครื่องเลยครับ แต่พอธุรกิจโตขึ้น มีรายการวันละพันวันละหมื่น หรือมีเครื่องจักรหลายสิบเครื่องส่งค่ามาตลอดเวลา ตามนุษย์ก็จ้องไม่ไหวแล้ว แล้วของแปลกที่หลุดมาตอนตีสามวันหยุด ใครจะนั่งเฝ้าล่ะ?
อีกอย่างคือคนเรา เหนื่อยเป็น เผลอเป็น อคติเป็น ดูตัวเลขเป็นพันแถวไปสักพักตาก็ลาย เริ่มมองข้ามของที่ควรเห็น แต่เครื่องมันดูทุกแถวด้วยมาตรฐานเดียวกันเป๊ะ ไม่มีเบื่อ ไม่มีหลับ ตรงนี้แหละที่มันมาเสริมคนได้สวยมาก — ไม่ใช่มาแทนคน แต่มาทำงานน่าเบื่อที่คนทำได้ไม่ทน แล้วยกเคสที่น่าสงสัยส่งให้คนตัดสินใจขั้นสุดท้าย
💡 มุมเจ้าของกิจการ: ของดีของ anomaly detection คือมันจับ “เรื่องที่เราไม่เคยคิดว่าจะต้องระวัง” ได้ด้วย เพราะมันไม่ได้ไล่ตามรายการกฎที่เราเขียน แต่… ข้อควรระวังคือมันชอบ ตื่นตูม ครับ ของแปลกบางอย่างมันก็แปลกจริงแต่ไม่ได้เป็นปัญหา (เช่นวันที่ยอดพุ่งเพราะมีโปรฯ พอดี) ระบบก็อาจเด้งเตือนมาเหมือนกัน ฉะนั้นอย่าเชื่อมันร้อยเปอร์เซ็นต์ ให้มองมันเป็น “ตัวช่วยกรองว่าจุดไหนควรเอาตามนุษย์ไปดู” จะเวิร์กกว่า
ที่จริงคุณเจอสองตัวนี้อยู่ทุกวันแล้วนะครับ
อ่านมาถึงตรงนี้บางคนอาจรู้สึกว่า “ฟังดูเป็นเรื่องของบริษัทใหญ่ๆ จัง” — เปล่าเลยครับ จริงๆ แล้ว clustering กับ anomaly detection มันแอบทำงานอยู่รอบตัวเราทุกวัน เราแค่ไม่เคยรู้ว่ามันชื่อนี้ ลองดูตัวอย่างที่น่าจะคุ้นๆ —
- แอปฟังเพลง/ดูหนัง ที่จัด “เพลย์ลิสต์สำหรับคุณ” — เบื้องหลังคือมันจับกลุ่มคนที่รสนิยมคล้ายๆ กันไว้ด้วยกัน (clustering) แล้วเดาว่าคนในกองเดียวกับคุณน่าจะชอบอะไร
- อีเมลที่เด้งเข้าโฟลเดอร์ “สแปม” หรือ “โปรโมชั่น” เอง — ส่วนหนึ่งมาจากการมองว่าอีเมลนี้หน้าตา “เข้าพวก” กับกองไหน
- ข้อความเตือนจากแอปธนาคารว่า “พบการใช้จ่ายผิดปกติ” — นี่คือ anomaly detection ตรงๆ เลยครับ มันจับได้ว่ารายการนี้หลุดจากพฤติกรรมปกติของคุณ
- เว็บช้อปปิ้งที่ขึ้นว่า “ลูกค้าที่ซื้อสินค้านี้ มักซื้อสิ่งนี้ด้วย” — เบื้องหลังก็มีการจับกลุ่มพฤติกรรมการซื้อที่คล้ายๆ กัน
เห็นไหมครับว่ามันไม่ใช่เรื่องไกลตัวเลย ที่ผมเล่ามาทั้งหมดนี้ก็เพื่อให้คราวหน้าเวลาคุณเห็นฟีเจอร์พวกนี้ คุณจะร้องอ๋อว่า “อ๋อ ข้างในมันก็คือเรื่องที่อ่านมานั่นเอง” และพอเข้าใจหลักการแล้ว เวลาจะเอามาใช้กับธุรกิจตัวเองก็จะไม่กลัวมันอีกต่อไป
และที่ผมว่าสำคัญที่สุดคือ — พอคุณเข้าใจว่าเบื้องหลังมันคือแค่ “จับความคล้าย” กับ “จับของแปลก” ไม่ใช่เวทมนตร์อะไร คุณก็จะมีภูมิคุ้มกันเวลามี vendor มาขายของด้วยคำหรูๆ ครับ เขาอาจจะใช้คำว่า “AI แบ่งกลุ่มลูกค้าอัจฉริยะ” หรือ “ระบบ AI ตรวจจับการทุจริตอัตโนมัติ” ฟังดูล้ำมาก แต่พออ่านตอนนี้จบแล้ว คุณจะรู้ว่าหัวใจมันก็คือ clustering กับ anomaly detection ที่เราคุยกันนี่แหละ ไม่ได้ลึกลับ และไม่ได้วิเศษเกินจริง — มันมีจุดเด่นจุดอ่อนของมันอยู่ ซึ่งเดี๋ยวผมจะเล่ากับดักให้ฟังต่อ
สรุปทีว่า “ตกลงงานของฉันควรใช้แบบมีเฉลยหรือไม่มีเฉลย”
พอคุยมาถึงตรงนี้ บางคนอาจเริ่มงงนิดๆ ว่า “ตกลงงานของฉันมันควรใช้แบบไหน” ผมขอให้เส้นแบ่งง่ายๆ ที่จำไปใช้ได้เลยนะครับ —
ถ้าคุณ “รู้คำตอบที่ถูกอยู่แล้ว” และอยากให้เครื่องทายคำตอบนั้นกับของใหม่ → ใช้แบบมีเฉลย (Supervised)
เช่น คุณมีรูปสินค้าดี/สินค้าตำหนิที่คนคัดไว้แล้วเป็นพันรูป อยากให้เครื่องคัดตำหนิแทนคนต่อไป — แบบนี้คุณรู้เฉลย (ดี/ตำหนิ) อยู่แล้ว ก็เอาไปสอนมันได้เลย
ถ้าคุณ “ยังไม่รู้ด้วยซ้ำว่าคำตอบควรเป็นยังไง” และอยากให้เครื่องช่วยหาแพตเทิร์นที่ซ่อนอยู่ → ใช้แบบไม่มีเฉลย (Unsupervised)
เช่น คุณมีลูกค้าเป็นพัน แต่ไม่รู้ว่าควรแบ่งเป็นกี่ประเภท หรือคุณอยากให้เครื่องคอยสะกิดเวลามีอะไรผิดปกติโดยที่คุณยังไม่รู้ว่า “ผิดปกติ” หน้าตาเป็นยังไง — แบบนี้แหละงานของ Unsupervised
| คำถามที่ถามตัวเอง | ถ้าตอบ “ใช่” | แปลว่า |
|---|---|---|
| ฉันมีตัวอย่างคู่กับเฉลยที่ถูกอยู่แล้วไหม | ใช่ → Supervised | สอนด้วยเฉลย แล้วให้มันทายของใหม่ |
| ฉันแค่อยากเห็นว่าข้อมูลมีกี่กลุ่ม / ใครเข้าพวกใคร | ใช่ → Clustering | จัดกองให้ แล้วเราตีความเอง |
| ฉันอยากให้คอยจับของผิดปกติที่คาดเดาไม่ได้ | ใช่ → Anomaly Detection | เรียนความปกติ แล้วสะกิดของแปลก |
ของจริงในธุรกิจหลายทีมเขา ใช้ทั้งสองแบบผสมกัน ด้วยซ้ำครับ เช่นใช้ clustering แบ่งกลุ่มลูกค้าก่อน พอเห็นกลุ่มชัดแล้วค่อยเอาไปทำระบบแบบมีเฉลยต่อ ไม่ต้องเลือกอย่างใดอย่างหนึ่งตายตัว — เอาที่มันแก้โจทย์เราได้จริงเป็นพอ
กับดักที่อยากเตือนไว้ก่อน
ก่อนปิดตอน ผมขอเตือนกับดักสองสามอันที่เจ้าของกิจการมักพลาด เวลาเริ่มเอาเรื่องพวกนี้ไปใช้ —
กับดักที่ 1 — คิดว่ามันให้ “คำตอบ” ทั้งที่มันให้แค่ “เบาะแส”
นี่คือกับดักที่ใหญ่ที่สุดครับ ขอย้ำอีกรอบเพราะสำคัญมาก — clustering ไม่ได้บอกว่า “นี่คือลูกค้า VIP ของคุณ” มันแค่บอกว่า “ลูกค้าพวกนี้คล้ายกัน” ส่วนคำว่า VIP เป็นสิ่งที่คุณตีความเองทีหลัง เช่นเดียวกับ anomaly detection ที่ไม่ได้บอกว่า “นี่คือการโกง” มันแค่บอกว่า “อันนี้แปลก” ฉะนั้นถ้าใครเอาผลที่มันชี้มาเชื่อทั้งดุ้นโดยไม่กลั่นกรอง มีโอกาสพลาดสูงครับ
กับดักที่ 2 — ข้อมูลขยะเข้า ผลขยะออก
เรื่องนี้จริงกับ AI ทุกแบบ แต่กับ unsupervised มันเจ็บเป็นพิเศษ เพราะไม่มีเฉลยมาคอยถ่วงดุล ถ้าข้อมูลลูกค้าของคุณมันมั่ว เช่นกรอกยอดผิด วันที่ผิด มีข้อมูลซ้ำเต็มไปหมด — กองที่เครื่องจัดออกมาก็จะมั่วตามไปด้วย แล้วคุณจะตีความผิดไปกันใหญ่ ฉะนั้นก่อนจะตื่นเต้นกับ AI ลองกลับไปดูก่อนว่าข้อมูลในมือเราสะอาดพอไหม
กับดักที่ 3 — เห็นกลุ่มแล้วรีบด่วนสรุป
บางทีเครื่องจัดกองมาให้ แล้วเราดันไปเห็นแพตเทิร์นที่มัน “ดูเหมือนจะมีความหมาย” ทั้งที่จริงๆ มันอาจเป็นเรื่องบังเอิญ — คนเราชอบมองเห็นรูปร่างในก้อนเมฆครับ 555+ ฉะนั้นพอเห็นกองที่น่าสนใจ อย่าเพิ่งทุ่มงบทั้งก้อนตามทันที ลองเอาไปทดสอบเล็กๆ ก่อนว่ามันจริงไหม
จับกลุ่ม กับ หาของแปลก — จริงๆ มันคือเหรียญสองด้านของเรื่องเดียวกัน
ก่อนปิด ผมอยากชวนถอยมามองภาพรวมสักนิด เพราะพอเล่าแยกกันสองงาน บางคนอาจคิดว่ามันคนละเรื่องกัน — แต่จริงๆ แล้ว clustering กับ anomaly detection มันคือ เหรียญสองด้านของเรื่องเดียวกัน ครับ คือเรื่อง “ความคล้าย” ที่เราคุยกันตั้งแต่ต้นนั่นแหละ
จำภาพแผนที่ที่เราเอาลูกค้าไปวางเป็นจุดได้ไหมครับ —
- มองหา จุดที่เกาะกลุ่มกันแน่นๆ → นั่นคือ clustering (จับกลุ่ม)
- มองหา จุดที่อยู่โดดเดี่ยว ไกลจากทุกกอง → นั่นคือ anomaly detection (หาของแปลก)
เห็นไหมครับว่ามันมองแผนที่แผ่นเดียวกันเลย แค่สนใจคนละมุม อันนึงสนใจ “พวกที่อยู่ด้วยกัน” อีกอันสนใจ “ตัวที่ไม่มีพวก” ลองดูเทียบกันชัดๆ —
| Clustering (จับกลุ่ม) | Anomaly Detection (หาของแปลก) | |
|---|---|---|
| มองหาอะไร | ความคล้าย — ใครเข้าพวกใคร | ความต่าง — ใครไม่เข้าพวกใคร |
| สนใจ | จุดที่เกาะกลุ่มกัน | จุดที่อยู่โดดเดี่ยว |
| เอาไปใช้ | แบ่งกลุ่มลูกค้า, จัดหมวดสินค้า | จับโกง, จับเครื่องใกล้พัง, จับของหาย |
| คำถามที่ตอบ | ”ในกองนี้มีกี่พวก ใครอยู่พวกไหน" | "มีอะไรผิดปกติให้ต้องดูไหม” |
| อุปมาบ้านๆ | แยกกองผ้าซัก | ชุดแดงในห้องที่ใส่ขาวกันหมด |
พอเห็นภาพนี้แล้วผมว่าทั้งตอนมันร้อยเป็นเรื่องเดียวกันสวยงามเลยครับ — Unsupervised Learning ทั้งหมดก็คือการที่เครื่องดูข้อมูลกองโตๆ โดยไม่มีเฉลย แล้วใช้แค่ “ความคล้าย/ไม่คล้าย” เป็นไม้บรรทัด มาช่วยเราจัดระเบียบและสะกิดของน่าสงสัย เท่านั้นเอง
ลองนึกภาพว่าเราเอามาใช้จริงดูครับ
เพื่อให้เห็นภาพว่ามันต่อยอดยังไง ผมขอสมมติสถานการณ์ขึ้นมาให้ดูสักอันนะครับ (ย้ำว่า สมมติ ล้วนๆ ไม่ใช่เคสจริงของใคร) —
ลองนึกภาพว่าเจ้าของร้านขายเสื้อผ้าออนไลน์คนหนึ่งทำมาสามปี มีลูกค้าในระบบหลายพันคน ที่ผ่านมาเวลายิงโฆษณาหรือส่งโปรโมชั่น เขาก็ ส่งเหมือนกันหมดทุกคน เพราะมองลูกค้าเป็นกองเดียว ผลคือบางทีก็ได้ผลบ้างไม่ได้ผลบ้าง งบโฆษณาหายไปเรื่อยๆ โดยไม่รู้ว่ารั่วตรงไหน
วันหนึ่งเขาลองเอาข้อมูลลูกค้าทั้งหมดไปให้ระบบ clustering จัดกองดู ปรากฏว่ามันแยกออกมาได้ประมาณ 3-4 กองที่ต่างกันชัดเจน เขาเปิดดูแล้วก็ค่อยๆ เข้าใจว่าแต่ละกองคือใคร — กองหนึ่งเป็นขาประจำที่ซื้อทุกเดือน อีกกองเป็นคนที่ซื้อทีเดียวเยอะตอนมีโปรฯ ใหญ่ อีกกองเป็นลูกค้าที่หายไปนานแล้ว
พอเห็นภาพชัดแบบนี้ การตัดสินใจก็เปลี่ยนไปเลยครับ — แทนที่จะส่งข้อความเดียวให้ทุกคนเหมือนเดิม เขาเริ่ม คุยกับแต่ละกองคนละแบบ: ขาประจำก็ดูแลด้วยสิทธิพิเศษ ไม่ต้องลดราคาให้เปลืองเพราะเขาซื้ออยู่แล้ว, สายโปรฯ ใหญ่ก็เก็บไว้ยิงตอนแคมเปญใหญ่, ส่วนลูกค้าที่หายไปก็ส่งคูปองดึงกลับมา จะได้ไม่เสียงบไปส่งโปรฯ ให้คนที่ยังไงก็ซื้ออยู่แล้ว
สังเกตนะครับว่าในเรื่องนี้ เครื่องไม่ได้คิดกลยุทธ์การตลาดให้เลย มันแค่จัดกองมาให้ ส่วนไอเดียทั้งหมดว่าจะคุยกับแต่ละกองยังไง มาจากสมองของเจ้าของร้านที่รู้จักธุรกิจตัวเองดี — clustering แค่ “เปิดตา” ให้เขาเห็นว่าลูกค้ามันมีหลายแบบ ที่เหลือเป็นฝีมือคนล้วนๆ นี่แหละครับคือวิธีที่ Unsupervised Learning มันช่วยธุรกิจจริงๆ ไม่ใช่ของวิเศษ แต่เป็นแว่นขยายที่ช่วยให้เรามองข้อมูลตัวเองได้คมขึ้น
แล้วถ้าไม่มีเฉลย เครื่องมันรู้ได้ไงว่าตัวเองทำถูก?
ตรงนี้เป็นคำถามที่ดีมากครับ และเป็นจุดที่ผมอยากให้เข้าใจตรงกันก่อนจะปิดตอน —
ใน Supervised (เรียนแบบมีเฉลย) เราเช็คได้ง่ายว่าเครื่องเก่งไหม เพราะมีเฉลยให้เทียบ มันทายว่า “หมา” แล้วเฉลยบอกว่าหมา ก็ถูก จบ คะแนนชัดเจน
แต่ใน Unsupervised มัน ไม่มีเฉลยให้เทียบเลย ฉะนั้นคำว่า “ถูก/ผิด” มันเลยคลุมเครือกว่ามาก เครื่องมันแค่บอกว่า “ผมจัดกองมาแบบนี้นะ” หรือ “ผมว่าตัวนี้แปลกนะ” — แต่จะจัดดีไหม จะแปลกจริงไหม คนต้องเป็นคนตัดสินอยู่ดี เพราะมันไม่มีกระดาษคำตอบมายืนยัน
ผมเลยอยากย้ำสิ่งที่สำคัญที่สุดของตอนนี้ คือ Unsupervised Learning มันเก่งเรื่อง “ชี้เป้าให้เราดู” ครับ — มันชี้ว่า “เฮ้ย ในกองข้อมูลของคุณ มันมีกลุ่มซ่อนอยู่นะ / มีตัวประหลาดอยู่นะ” แต่มันไม่ได้บอกว่ากลุ่มนั้นแปลว่าอะไร หรือตัวประหลาดนั้นเป็นปัญหาหรือเปล่า ส่วนนั้นยังเป็นงานของสมองคนที่เอาไปคิดต่อ มันไม่ใช่ของวิเศษที่เสียบแล้วได้คำตอบสำเร็จรูป แต่เป็นเหมือน ผู้ช่วยที่ขยันจัดของและช่างสังเกต ช่วยให้เรามองเห็นสิ่งที่ตาเปล่ามองไม่เห็นในกองข้อมูลมหาศาล
สรุปสั้นๆ ส่งท้าย
ถ้าให้ย่อทั้งตอนนี้เหลือไม่กี่บรรทัดเอาไว้จำง่ายๆ คือแบบนี้ครับ —
- Unsupervised Learning = เรียนแบบไม่มีเฉลย ไม่มี label มาบอกว่าอะไรคืออะไร มีแต่ข้อมูลดิบให้เครื่องไปงมเอาเองว่ามีอะไรซ่อนอยู่
- Clustering (จับกลุ่ม) = มองหา “ความคล้าย” แล้วจัดของเข้ากองให้เอง โดยไม่ต้องบอกล่วงหน้าว่ามีกี่กอง — เหมือนแยกกองผ้าซัก เอาไปจัดกลุ่มลูกค้าได้สวยมาก
- Anomaly Detection (หาของแปลก) = มองหา “ความไม่คล้าย” จับตัวที่หลุดจากความปกติ — เหมือนชุดแดงในห้องที่ใส่ขาวกันหมด เอาไปจับธุรกรรมโกง เครื่องจักรใกล้พัง ของหายในคลัง ฯลฯ
- หัวใจร่วมกัน: เครื่อง “ชี้เป้า” ให้ ส่วนการ “ตีความ” ว่ามันแปลว่าอะไร เอาไปทำอะไรต่อ — ยังเป็นงานของคนเสมอ
- อย่าลืมกับดัก: มันให้แค่เบาะแสไม่ใช่คำตอบ, ข้อมูลขยะเข้าผลขยะออก, และอย่าด่วนสรุปจากแพตเทิร์นที่อาจบังเอิญ
และถ้าจะให้ผมสรุปด้วยประโยคเดียวจริงๆ คือ — Unsupervised Learning ไม่ใช่หมอดูที่ทายอนาคตให้ แต่เป็นแว่นขยายที่ช่วยให้เรามองข้อมูลที่เรามีอยู่แล้วได้ชัดขึ้น ของที่เคยซ่อนอยู่ในกองตัวเลขจนเรามองข้าม มันช่วยดึงขึ้นมาวางตรงหน้า ส่วนจะเอาไปทำอะไรต่อ ยังต้องอาศัยคนที่รู้จักธุรกิจตัวเองดีที่สุดเป็นคนตัดสินใจครับ
ผมไม่ใช่ผู้เชี่ยวชาญด้าน AI อะไรหรอกนะครับ เป็นแค่คนที่พยายามทำเรื่องพวกนี้ให้มันเข้าใจง่ายแบบภาษาคนๆ ตรงไหนผมเล่าคลาดเคลื่อนไป ทักท้วงกันเข้ามาได้เลย ยินดีมากๆ ครับ
ตอนที่แล้วเราคุยเรื่องเรียนแบบมีเฉลย ตอนนี้เรียนแบบไม่มีเฉลย — ตอนหน้าผมว่าจะเล่าการเรียนอีกแบบที่แปลกกว่าทั้งคู่ คือแบบ “ลองผิดลองถูกเอาเอง” ที่เครื่องไม่มีทั้งเฉลยและไม่มีข้อมูลตั้งต้น แต่ค่อยๆ เก่งขึ้นจากการได้รางวัลกับโดนหักคะแนน เหมือนฝึกหมาให้นั่งด้วยขนมนั่นแหละครับ ไว้เจอกันตอนหน้า