1232 คำ
6 นาที
AI 101 EP.02 — เครื่องเรียนรู้จากข้อมูลได้ยังไง — train กับ inference ต่างกันตรงไหน
สารบัญ
ลองนึกภาพฉากนี้ดูครับ ก่อนอื่น Machine Learning คืออะไร — แล้วทำไมมันถึงเป็นหัวใจของ AI หัวใจของเรื่องมีแค่ 2 ช่วง: ช่วง “เรียน” กับช่วง “ใช้” ช่วงเรียน (training) — เหมือนติวเด็กก่อนสอบ ช่วงใช้ (inference) — เหมือนเด็กเข้าห้องสอบจริง สรุปสองช่วงนี้เป็นตารางให้จำง่ายๆ ”อ้าว แล้วมันก็แค่ท่องจำตัวอย่างมาตอบสิ” — เปล่าครับ และนี่คือจุดที่มหัศจรรย์ที่สุด ทำไม “ข้อมูล” ถึงเป็นคำที่สำคัญที่สุดในเรื่องนี้ ของเข้าเป็นยังไง ของออกก็เป็นอย่างนั้น ข้อมูลที่ “ลำเอียง” — กับดักที่มองไม่เห็นด้วยตา เยอะไว้ก่อนดีไหม? — ไม่เสมอไปครับ เครื่องมัน “เรียน” ได้กี่แบบ — เล่าพอให้เห็นภาพ ลองเดินตามเรื่องสมมติหนึ่งเรื่องตั้งแต่ต้นจนจบ ”แล้วร้านเล็กๆ อย่างเราต้องมีข้อมูลเยอะขนาดไหนถึงจะเริ่มได้” ลองเอาทุกอย่างมาร้อยเป็นเรื่องเดียว สรุปสั้นๆ ส่งท้าย

AI 101 — ปัญญาประดิษฐ์ฉบับภาษาคน · Part 1 (เบื้องหลัง: AI ทำงานยังไง) ซีรีส์นี้ผมเขียนให้เจ้าของกิจการกับคนทำงานทั่วไปที่ไม่ใช่สาย IT อ่านสนุกๆ แต่ได้ของกลับไปใช้จริง ไม่มีศัพท์ยากๆ ขู่ให้กลัว ตอนนี้เป็นเรื่อง “เครื่องเรียนรู้จากข้อมูลได้ยังไง” — เปิดฝาดูข้างในว่าตอนเขาบอกว่า AI “เรียนรู้” เนี่ย จริงๆ มันเรียนยังไง แล้วคำว่า train กับ inference ที่ได้ยินบ่อยๆ มันคือช่วงไหนของเรื่องกันแน่ (สารบัญเต็มของซีรีส์จะตามมาทีหลังนะครับ)

ลองนึกภาพฉากนี้ดูครับ#

สมมติว่ามีเด็กตัวเล็กๆ คนนึง อายุสักสองสามขวบ ยังพูดไม่ค่อยชัด แล้ววันนึงคุณพาเขาเดินเล่นในสวน เจอหมาตัวนึงวิ่งผ่านมา คุณก็ชี้แล้วบอกว่า “นั่นไง หมา” เด็กก็มองตามแบบงงๆ เดินไปอีกหน่อยเจอหมาอีกตัว ตัวนี้สีดำ ตัวใหญ่กว่าเดิม คุณก็ชี้อีก “นั่นก็หมานะ” เดินต่อไปเจอหมาตัวจิ๋วขนฟูๆ คุณก็บอกอีก “หมาเหมือนกัน”

ผ่านไปสักพัก คุณไม่ได้สอนแล้ว แต่อยู่ดีๆ เด็กก็ชี้นิ้วไปที่หมาตัวที่สี่ที่คุณไม่เคยชี้ให้ดูมาก่อนเลย แล้วพูดเองว่า “หมา!” — ทั้งที่หมาตัวนี้สีไม่เหมือน ขนาดไม่เหมือน หน้าตาก็ไม่เหมือนสามตัวแรกเป๊ะๆ สักตัว

คำถามคือ… เด็กรู้ได้ยังไงว่ามันคือหมา?

ไม่มีใครนั่งเขียนกฎให้เด็กฟังเลยนะครับว่า “ถ้ามีสี่ขา มีหาง มีขน หูตั้งหรือหูพับ หางกระดิก เห่าได้ = หมา” ไม่มีใครให้สูตรอะไรเลย เด็กแค่ ดูตัวอย่างมาหลายๆ ตัว แล้วสมองเขาก็ค่อยๆ จับ “รูปแบบ” (pattern — อ่านว่า แพ็ตเทิร์น แปลว่า แบบแผนหรือลักษณะร่วมที่ซ้ำๆ กัน) ของความเป็นหมาขึ้นมาเอง พอเจอตัวใหม่ที่ไม่เคยเห็น เขาก็เอารูปแบบนั้นมา “เดา” ได้ว่าน่าจะเป็นหมา

เชื่อไหมครับว่า นี่แหละคือหัวใจทั้งหมดของสิ่งที่เรียกว่า Machine Learning เลย แทบไม่ผิดเพี้ยนเลยด้วย

ก่อนอื่น Machine Learning คืออะไร — แล้วทำไมมันถึงเป็นหัวใจของ AI#

คำเต็มๆ คือ Machine Learning (อ่านว่า แมชชีน เลิร์นนิง ย่อบ่อยๆ ว่า ML แปลตรงตัวว่า “การเรียนรู้ของเครื่อง”) ครับ ฟังชื่อแล้วเหมือนหนังไซไฟ แต่ความหมายมันบ้านๆ มากเลย

ผมอยากให้เปรียบเทียบกับวิธีทำโปรแกรมคอมพิวเตอร์แบบเดิมๆ ก่อน เพื่อให้เห็นความต่างชัดๆ

สมัยก่อน ถ้าจะให้คอมทำอะไรสักอย่าง คนเขียนโปรแกรมต้องนั่งเขียน กฎ ให้มันทุกข้อ เป๊ะๆ ทีละบรรทัด เช่นจะให้คอมรู้จักอีเมลขยะ (spam) ก็ต้องเขียนว่า “ถ้าในอีเมลมีคำว่า ‘ถูกรางวัล’ หรือ ‘โอนเงินด่วน’ หรือ ‘คลิกลิงก์นี้’ → ให้ถือว่าเป็นขยะ” คนต้องคิดกฎทุกข้อเองแล้วป้อนเข้าไป คอมก็แค่ทำตามกฎเป๊ะๆ (ใครอ่าน EP.01 มาแล้วจะคุ้นๆ ครับ — นี่แหละโลกของ automation ที่เราคุยกันไป)

ปัญหาคือ พวกคนส่งอีเมลขยะมันก็ไม่โง่ครับ พอรู้ว่าคำว่า “ถูกรางวัล” โดนบล็อก มันก็เปลี่ยนไปเขียน “ถ้กรางวัล” “ถูก_รางวัล” “ถูกราง’วัล” สารพัดวิธีหลบ คนเขียนกฎก็ต้องวิ่งไล่ตามเพิ่มกฎไม่จบสิ้น เหนื่อยตายเลยครับ เพราะกฎมันเขียนตามไม่ทันโลกจริงที่ซับซ้อนและเปลี่ยนตลอด

แล้วยิ่งคิดดีๆ จะเห็นว่ามันยุ่งกว่านั้นอีก เพราะคำว่า “ถูกรางวัล” บางทีก็อยู่ในอีเมลดีๆ ที่ไม่ใช่ขยะก็ได้ เช่นเพื่อนส่งมาเล่าว่า “เฮ้ย เมื่อวานฉันถูกรางวัลสลากด้วยนะ” — ถ้าใช้กฎตายตัวบล็อกทุกอีเมลที่มีคำนี้ ก็ดันไปบล็อกอีเมลเพื่อนทิ้งซะงั้น นี่แหละครับคือข้อจำกัดของการเขียนกฎเป๊ะๆ คือโลกจริงมันมีรายละเอียดปลีกย่อยเยอะเกินกว่าที่คนจะนั่งเขียนกฎครอบให้ครบทุกกรณีได้ไหว

ทีนี้ ML มันพลิกวิธีคิดใหม่หมด แทนที่จะให้คนนั่งเขียนกฎ เราเปลี่ยนเป็น เอาตัวอย่างเยอะๆ ไปให้เครื่องดู แล้วให้เครื่องหากฎ (หรือรูปแบบ) ขึ้นมาเอง เหมือนที่เด็กในสวนหาความเป็นหมาเองได้นั่นแหละครับ

เปรียบเทียบให้เห็นภาพแบบนี้ครับ

วิธีเขียนโปรแกรมแบบเดิมวิธีแบบ Machine Learning
ใครคิดกฎคนเขียนเองทุกข้อเครื่องหาเอาเองจากตัวอย่าง
ป้อนอะไรเข้าไปกฎ (เช่น “ถ้า…แล้ว…”)ตัวอย่างเยอะๆ ที่ติดป้ายไว้แล้ว
เจอเคสใหม่ที่ไม่เคยเห็นทำไม่ได้ ต้องเพิ่มกฎเองพอจะ “เดา” ได้จากรูปแบบที่เคยเห็น
เหมาะกับงานแบบไหนงานกฎตายตัว ชัดเจนงานคลุมเครือ ซับซ้อน เปลี่ยนบ่อย

เห็นความต่างไหมครับ? อันบนคือ “คนสอนกฎ” อันล่างคือ “เครื่องเรียนเอง” และเจ้า ML ที่เรียนเองได้นี่แหละ คือเครื่องยนต์ที่อยู่เบื้องหลัง AI เก่งๆ เกือบทั้งหมดที่เราใช้กันทุกวันนี้ ตั้งแต่ที่มันกรองอีเมลขยะให้เรา แนะนำหนังที่เราน่าจะชอบ ไปจนถึง ChatGPT ที่คุยกับเรารู้เรื่อง

จริงๆ คุณเจอ ML แบบนี้ทุกวันโดยไม่รู้ตัวด้วยซ้ำครับ ลองนึกภาพเวลาคุณเปิดแอปดูคลิปหรือแอปช้อปปิ้ง แล้วมันชอบเด้งของที่เรา “อยากดู/อยากซื้อ” พอดีขึ้นมาเอง — ไม่มีใครนั่งเขียนกฎว่า “ถ้าเป็นคนนี้ ให้โชว์คลิปนี้” หรอกครับ ระบบมันแค่ดูจากตัวอย่างพฤติกรรมเก่าๆ ของคุณ (เคยดูอะไร กดข้ามอะไร ดูจบหรือเลื่อนผ่าน) แล้วจับรูปแบบเองว่า “คนที่ชอบของแนวนี้ มักจะชอบของแนวนั้นด้วย” แล้วเดาของชิ้นต่อไปมาเสิร์ฟ นี่คือ ML ทำงานอยู่เงียบๆ ในมือคุณเลยครับ และมันก็เรียนจากตัวอย่างเหมือนเด็กรู้จักหมานั่นแหละ ไม่ต่างกัน

💡 มุมเจ้าของกิจการ: ครั้งหน้าที่ได้ยินคำว่า “ระบบเรามี AI เรียนรู้ได้นะ” ให้แปลในใจง่ายๆ ว่า “ระบบนี้มันดูตัวอย่างเยอะๆ แล้วจับรูปแบบเองเป็น ไม่ได้รอคนป้อนกฎทีละข้อ” แค่นี้คุณก็เข้าใจคำโฆษณาเขาทะลุปรุโปร่งแล้วครับ ไม่ต้องไปกลัวศัพท์

หัวใจของเรื่องมีแค่ 2 ช่วง: ช่วง “เรียน” กับช่วง “ใช้”#

ทีนี้มาถึงพระเอกของตอนนี้แล้วครับ ถ้าผมจะให้คุณจำเรื่อง ML กลับบ้านไปแค่อย่างเดียว ผมอยากให้จำว่า มันมีอยู่แค่ 2 ช่วงเท่านั้น จบเลย ไม่ซับซ้อนไปกว่านี้

  • ช่วงที่ 1 — ช่วงเรียน ภาษาวงการเรียกว่า training (อ่านว่า เทรนนิง แปลว่า “การฝึก/การสอน”) คือช่วงที่เราเอาตัวอย่างเยอะๆ ไปให้เครื่องดูซ้ำๆ จนมันจับรูปแบบได้
  • ช่วงที่ 2 — ช่วงใช้ ภาษาวงการเรียกว่า inference (อ่านว่า อิน-เฟอ-เรินซ์ แปลว่า “การอนุมาน” หรือพูดง่ายๆ คือ “การเอาไปทาย”) คือช่วงที่เครื่องเรียนจบแล้ว เอามาใช้งานจริง เจอของใหม่ก็ทายให้เลย

แค่นี้จริงๆ ครับ ที่เหลือเป็นรายละเอียด เดี๋ยวผมเล่าทีละช่วงให้ฟังแบบสบายๆ

ช่วงเรียน (training) — เหมือนติวเด็กก่อนสอบ#

ลองนึกภาพการติวหนังสือเด็กก่อนสอบดูครับ คุณไม่ได้บอกข้อสอบจริงให้เด็กหรอก แต่คุณเอา โจทย์เก่าๆ พร้อมเฉลย มากองให้เด็กดูเยอะๆ เด็กก็ทำโจทย์ แล้วเทียบกับเฉลย “อ้อ ข้อนี้ตอบแบบนี้สินะ” ทำผิดก็ดูเฉลยแล้วปรับความเข้าใจ ทำไปเรื่อยๆ เป็นร้อยเป็นพันข้อ จนจับทางได้ว่าโจทย์แบบนี้ต้องคิดยังไง

ช่วง training ของเครื่องก็เป๊ะแบบนั้นเลยครับ เราเอา ข้อมูลที่ติดป้ายเฉลยไว้แล้ว ไปป้อนให้มันดู สมมติเราอยากสอนให้เครื่องแยกรูปหมากับรูปแมว เราก็เอารูปหมามาเป็นพันๆ รูป ติดป้ายว่า “นี่หมานะ” แล้วก็เอารูปแมวมาเป็นพันๆ รูป ติดป้ายว่า “นี่แมวนะ” แล้วป้อนให้มันดูทั้งหมด

เครื่องมันก็ค่อยๆ ดูไป “เออ รูปที่ติดป้ายว่าหมาเนี่ย หน้ามันยาวๆ หูแบบนี้ จมูกแบบนี้… ส่วนที่ติดป้ายว่าแมว หน้ามันกลมๆ หนวดยาวๆ ตาแบบนี้…” มันจะค่อยๆ ปรับความเข้าใจข้างในตัวเองทีละนิดๆ ทุกครั้งที่ดูรูปใหม่ ดูไปเรื่อยๆ เป็นแสนเป็นล้านรูป จนในที่สุดมันจับรูปแบบของ “ความเป็นหมา” กับ “ความเป็นแมว” ได้แม่นยำ

จุดที่ผมชอบมากของวิธีนี้คือ เราไม่ต้องรู้ด้วยซ้ำว่ากฎที่แท้จริงคืออะไร ลองคิดดูสิครับ ถ้าให้คุณนั่งเขียนกฎอธิบายเป็นตัวหนังสือว่า “หมาต่างจากแมวยังไง” ให้ครบทุกแง่มุม คุณคงเขียนได้ไม่หมดหรอก เพราะบางทีเราก็ “รู้สึก” ว่าตัวไหนหมาตัวไหนแมวโดยอธิบายเป็นคำพูดไม่ถูก แต่เครื่องมันไม่ต้องให้เราอธิบาย มันไปงมหากฎที่ซ่อนอยู่ในตัวอย่างเอาเองทั้งหมด — เราแค่เป็นคนเอาตัวอย่างที่ติดป้ายถูกต้องไปวางให้มันดูก็พอ ส่วนที่เหลือเป็นงานของมัน

เจ้าก้อนความเข้าใจที่เครื่องสร้างขึ้นมาหลังเรียนจบนี่แหละครับ เขาเรียกว่า model (อ่านว่า โมเดล แปลแบบบ้านๆ คือ “ก้อนความรู้ที่ฝึกเสร็จแล้ว” หรือจะเปรียบเป็น “สมองที่ติวจบแล้ว” ก็ได้) เวลาคุณได้ยินข่าวว่า “บริษัทนั้นเปิดตัว AI model ใหม่” ก็คือเขาเอาข้อมูลมหาศาลไปติวสมองก้อนใหม่มาเสร็จแล้วนั่นเองครับ

ผมขอแถมนิดนึงตรงคำว่า “ปรับความเข้าใจข้างในทีละนิด” ที่เพิ่งพูดไป เพราะมันคือหัวใจของช่วงเรียนเลย ลองนึกภาพปุ่มหมุนปรับเสียงในเครื่องเสียงเก่าๆ ดูครับ ที่ค่อยๆ หมุนซ้ายหมุนขวาจนเสียงพอดี — ในสมองของ model มันมีปุ่มแบบนี้อยู่เต็มไปหมด (เยอะมากจนนับไม่ไหว) ทุกครั้งที่มันดูรูปใหม่แล้วทายผิด มันก็จะ ค่อยๆ หมุนปุ่มพวกนี้ทีละนิด เพื่อให้ครั้งหน้าทายแม่นขึ้น ทำแบบนี้ซ้ำเป็นล้านๆ รอบ ปุ่มทั้งหมดก็ค่อยๆ เข้าที่เข้าทางจนทายได้แม่น นี่แหละครับคือสิ่งที่เกิดขึ้นจริงๆ ตอน “เครื่องเรียนรู้” — ไม่มีเวทมนตร์อะไรเลย แค่ลองทาย เทียบเฉลย แล้วปรับ วนไปเรื่อยๆ จนเก่ง

จุดสำคัญที่อยากให้สังเกตคือ ช่วงเรียนนี้มัน กินแรงเยอะมาก ครับ ทั้งกินข้อมูล กินเวลา กินเครื่องแรงๆ ประมวลผล เหมือนการติวเข้มก่อนสอบที่เหนื่อยสุดๆ แต่พอติวจบแล้วได้ “สมอง” มาก้อนนึง ทีนี้เอาไปใช้ได้สบายๆ เลย ซึ่งก็พาเรามาที่ช่วงที่สอง

ช่วงใช้ (inference) — เหมือนเด็กเข้าห้องสอบจริง#

พอเด็กติวจบ ถึงเวลาเข้าห้องสอบจริง เจอโจทย์ใหม่ที่ไม่เคยเห็นมาก่อน เด็กก็ไม่ได้ตื่นตระหนกอะไร เพราะเขาเอา “ทางที่จับได้ตอนติว” มาใช้ตอบโจทย์ใหม่นี้ได้เลย — นี่แหละครับคือ inference หรือช่วง “เอาไปทาย”

กลับมาที่เครื่องแยกหมากับแมวของเรา พอ training เสร็จได้ model มาแล้ว ทีนี้คุณเอารูปใหม่เอี่ยมที่เครื่องไม่เคยเห็นมาก่อนเลยสักรูป ส่งเข้าไปถาม “เนี่ย รูปนี้หมาหรือแมว?” เครื่องก็จะเอารูปแบบที่มันจับได้ตอนเรียนมาดู แล้วตอบกลับมาว่า “อันนี้น่าจะเป็นหมานะ” — เร็วมาก แทบจะทันที เพราะมันไม่ต้องเรียนใหม่แล้ว แค่เอาความรู้ที่มีอยู่มาทายเฉยๆ

ผมขอเน้นคำว่า “น่าจะ” หน่อยนะครับ เพราะมันสำคัญมาก เครื่องมันไม่ได้ตอบแบบฟันธงเต็มร้อยว่า “นี่คือหมาแน่นอน” หรอก จริงๆ ข้างในมันคิดเป็นแบบ “ความน่าจะเป็น” มากกว่า ประมาณว่า “อันนี้ดูเป็นหมามากกว่าเป็นแมวเยอะเลย” แล้วมันก็เลือกตอบอันที่มั่นใจกว่า บางรูปมันก็มั่นใจมาก บางรูปก็ก้ำกึ่งแทบจะเดาสุ่ม

นี่แหละครับคือเหตุผลว่าทำไม AI ถึง “มั่ว” ได้บางครั้ง (อาการที่เราคุยกันใน EP.01 ว่า hallucination หรือ “อาการหลอน”) เพราะลึกๆ แล้วมันทำงานด้วยการ เดาว่าอะไรน่าจะใช่ที่สุด ไม่ได้ทำงานด้วยกฎตายตัวเป๊ะๆ เหมือนเครื่องคิดเลข บางทีรูปมันคลุมเครือ เช่นรูปหมาหน้าตาประหลาดๆ ที่ดันไปเหมือนแมว มันก็ทายพลาดได้เหมือนกัน เหมือนเด็กที่ติวมาดีแต่เจอโจทย์พลิกแพลงในห้องสอบแล้วตอบผิดนั่นแหละครับ

อีกเรื่องที่อยากให้สังเกตและเก็บไว้ใช้ได้จริงคือ ความไม่เท่ากันของสองช่วงนี้ในเรื่องเวลาและค่าใช้จ่าย ครับ ช่วงเรียน (training) มันหนักมาก เหมือนการสร้างโรงงานที่ลงทุนมหาศาลครั้งเดียว ใช้เวลานานเป็นวันเป็นสัปดาห์ ใช้เครื่องแรงๆ ราคาแพง แต่พอเรียนจบได้ model มาแล้ว ช่วงใช้ (inference) มันเบากว่ากันคนละโลกเลยครับ แต่ละครั้งที่ทายใช้เวลาแค่เสี้ยววินาที ใช้ทรัพยากรนิดเดียว — แต่จุดที่ต้องระวังคือ ถึงต่อครั้งจะถูก แต่ถ้ามีคนใช้งานทายพร้อมกันเป็นล้านครั้งต่อวัน ค่าใช้จ่ายรวมๆ ของช่วงใช้ก็บานปลายได้เหมือนกัน เหมือนค่าน้ำค่าไฟต่อหน่วยถูกมาก แต่ถ้าเปิดทั้งโรงงานทั้งวันก็เป็นเงินก้อนใหญ่ได้ — เก็บไว้เป็นความเข้าใจติดตัวว่า ค่าใช้จ่ายของ AI มันมีทั้ง “ค่าสร้างทีเดียว” กับ “ค่าใช้ทุกครั้ง” แยกกันนะครับ

สรุปสองช่วงนี้เป็นตารางให้จำง่ายๆ#

ช่วงเรียน (training)ช่วงใช้ (inference)
ทำอะไรดูตัวอย่างเยอะๆ จับรูปแบบเจอของใหม่ แล้วทายเลย
เปรียบเหมือนติวเด็กก่อนสอบเด็กเข้าห้องสอบจริง
ทำเมื่อไหร่ทำครั้งเดียว (หรือนานๆ ที) ตอนสร้างทำซ้ำทุกครั้งที่ใช้งานจริง
กินแรงแค่ไหนเยอะมาก ใช้เวลานาน เครื่องแรงเบากว่าเยอะ ตอบเร็วทันที
ผลลัพธ์ที่ได้ได้ “model” (สมองที่ฝึกเสร็จ)ได้คำตอบ/คำทาย

พอเห็นตารางนี้แล้วผมว่าหลายคนน่าจะร้อง “อ๋อ” ขึ้นมาเลยครับ เวลาคุณคุยกับ ChatGPT ทุกวันนี้ คุณกำลังใช้มันในช่วง inference อยู่นะครับ คือมันถูกติว (train) มาเสร็จเรียบร้อยแล้วจากที่อื่น คุณแค่กำลังยิงคำถามให้มันทาย ส่วนการติวสมองมันขึ้นมาเนี่ย เกิดขึ้นไปก่อนหน้านั้นแล้ว เป็นงานช้างที่ใช้ข้อมูลกับเครื่องมหาศาล

”อ้าว แล้วมันก็แค่ท่องจำตัวอย่างมาตอบสิ” — เปล่าครับ และนี่คือจุดที่มหัศจรรย์ที่สุด#

ตรงนี้ผมเดาว่าหลายคนเริ่มสงสัยในใจแล้วว่า “เอ๊ะ ถ้ามันดูตัวอย่างมาเป็นล้านๆ อัน มันก็แค่จำตัวอย่างพวกนั้นไว้แล้วเอามาตอบใช่ไหม?” — คำถามนี้ดีมากครับ และคำตอบคือ ไม่ใช่ และความ “ไม่ใช่” ตรงนี้แหละคือหัวใจที่ทำให้ ML มันเจ๋งจริง

ลองกลับไปที่เด็กในสวนอีกทีนะครับ ตอนเด็กชี้หมาตัวที่สี่แล้วพูดว่า “หมา!” — หมาตัวนั้นเด็ก ไม่เคยเห็นมาก่อนเลย ใช่ไหมครับ ถ้าเด็กแค่ “ท่องจำ” หมาสามตัวแรกไว้ พอเจอตัวที่สี่ที่หน้าตาไม่เหมือนเป๊ะ เด็กต้องตอบไม่ได้สิ แต่เด็กตอบได้ เพราะเขาไม่ได้จำ “หมาตัวนั้นๆ” แต่เขาจับ “แก่นของความเป็นหมา” ได้ต่างหาก แล้วเอาแก่นนั้นมาใช้กับของใหม่

ความสามารถข้อนี้แหละครับที่สำคัญที่สุด วงการเรียกว่า generalization (อ่านว่า เจเนอรัลไลเซชั่น แปลบ้านๆ คือ “การสรุปแก่นแล้วเอาไปใช้กับของใหม่ที่ไม่เคยเห็น”) ถ้าเครื่องทำสิ่งนี้ได้ดี = มันเรียนสำเร็จจริง เพราะมันจับแก่นได้ ไม่ใช่แค่ท่องจำ

แล้วถ้ามันท่องจำอย่างเดียวล่ะ จะเกิดอะไรขึ้น? อันนี้ก็มีคำเรียกครับ เขาเรียกว่า overfitting (อ่านว่า โอเวอร์ฟิตติง แปลบ้านๆ คือ “ท่องจำเป๊ะเกินไปจนใช้กับของใหม่ไม่ได้”) ลองนึกภาพเด็กอีกคนที่ติวสอบด้วยวิธี ท่องเฉลยข้อสอบเก่าทุกข้อแบบนกแก้วนกขุนทอง ข้อไหนตอบ ก. ข้อไหนตอบ ข. จำหมด พอเอาข้อสอบเก่ามาให้ทำซ้ำ — ได้คะแนนเต็มเลยครับ ดูเหมือนเก่งมาก แต่พอเข้าห้องสอบจริงเจอโจทย์ที่เลขข้อสลับ คำถามเปลี่ยนสำนวนนิดหน่อย เด็กคนนี้จ๋อยทันที เพราะเขาไม่ได้ “เข้าใจ” อะไรเลย เขาแค่ท่องจำมา

เครื่องก็เป็นแบบนี้ได้เหมือนกันเป๊ะครับ ถ้าเราติวมันหนักเกินไปกับตัวอย่างชุดเดิมๆ มันจะจำตัวอย่างพวกนั้นได้แม่นเป๊ะจนดูเหมือนเก่งมาก แต่พอเจอของจริงในโลกที่ไม่เคยเห็น มันกลับทายมั่ว นี่คือกับดักที่คนทำ AI ต้องคอยระวังตลอด คือต้องเช็คว่า model มัน “เข้าใจแก่น” จริงๆ หรือแค่ “ท่องจำตัวอย่าง”

วิธีเช็คก็ตรงไปตรงมาแบบที่ครูเช็คเด็กนั่นแหละครับ — เวลาติวเครื่อง เขาจะ กั๊กตัวอย่างบางส่วนเอาไว้ ไม่ให้เครื่องเห็นตอนเรียน เหมือนเก็บข้อสอบลับไว้ชุดนึง พอเครื่องเรียนจบ ค่อยเอาชุดลับนี้มาทดสอบ ถ้าเครื่องทายชุดที่ไม่เคยเห็นได้แม่น = มันจับแก่นได้จริง สอบผ่าน แต่ถ้าทายชุดที่เคยเห็นได้แม่นแต่ชุดลับทายพลาด = มันแค่ท่องจำ ยังใช้งานจริงไม่ได้ ต้องกลับไปปรับ

💡 มุมเจ้าของกิจการ: ถ้าวันหนึ่งมี vendor มาโชว์ว่า “ดูสิ ระบบ AI ของเราแม่นมาก!” ลองถามกลับสั้นๆ ว่า “แม่นกับข้อมูลที่มันเคยเห็นตอนฝึก หรือแม่นกับข้อมูลใหม่ที่ไม่เคยเห็น?” — เพราะระบบที่แม่นเฉพาะของเก่าที่เคยเห็น (overfitting) มันดูสวยตอนเดโม แต่พอเอามาใช้กับลูกค้าจริงในร้านคุณอาจจะเหลวได้ คำถามนี้แหละครับที่แยกของจริงออกจากของที่ทำมาขายเอาสวย

ทำไม “ข้อมูล” ถึงเป็นคำที่สำคัญที่สุดในเรื่องนี้#

เอาล่ะ ถึงตรงนี้ผมอยากชวนคุณกลับไปดูเด็กในสวนกับการติวสอบอีกที แล้วถามคำถามนึง — สิ่งที่ทำให้เด็กรู้จักหมา และทำให้เครื่องแยกหมากับแมวได้ มันคืออะไรที่เป็นต้นทางของทุกอย่าง?

คำตอบคือ ตัวอย่างที่เอาไปให้ดู ครับ หรือพูดให้เป็นทางการก็คือ ข้อมูล (data — อ่านว่า เดต้า)

ลองคิดตามนะครับ ถ้าเด็กในสวนเห็นหมาแค่ตัวเดียวในชีวิต เขาจะรู้จักหมาดีไหม? ก็คงไม่ เพราะเขาอาจจะจำได้แค่ว่า “หมา = สัตว์สีน้ำตาลตัวนั้น” พอเจอหมาสีดำก็ไม่รู้จักแล้ว เด็กต้องเห็นหมา หลายๆ ตัว หลายสี หลายขนาด ถึงจะจับ “แก่น” ของความเป็นหมาได้จริงๆ

เครื่องก็เหมือนกันเป๊ะเลยครับ ข้อมูลคืออาหารของ ML ถ้าไม่มีข้อมูล หรือมีน้อยเกินไป เครื่องก็เรียนไม่รู้เรื่อง เหมือนจะติวเด็กสอบแต่มีโจทย์เก่าให้แค่สองสามข้อ — เด็กก็ไม่มีทางเก่งได้ นี่คือเหตุผลว่าทำไมเวลาคุณได้ยินข่าวเรื่อง AI เก่งๆ เขาถึงพูดถึง “ข้อมูลมหาศาล” กันตลอด เพราะข้อมูลคือวัตถุดิบตั้งต้นที่ขาดไม่ได้จริงๆ

แต่ — และนี่คือจุดที่ผมอยากเน้นที่สุดในตอนนี้ — มันไม่ใช่แค่เรื่อง “ปริมาณ” เยอะอย่างเดียวนะครับ คุณภาพของข้อมูลสำคัญพอๆ กัน หรือบางทีสำคัญกว่าด้วยซ้ำ

ของเข้าเป็นยังไง ของออกก็เป็นอย่างนั้น#

วงการเขามีคำพูดติดปากอยู่ประโยคนึงครับ ภาษาอังกฤษว่า “garbage in, garbage out” แปลบ้านๆ คือ “ป้อนขยะเข้าไป ก็ได้ขยะออกมา” ฟังดูแรงแต่จริงสุดๆ

ลองนึกภาพแบบนี้ครับ สมมติคุณติวเด็กสอบ แต่เฉลยที่คุณให้เด็กดูดันผิดซะครึ่งนึง เด็กก็จะจำของผิดๆ ไปเต็มหัว พอเข้าห้องสอบจริงก็ตอบผิดตามที่ติวมา ทั้งที่เด็กตั้งใจเรียนเต็มที่เลยนะ แต่เพราะ “ของที่ป้อนเข้าไป” มันผิดตั้งแต่ต้น

เครื่องก็เหมือนกันครับ ถ้าคุณเอาข้อมูลที่ผิดๆ ลำเอียง หรือมั่วๆ ไปป้อนให้มันเรียน มันก็จะเรียนของผิดๆ นั้นมาเต็มๆ แล้วเอามาทายผิดให้คุณอย่างมั่นใจ เครื่องมันไม่ได้ฉลาดพอจะรู้ว่า “เอ๊ะ ข้อมูลที่ป้อนมานี่มันมั่วนะ” หรอกครับ มันเชื่อทุกอย่างที่คุณป้อนให้

ผมขอยกตัวอย่างธุรกิจสมมติให้เห็นภาพชัดๆ (ย้ำว่าเป็นตัวอย่าง สมมติ ที่ผมแต่งขึ้นเองนะครับ ไม่ใช่เคสจริงของใคร) — ลองนึกภาพร้านค้าแห่งหนึ่งอยากทำระบบ AI ไว้ทำนายว่าเดือนหน้าจะขายของได้เท่าไหร่ จะได้สั่งสต็อกถูก แต่ดันเอาข้อมูลยอดขายปีที่แล้วที่บันทึกไว้ผิดๆ (พนักงานคีย์เลขสลับ บางเดือนลืมบันทึก) ไปป้อนให้มันเรียน — ผลคือเครื่องก็ทำนายมั่วตามข้อมูลมั่วๆ นั้น เจ้าของร้านสั่งของผิดจนของล้นสต็อกหรือของขาด ทั้งที่จ่ายเงินซื้อระบบ AI มาแพงๆ

เห็นไหมครับว่าปัญหาไม่ได้อยู่ที่ตัว AI โง่ แต่อยู่ที่ “อาหาร” ที่เราป้อนให้มันมันไม่ดีตั้งแต่ต้น นี่คือเหตุผลที่ในโลกจริงคนทำงานสาย AI เขาบอกว่าใช้เวลาส่วนใหญ่ไปกับการ “เก็บกวาดทำความสะอาดข้อมูล” มากกว่าตัวการสร้าง AI เองด้วยซ้ำ เพราะข้อมูลดีคือครึ่งนึงของความสำเร็จไปแล้ว

ข้อมูลที่ “ลำเอียง” — กับดักที่มองไม่เห็นด้วยตา#

มีอีกเรื่องของข้อมูลที่ผมอยากเตือนไว้หน่อย เพราะมันร้ายตรงที่มันแอบเนียน คือเรื่อง ข้อมูลลำเอียง (วงการเรียก bias — อ่านว่า ไบแอส แปลว่า “ความเอนเอียง/ไม่สมดุล”)

ลองนึกภาพแบบนี้ครับ สมมติคุณอยากสอนเครื่องให้รู้จัก “ลูกค้าที่จะกลับมาซื้อซ้ำ” แต่ข้อมูลเก่าที่คุณมีดันเป็นข้อมูลของลูกค้าในกรุงเทพฯ ล้วนๆ ไม่มีลูกค้าต่างจังหวัดเลยสักคน เครื่องก็จะเรียนรู้แต่พฤติกรรมแบบคนกรุงเทพฯ พอเอาไปทายลูกค้าต่างจังหวัดที่พฤติกรรมต่างกัน มันก็ทายเพี้ยนหมด ทั้งที่ข้อมูลคุณ “ถูกต้อง” ทุกตัวเลขนะครับ ไม่มีอะไรผิดเลย แต่มัน เอียง ไปทางด้านเดียว เลยทำให้เครื่องมองโลกแคบตามไปด้วย

นี่คือสิ่งที่อันตรายกว่าข้อมูลผิดเสียอีก เพราะข้อมูลผิดเรายังพอจับได้ว่า “เอ๊ะ ตัวเลขนี้มันแปลกๆ” แต่ข้อมูลที่ถูกต้องทุกตัวแต่เอียงไปด้านเดียวเนี่ย มันดูสะอาดเรียบร้อยจนเราไม่เอะใจ กว่าจะรู้ตัวก็ตอนที่เครื่องทายพลาดในโลกจริงไปแล้ว เปรียบเหมือนเราติวเด็กด้วยโจทย์ที่ถูกหมดทุกข้อ แต่ดันเป็นโจทย์บทเดียวซ้ำๆ พอข้อสอบจริงออกบทอื่นบ้าง เด็กก็ไปไม่เป็น

เยอะไว้ก่อนดีไหม? — ไม่เสมอไปครับ#

อีกความเข้าใจผิดที่เจอบ่อยคือ “งั้นก็โยนข้อมูลให้มันเยอะๆ ไว้ก่อนสิ ยิ่งเยอะยิ่งดี” — จริงอยู่ว่าข้อมูลน้อยเกินไปไม่ดีแน่ๆ แต่ข้อมูลเยอะแบบมั่วๆ ก็ไม่ได้ช่วยอะไรครับ มันเหมือนติวเด็กด้วยกองหนังสือสูงเป็นภูเขา แต่ครึ่งนึงเป็นหนังสือที่เนื้อหาผิดหรือไม่เกี่ยวกับวิชาที่สอบเลย — เด็กก็เสียเวลาอ่านของไม่มีประโยชน์ แถมอาจจำของผิดมาด้วย

หัวใจมันอยู่ที่ “ข้อมูลที่เกี่ยวข้องและถูกต้อง” ครับ ไม่ใช่แค่ “เยอะ” เฉยๆ ข้อมูลที่ตรงประเด็น สะอาด และครอบคลุมหลายๆ สถานการณ์จริง สำคัญกว่าข้อมูลกองโตที่เต็มไปด้วยขยะ เก็บไว้เป็นหลักคิดง่ายๆ ได้เลยครับว่า “ข้อมูลที่ดีชนะข้อมูลที่เยอะ”

💡 มุมเจ้าของกิจการ: ก่อนจะฝันถึงการเอา AI มาช่วยธุรกิจ ลองหันกลับมาดูบ้านตัวเองก่อนครับว่า “ข้อมูลในร้านเราเรียบร้อยแค่ไหน” — ยอดขายบันทึกครบไหม ข้อมูลลูกค้ากระจัดกระจายอยู่หลายที่หรือเปล่า ตัวเลขในระบบตรงกับความจริงไหม เพราะต่อให้ AI เก่งแค่ไหน ถ้าข้อมูลคุณรกๆ มั่วๆ มันก็ช่วยอะไรไม่ได้มาก การจัดบ้านข้อมูลให้เรียบร้อยก่อน คือการลงทุนที่คุ้มที่สุดและทำได้เลยวันนี้โดยยังไม่ต้องควักเงินซื้อ AI ด้วยซ้ำ

เครื่องมัน “เรียน” ได้กี่แบบ — เล่าพอให้เห็นภาพ#

ทีนี้บางคนอาจสงสัยว่า แล้วตอนติวเครื่องเนี่ย มันมีวิธีติวแบบเดียวเลยเหรอ? จริงๆ มันมีหลายสไตล์ครับ แต่ผมจะเล่าแค่ภาพกว้างๆ พอให้เห็นว่าโลกมันกว้างกว่าที่คิด ไม่ต้องจำชื่อเป๊ะๆ นะครับ เดี๋ยวปวดหัวเปล่าๆ

ลองนึกถึงวิธีสอนคนสามแบบนี้ดูครับ

แบบที่หนึ่ง — สอนแบบมีเฉลยให้ดู เหมือนติวเด็กด้วยโจทย์ที่มีเฉลยกำกับทุกข้อ “นี่หมานะ นี่แมวนะ” แบบที่เราเล่ากันมาทั้งตอนนี้แหละครับ เป็นแบบที่ใช้กันเยอะที่สุดและเข้าใจง่ายที่สุด ในงานธุรกิจก็เช่น เอาประวัติลูกค้าที่ “เคยจ่ายตรงเวลา” กับ “เคยเบี้ยว” มาติดป้ายให้เครื่องดู แล้วให้มันเรียนรู้ว่าลูกค้าหน้าใหม่คนนี้น่าจะอยู่กลุ่มไหน — คือมีเฉลยจากของจริงในอดีตให้มันดูเทียบ

แบบที่สอง — ปล่อยให้หาเอง โดยไม่มีเฉลย อันนี้เหมือนคุณเทกองรูปสัตว์ปนๆ กันให้เครื่องดู โดยไม่บอกเลยว่าตัวไหนคืออะไร แล้วบอกแค่ว่า “ลองจัดกลุ่มให้หน่อยสิ ตัวไหนคล้ายๆ กันก็จับไว้กองเดียวกัน” เครื่องก็จะค่อยๆ แยกเองว่า “เออ พวกนี้หน้าตาคล้ายกัน น่าจะพวกเดียวกัน” โดยที่ไม่รู้ด้วยซ้ำว่าแต่ละกองชื่ออะไร แบบนี้มีประโยชน์เวลาเรามีข้อมูลกองโตแต่ไม่มีเวลามานั่งติดป้ายเฉลยทุกอัน เช่นเอาไว้แบ่งกลุ่มลูกค้าว่าใครพฤติกรรมคล้ายใคร — บางทีมันอาจจัดกลุ่มออกมาแล้วเราถึงเพิ่งเห็นเองว่า “อ้าว ร้านเรามีลูกค้าซ่อนอยู่กลุ่มนึงที่เราไม่เคยสังเกตเลยนี่นา” ซึ่งมีค่ามากในเชิงการตลาด

แบบที่สาม — เรียนจากการลองผิดลองถูก อันนี้เหมือนฝึกสุนัขให้นั่งครับ ทำถูกได้ขนม ทำผิดไม่ได้ขนม ทำไปเรื่อยๆ มันก็จับทางได้เองว่าต้องทำยังไงถึงจะได้รางวัล แบบนี้มักเอาไปใช้สอนพวก AI เล่นเกม หรือควบคุมหุ่นยนต์ให้เดินได้ คือลองไปเรื่อยๆ อันไหนดีก็ทำต่อ อันไหนแย่ก็เลิกทำ ข้อดีคือมันค้นเจอวิธีเก่งๆ ที่บางทีคนเราก็คิดไม่ถึง เพราะมันยอมลองมั่วๆ เป็นล้านรอบจนเจอทางที่ดีที่สุด ซึ่งเป็นอะไรที่คนไม่มีเวลาทำ

จะเห็นว่าทั้งสามแบบมีหัวใจเดียวกันเป๊ะครับ คือ “เรียนจากตัวอย่าง/ประสบการณ์ ไม่ใช่จากกฎที่คนป้อน” ต่างกันแค่วิธีติว — บางทีมีเฉลยให้ บางทีต้องหาเอง บางทีลองผิดลองถูกเอารางวัลล่อ ผมเล่าแค่นี้พอครับ ไม่ต้องจำชื่ออะไรเลย แค่รู้ว่า “มันมีหลายสไตล์ แต่แก่นเหมือนกัน” ก็พอแล้ว

ลองเดินตามเรื่องสมมติหนึ่งเรื่องตั้งแต่ต้นจนจบ#

พูดทฤษฎีมาเยอะแล้ว ผมขอยกตัวอย่างธุรกิจสมมติให้เห็นภาพการเดินทางของทั้งกระบวนการตั้งแต่ต้นจนจบสักหนึ่งเรื่องนะครับ (ย้ำว่าเป็นตัวอย่าง สมมติ ที่ผมแต่งขึ้นเองทั้งหมด ไม่ใช่เคสจริงของใคร และตัวเลขที่ใส่ก็เป็นเลขสมมติเพื่อให้เห็นภาพเท่านั้น)

ลองนึกภาพร้านอาหารตามสั่งเจ้าหนึ่งที่เปิดมาหลายปี เจ้าของเริ่มเซ็งกับปัญหาเดิมๆ คือ “ทำกับข้าวเผื่อไว้เท่าไหร่ดี” — ทำเยอะไปก็เหลือทิ้ง ขาดทุนค่าวัตถุดิบ ทำน้อยไปก็ขายไม่ทัน ลูกค้าหงุดหงิด เจ้าของเลยอยากลองให้ระบบช่วยทายว่าวันพรุ่งนี้น่าจะขายดีแค่ไหน จะได้เตรียมของถูก

ขั้นแรก — รวบรวมข้อมูล (อาหารของเครื่อง) เจ้าของก็ไปขุดข้อมูลเก่ามา เช่นยอดขายย้อนหลังของแต่ละวัน วันนั้นเป็นวันธรรมดาหรือเสาร์อาทิตย์ ฝนตกหรือแดดออก เป็นวันสิ้นเดือนที่คนเพิ่งได้เงินเดือนไหม มีเทศกาลอะไรไหม — ข้อมูลพวกนี้แหละครับคือ “ตัวอย่างพร้อมเฉลย” เพราะแต่ละวันในอดีตเรารู้ทั้งสถานการณ์ (ฝนตก/วันหยุด) และเฉลย (วันนั้นขายได้เท่าไหร่จริงๆ)

ขั้นสอง — เอาไปติว (training) เครื่องก็เอาข้อมูลเป็นร้อยๆ วันนี้มาดูซ้ำๆ ค่อยๆ จับรูปแบบเอง เช่น “อ้อ วันเสาร์อาทิตย์ฝนไม่ตกมักขายดี… วันธรรมดาฝนตกหนักคนไม่ค่อยออกมาซื้อ… ช่วงสิ้นเดือนยอดพุ่ง” มันค่อยๆ หมุนปุ่มในสมองตัวเองจนทายวันเก่าๆ ได้ใกล้เคียงของจริง พอติวจบก็ได้ model หรือ “สมองทายยอดขาย” มาก้อนนึง

ขั้นสาม — เอามาใช้จริง (inference) ทีนี้พอถึงเย็นวันนี้ เจ้าของก็บอกเครื่องว่า “พรุ่งนี้วันเสาร์ พยากรณ์ว่าแดดออก ไม่ใช่สิ้นเดือน” เครื่องก็เอารูปแบบที่จับได้มาทายให้เลยว่า “พรุ่งนี้น่าจะขายได้ราวๆ เท่านี้ (สมมติ) เตรียมของระดับกลางๆ ค่อนไปทางเยอะหน่อย” เจ้าของก็เตรียมวัตถุดิบตามนั้น — เร็วทันใจ ไม่ต้องเดาเอาเองด้วยสัญชาตญาณล้วนๆ อีกต่อไป

และนี่คือจุดที่ทุกอย่างในตอนนี้มาบรรจบกันพอดีครับ ถ้าเจ้าของร้านบันทึกข้อมูลเก่ามาแบบมั่วๆ (บางวันลืมจด ตัวเลขผิด) เครื่องก็ทายมั่วตามไปเลย (garbage in, garbage out) ถ้าข้อมูลมีแต่หน้าฝนไม่มีหน้าแล้งเลย เครื่องก็จะเอียง (bias) ทายหน้าแล้งไม่แม่น แล้วต่อให้ทายวันเก่าๆ ได้เป๊ะแค่ไหน สิ่งที่เจ้าของอยากได้จริงๆ คือมันต้องทาย วันพรุ่งนี้ที่ยังไม่เคยเกิดขึ้น ให้แม่น (generalization) ไม่ใช่แค่ท่องจำอดีต เห็นไหมครับว่าทุกศัพท์ที่เราคุยกันมา มันโผล่มาอยู่ในเรื่องเดียวกันหมดเลย

”แล้วร้านเล็กๆ อย่างเราต้องมีข้อมูลเยอะขนาดไหนถึงจะเริ่มได้”#

คำถามนี้ผมว่าหลายคนคิดในใจอยู่แน่ๆ ครับ พออ่านมาถึงตรงนี้แล้วรู้ว่า “ข้อมูลคืออาหาร” ก็คงกังวลว่า “โห ร้านเราเล็กนิดเดียว ข้อมูลก็มีนิดหน่อย คงเล่นกับ AI ไม่ได้หรอก” — ผมอยากให้คลายกังวลนิดนึงครับ

อย่างแรก เรื่องนี้มันแล้วแต่งานครับ งานบางอย่างต้องการตัวอย่างมหาศาลจริงๆ (พวกที่ต้องเข้าใจภาพหรือภาษาแบบลึกๆ) แต่งานง่ายๆ ในร้านหลายอย่างใช้ข้อมูลไม่เยอะก็พอเห็นผล อย่างเรื่องทายยอดขายในตัวอย่างเมื่อกี้ ข้อมูลย้อนหลังสักพักก็เริ่มทำอะไรได้บ้างแล้ว ไม่ได้ต้องรอเป็นล้านรายการ

อย่างที่สอง และอันนี้สำคัญกว่า — ทุกวันนี้เจ้าของกิจการตัวเล็กส่วนใหญ่ไม่ได้ไปนั่ง “ติว model เอง” หรอกครับ เราไปใช้ AI ที่คนอื่นเขาติวมาเสร็จแล้ว (เหมือนตอนเราใช้ ChatGPT — เราไม่ได้ติวมันเอง) เราแค่หยิบ “สมองที่ฝึกเสร็จ” ของเขามาใช้กับงานเรา ฉะนั้นในหลายกรณีคุณไม่จำเป็นต้องมีข้อมูลกองโตของตัวเองตั้งแต่วันแรกก็เริ่มได้

แต่ — และผมขอวกกลับมาเน้นอีกที — ถึงจะใช้ของที่คนอื่นติวมา ถ้าวันไหนคุณอยากให้มันเก่งเรื่อง “ร้านคุณโดยเฉพาะ” (เช่นเข้าใจลูกค้าของคุณ เข้าใจสินค้าของคุณ) สุดท้ายมันก็ต้องกลับมากินข้อมูลของร้านคุณอยู่ดี ฉะนั้นการเริ่ม เก็บข้อมูลให้เป็นระเบียบตั้งแต่วันนี้ ไม่ว่าจะยอดขาย พฤติกรรมลูกค้า หรือคำถามที่ลูกค้าถามบ่อยๆ คือการลงทุนที่ไม่เสียเปล่าเลยครับ เพราะวันที่คุณพร้อมจะใช้ AI จริงจัง คุณจะมี “อาหารชั้นดี” รออยู่แล้ว ไม่ต้องมานั่งเริ่มจากศูนย์

ลองเอาทุกอย่างมาร้อยเป็นเรื่องเดียว#

เผื่อใครอ่านยาวมาแล้วเริ่มงงๆ ผมขอม้วนทั้งตอนกลับมาเล่าใหม่เป็นเรื่องเดียวสั้นๆ ด้วยอุปมาฝึกพนักงานใหม่ ซึ่งผมว่าเข้ากับเจ้าของกิจการที่สุดแล้วครับ

ลองนึกภาพว่าคุณรับพนักงานใหม่เข้ามาคนนึงครับ วันแรกเขายังทำอะไรไม่เป็นเลย คุณก็เอา ตัวอย่างงานเก่าๆ ที่ทำถูกต้องมาให้เขาดูเยอะๆ ให้เขาลองทำแล้วคอยบอกว่าตรงไหนถูกตรงไหนผิด — นี่คือช่วง training (ติว/ฝึก) ยิ่งคุณมีตัวอย่างงานดีๆ ให้เขาดูมากเท่าไหร่ และตัวอย่างนั้น ถูกต้องเรียบร้อย แค่ไหน เขาก็ยิ่งเก่งเร็วและแม่นเท่านั้น — นี่คือเรื่องของข้อมูล ที่ทั้งปริมาณและคุณภาพสำคัญ

พอฝึกไปสักพักจนเขาจับทางงานได้ ในหัวเขาก็มี “ความเชี่ยวชาญ” ก้อนนึงติดตัว — นี่คือ model (สมองที่ฝึกเสร็จ) ทีนี้พอมีงานใหม่เข้ามาที่เขาไม่เคยเจอเป๊ะๆ มาก่อน เขาก็เอาประสบการณ์ที่สะสมมาจัดการได้เลยโดยไม่ต้องถามคุณทุกครั้ง — นี่คือช่วง inference (เอาความรู้มาใช้ทายงานจริง)

และเหมือนพนักงานทุกคนแหละครับ บางทีเขาก็เดางานพลาดได้เหมือนกัน โดยเฉพาะถ้าเจองานพิลึกที่ไม่เคยอยู่ในตัวอย่างที่เคยฝึกมาเลย หรือถ้าตอนฝึกคุณดันสอนของผิดๆ ให้เขา — เขาก็จะทำผิดตามนั้นอย่างมั่นใจ ทั้งที่ตั้งใจทำงานเต็มที่

เห็นไหมครับว่าจริงๆ แล้วเรื่อง ML ทั้งหมดที่ฟังดูน่ากลัว มันก็แค่เรื่อง “ฝึกพนักงานใหม่จากตัวอย่างเยอะๆ แล้วปล่อยให้เขาทำงานเอง” เท่านั้นเอง แค่เปลี่ยนจากคนเป็นเครื่อง และเครื่องมันดูตัวอย่างได้เป็นล้านๆ อันในเวลาสั้นๆ ที่คนทำไม่ได้ก็เท่านั้น

สรุปสั้นๆ ส่งท้าย#

ถ้าให้ผมย่อทั้งตอนนี้เหลือไม่กี่บรรทัดเอาไว้จำง่ายๆ คือแบบนี้ครับ —

  • Machine Learning (ML) = แทนที่จะให้คนป้อนกฎทุกข้อ เราให้เครื่อง ดูตัวอย่างเยอะๆ แล้วจับรูปแบบเอง (เหมือนเด็กรู้จักหมาเองจากการเห็นหมาหลายตัว)
  • เรื่องนี้มีแค่ 2 ช่วง คือ train (เรียน) เหมือนติวก่อนสอบ ทำทีเดียวกินแรงเยอะ กับ inference (ใช้/ทาย) เหมือนเข้าห้องสอบจริง ทำซ้ำทุกครั้งที่ใช้งาน ตอบเร็ว
  • ของที่ได้หลังเรียนจบเรียกว่า model — เปรียบเป็น “สมองที่ฝึกเสร็จแล้ว”
  • ข้อมูล (data) คืออาหารของ ML — ไม่มีข้อมูล เครื่องก็เรียนไม่ได้ และที่สำคัญไม่แพ้ปริมาณคือ คุณภาพ เพราะ “ป้อนขยะเข้าไป ก็ได้ขยะออกมา”
  • AI ที่ทายพลาดได้บางครั้ง เพราะลึกๆ มันทำงานด้วยการ “เดาว่าอะไรน่าจะใช่” ไม่ใช่กฎตายตัวเป๊ะ

ผมไม่ใช่ผู้เชี่ยวชาญด้าน AI อะไรหรอกนะครับ เป็นแค่เจ้าของกิจการคนนึงที่พยายามเปิดฝาดูว่าเจ้าของพวกนี้มันทำงานยังไง แล้วก็อยากเล่าให้เพื่อนๆ ฟังแบบภาษาคนๆ ตรงไหนผมเข้าใจคลาดเคลื่อนไป ทักท้วงกันเข้ามาได้เลยนะครับ ยินดีมากๆ

ตอนหน้าของซีรีส์ AI 101 พอเรารู้แล้วว่าเครื่องมัน “เรียนจากข้อมูล” ผมว่าจะชวนคุยต่อเรื่องที่หลายคนน่าจะค้างคาใจ — แล้วเจ้าก้อน “สมอง” ที่ฝึกเสร็จเนี่ย จริงๆ ข้างในมันหน้าตาเป็นยังไง ทำไมเราถึงชอบได้ยินคำว่า “โครงข่ายประสาท” ที่ฟังดูเหมือนสมองคน มันเกี่ยวกับสมองเราจริงๆ ไหม ไว้เจอกันตอนหน้าครับ