1341 คำ
7 นาที
AI 101 EP.06 — Neural Network ภาษาคน — neuron, layer, weight, ทำไมเรียกว่า "deep"
สารบัญ
เริ่มจากคำถามที่ผมโดนถามบ่อยมาก ก่อนอื่น — สมองเราตัดสินใจเรื่องง่ายๆ ยังไง ทีนี้มาดู “เทียม” บ้าง — neuron เทียมมันก็เลียนแบบไอเดียนี้ คำว่า “weight” ตัวสำคัญที่สุด — และอย่าเพิ่งคิดเรื่องอื่น neuron ตัวเดียวมันโง่ — ความเก่งมาจากการ “ต่อกันเป็นชั้น” input / hidden / output — สามชั้นที่ต้องรู้จัก ”เส้นเชื่อม” ระหว่าง neuron — และทำไม weight ถึงเยอะมหาศาล ลองเดินดูทีละสเต็ป — neuron หนึ่งตัวคิดยังไง (ฉบับตัวเลขสมมติ) แล้วคำว่า “deep” ที่ได้ยินบ่อยๆ มันคืออะไร ลองร้อยทุกคำเข้าด้วยกัน ในฉากเดียว เอ๊ะ แล้วเจ้านี่มันโผล่อยู่ตรงไหนในชีวิตเราบ้าง ”เลียนแบบสมองคน” — เหมือนแค่ไหนกันแน่ (อย่าเพิ่งตื่นเต้นเกิน) เคลียร์ความเข้าใจผิดที่เจอบ่อย สรุปสั้นๆ ส่งท้าย

AI 101 — ปัญญาประดิษฐ์ฉบับภาษาคน · Part 1 (เบื้องหลัง: AI ทำงานยังไง) ซีรีส์นี้ผมเขียนให้เจ้าของกิจการกับคนทำงานทั่วไปที่ไม่ใช่สาย IT อ่านสนุกๆ แต่ได้ของกลับไป ภาคนี้เราจะแอบเปิดฝาดูว่า “ข้างใน” AI มันทำงานยังไงกันแน่ แบบไม่ต้องกลัวศัพท์ ตอนนี้เป็นเรื่อง “โครงข่ายประสาทเทียม (Neural Network) ภาษาคน” — คำที่ฟังดูน่ากลัวที่สุดในวงการ AI แต่จริงๆ แล้วไอเดียมันบ้านๆ กว่าที่คิดเยอะ (สารบัญเต็มของซีรีส์จะตามมาทีหลังนะครับ)

เริ่มจากคำถามที่ผมโดนถามบ่อยมาก#

ลองนึกภาพฉากนี้ดูครับ — สมมติว่าในวงข้าวเย็นกับเพื่อนเจ้าของกิจการด้วยกัน มีคนนึงเปิดประเด็นขึ้นมาว่า “เฮ้ย ได้ยินว่าเดี๋ยวนี้ AI มันเลียนแบบสมองคนนะ มันมีเส้นประสาทเทียมข้างในเหมือนเราเลย” แล้วทั้งโต๊ะก็พยักหน้าหงึกๆ ทำหน้าเหมือนเข้าใจ ทั้งที่ในใจทุกคนคิดเหมือนกันว่า ”…เออ มันเลียนแบบยังไงวะ”

ผมเชื่อว่าหลายคนเคยเจอฉากประมาณนี้ครับ คำว่า “โครงข่ายประสาทเทียม” (Neural Network หรือที่อ่านกันว่า นิวรอล เน็ตเวิร์ก) มันถูกพูดถึงบ่อยมากเวลาคนเล่าเรื่อง AI แต่พอถามต่อว่ามันคืออะไร ส่วนใหญ่ก็จะได้คำตอบลอยๆ ว่า “ก็มันเหมือนสมองคนไง” แล้วก็จบแค่นั้น ไม่มีใครเล่าต่อได้ว่าแล้วมัน “เหมือน” ยังไง

ตอนนี้ผมเลยจะลองทำสิ่งที่ตามหามานานตอนเริ่มศึกษาเรื่องนี้ใหม่ๆ คือเปิดฝากล่องดำใบนี้ออกมาดูข้างใน แล้วเล่าให้ฟังแบบภาษาคน ไม่มีสูตรคณิตศาสตร์สักตัว มีแต่อุปมาบ้านๆ ที่ใช้ทำความเข้าใจเอง พออ่านจบ ผมว่าคุณจะเลิกกลัวคำนี้ไปเลย แล้วจะเห็นว่าไอเดียเบื้องหลังมันเรียบง่ายจนน่าตกใจ

มาเริ่มกันเลย

ก่อนอื่น — สมองเราตัดสินใจเรื่องง่ายๆ ยังไง#

ก่อนจะไปเรื่อง “เทียม” ผมอยากให้เราเข้าใจของจริงก่อนนิดนึงครับ คือสมองคนเรา

ลองนึกภาพว่าสมองเราเต็มไปด้วยเซลล์เล็กๆ จำนวนมหาศาล เซลล์พวกนี้เขาเรียกว่า เซลล์ประสาท หรือ neuron (นิวรอน) หน้าที่ของมันบ้านๆ มากครับ คือ “รับสัญญาณเข้ามา แล้วตัดสินใจว่าจะส่งสัญญาณต่อไปไหม” เท่านั้นเอง

ผมจะยกตัวอย่างสมมติแบบเห็นภาพ ลองนึกถึงตอนเราตัดสินใจว่า “วันนี้จะพกร่มออกจากบ้านไหม” ดูครับ ในหัวเราไม่ได้ใช้สัญญาณเดียวตัดสินใจใช่ไหม เราจะเอาหลายๆ อย่างมาชั่งน้ำหนักรวมกัน เช่น

  • เมื่อเช้าฟ้ามืดครึ้มแค่ไหน
  • เมื่อวานฝนตกหรือเปล่า
  • วันนี้ต้องเดินกลางแจ้งเยอะไหม
  • พกร่มแล้วมันเกะกะกระเป๋าหรือเปล่า

แต่ละอย่างมัน “ดันให้เราตัดสินใจ” ไม่เท่ากันใช่ไหมครับ เรื่อง “ฟ้ามืดครึ้ม” เนี่ยมันสำคัญมากในการตัดสินใจ ส่วนเรื่อง “ร่มเกะกะกระเป๋า” มันก็มีผลแต่นิดเดียว พอเอาทุกอย่างมารวมกันแล้วชั่งดู ถ้าน้ำหนักโดยรวมมันถึงจุดนึง สมองเราก็จะ “ตัดสินใจ” ว่า — เอาวะ พกร่มดีกว่า

นี่แหละครับคือหัวใจการทำงานของ neuron หนึ่งตัว มัน รับหลายๆ อย่างเข้ามา ให้น้ำหนักความสำคัญแต่ละอย่างไม่เท่ากัน รวมแล้วชั่งดู ถ้าถึงจุดก็ส่งสัญญาณว่า “ใช่/เอา” ออกไป จำภาพนี้ไว้ให้ดีนะครับ เพราะของเทียมที่เรากำลังจะคุยกัน มันก็ลอกไอเดียนี้มาตรงๆ เลย

ผมขอย้ำจุดนึงที่คนชอบเข้าใจผิดนะครับ คือ neuron มันไม่ได้ตอบว่า “ใช่” หรือ “ไม่ใช่” แบบขาวกับดำเป๊ะๆ เสมอไป จริงๆ แล้วมันออกมาเป็น “ระดับความมั่นใจ” มากกว่า เหมือนตอนเราตัดสินใจพกร่มนั่นแหละครับ บางวันเราก็มั่นใจเต็มร้อยว่าฝนตกแน่ คว้าร่มไปเลยไม่ลังเล แต่บางวันมันก็ก้ำกึ่ง “เอ่อ จะตกไม่ตกดีนะ” แล้วเราก็พกไปแบบครึ่งใจ เจ้า neuron เทียมมันก็มีอารมณ์ “ก้ำกึ่ง” แบบนี้ได้เหมือนกัน มันส่งออกมาได้ว่า “ค่อนข้างใช่” หรือ “ใช่นิดหน่อย” ไม่จำเป็นต้องฟันธงสุดโต่ง จุดนี้สำคัญ เพราะมันคือเหตุผลที่ทำให้ทั้งระบบมันยืดหยุ่นพอจะจัดการกับเรื่องคลุมเครือในโลกจริงได้ (ไม่เหมือน automation ที่เราคุยกันตอนก่อนๆ ที่มันต้องเป๊ะขาวดำอย่างเดียว)

ทีนี้มาดู “เทียม” บ้าง — neuron เทียมมันก็เลียนแบบไอเดียนี้#

พอนักวิทยาศาสตร์เขาอยากให้คอมพิวเตอร์ “ตัดสินใจเป็น” บ้าง เขาก็เลยลองสร้างของเลียนแบบ neuron ของเราขึ้นมา เรียกว่า neuron เทียม (บางทีก็เรียก node ซึ่งก็แปลว่า “จุด” เฉยๆ)

หน้าตามันไม่มีอะไรลึกลับเลยครับ มันก็คือเจ้ากล่องเล็กๆ ที่ทำงานเหมือนที่เราคุยกันเมื่อกี๊เป๊ะ —

  1. รับตัวเลขเข้ามาหลายๆ ค่า (เหมือนรับ “ฟ้ามืดแค่ไหน” “เมื่อวานฝนตกไหม” ฯลฯ)
  2. คูณแต่ละค่าด้วยน้ำหนักความสำคัญของมัน (อันไหนสำคัญมากก็คูณเยอะ อันไหนสำคัญน้อยก็คูณนิดเดียว)
  3. รวมทุกอย่างเข้าด้วยกัน แล้วชั่งดูว่าถึงจุดที่ควรส่งต่อไหม
  4. ถ้าถึงก็ “จุดติด” ส่งสัญญาณออกไป ถ้าไม่ถึงก็เงียบไว้

เห็นไหมครับว่ามันคือ “การตัดสินใจเรื่องพกร่ม” แบบเดียวกันเป๊ะ แค่เปลี่ยนจากในหัวเราไปอยู่ในคอมพิวเตอร์เท่านั้นเอง ไม่มีเวทมนตร์อะไรเลย neuron เทียมหนึ่งตัวมันก็แค่เครื่องชั่งน้ำหนักเล็กๆ ที่ตัดสินใจเรื่องง่ายๆ ได้เรื่องเดียว

💡 มุมเจ้าของกิจการ: เวลาได้ยินว่า AI มันมี “เส้นประสาทเทียม” อย่าเพิ่งตกใจว่ามันใกล้เคียงมนุษย์นะครับ neuron เทียมหนึ่งตัวมันโง่กว่าแมลงวันอีก มันทำได้แค่ชั่งตัวเลขกับตัดสินใจครั้งเดียวเท่านั้น ความฉลาดของ AI ไม่ได้มาจาก neuron ตัวเดียว แต่มาจากการเอามันมาต่อกัน “เยอะๆ” ต่างหาก (เดี๋ยวเราจะเล่าต่อ)

แล้วทำไมต้องไปลอกเลียนสมองคนด้วยล่ะ? ทำไมไม่เขียนกฎเป๊ะๆ ให้คอมทำตามไปเลยแบบ automation? ผมว่าตรงนี้เป็นคำถามที่ดีมากครับ คำตอบคือ มันมีงานบางอย่างที่ “เขียนกฎออกมาเป็นข้อๆ ไม่ได้” ไงครับ

ลองนึกดูเล่นๆ ครับ ถ้าผมให้คุณเขียนกฎอธิบายว่า “หน้าแมวมีลักษณะยังไง” ให้คนที่ไม่เคยเห็นแมวมาก่อนเข้าใจ คุณจะเขียนยังไง? “มีหูสองข้าง” — หมาก็มี “มีหนวด” — แมวน้ำก็มี “ตัวมีขน สี่ขา หางยาว” — สุนัขจิ้งจอกก็เข้าข่าย ยิ่งเขียนกฎ ยิ่งเจอข้อยกเว้นเต็มไปหมด สุดท้ายเขียนเป็นร้อยข้อก็ยังไม่ครอบคลุม แต่ถ้าผมเอารูปแมวจริงๆ ให้คุณดูสักห้าหกรูป คุณก็จำได้แล้วว่าแมวหน้าตายังไง ทั้งที่อธิบายเป็นกฎออกมาเป็นคำพูดไม่ได้ด้วยซ้ำ นี่แหละครับ เรื่องที่สมองคนเก่งแต่กฎตายตัวทำไม่ได้ เลยเป็นเหตุผลว่าทำไมเราถึงไปลอกวิธีทำงานแบบ “ดูตัวอย่างเยอะๆ แล้วจำรูปแบบเอา” ของสมองมาใช้นั่นเอง

คำว่า “weight” ตัวสำคัญที่สุด — และอย่าเพิ่งคิดเรื่องอื่น#

ตรงนี้ผมขอหยุดเน้นคำๆ นึงเป็นพิเศษ เพราะมันคือหัวใจของทั้งเรื่อง คำว่า weight

พอแปลเป็นไทยว่า “weight” หลายคนจะนึกถึง “น้ำหนัก” แบบชั่งกิโล หรือไม่ก็นึกไปถึง “น้ำหนักคะแนน” แบบที่ครูเคยบอกว่าข้อสอบวิชานี้คิดเป็นกี่เปอร์เซ็นต์ ลืมภาพพวกนั้นไปก่อนเลยครับ ในโลก AI คำว่า weight ไม่ได้เกี่ยวอะไรกับการสอบหรือการชั่งกิโลเลย

ในเรื่องของเรา weight แปลว่า “น้ำหนักความสำคัญ” ครับ มันคือตัวเลขที่บอกว่า “สัญญาณที่วิ่งเข้ามาเส้นนี้ สำคัญมากหรือสำคัญน้อย”

กลับไปที่ฉากพกร่มสมมติเมื่อกี๊นะครับ —

  • เรื่อง “ฟ้ามืดครึ้มแค่ไหน” → weight สูง (สำคัญมากต่อการตัดสินใจ)
  • เรื่อง “ร่มเกะกะกระเป๋าไหม” → weight ต่ำ (มีผลแต่นิดเดียว)

นี่แหละครับคือ weight มันก็คือ “ระดับความสำคัญ” ที่เราให้กับแต่ละข้อมูลที่วิ่งเข้ามานั่นเอง

ทีนี้จุดที่มหัศจรรย์จริงๆ และเป็นสิ่งที่ทำให้ AI ฉลาดขึ้นได้ คือ — ตอนแรก AI มันไม่รู้หรอกครับว่าอะไรควรสำคัญมากสำคัญน้อย มันมั่ว weight ขึ้นมาก่อนแบบสุ่มๆ แล้วค่อยๆ ปรับให้ถูกระหว่างที่มันฝึก

ผมจะยกตัวอย่างสมมติให้เห็นภาพ ลองนึกว่าเราจ้างเด็กฝึกงานใหม่มาคนนึง วันแรกเราสั่งให้เขาคัดว่าอีเมลไหนเป็นสแปม (ขยะ) อีเมลไหนเป็นของจริง วันแรกเขาไม่รู้อะไรเลยใช่ไหมครับ เขาก็เดามั่วๆ ไป บางทีเห็นอีเมลมีคำว่า “ฟรี” ก็คิดว่าน่าจะเป็นสแปม บางทีเห็นชื่อยาวๆ ก็คิดว่าน่าจะของจริง เดาผิดเดาถูกปนกันไป

แต่พอเราคอยบอกเขาว่า “อันนี้ผิดนะ อันนี้ถูกแล้ว” ทุกวันๆ เด็กคนนี้ก็จะค่อยๆ ปรับความเชื่อในหัวเอง เริ่มรู้ว่า “อ๋อ คำว่าฟรีอย่างเดียวไม่ได้แปลว่าสแปมเสมอไป แต่ถ้ามีคำว่าฟรี + ลิงก์แปลกๆ + เร่งให้กดด่วน — อันนี้สแปมแน่” พอเวลาผ่านไป เขาก็เก่งขึ้นเรื่อยๆ

การที่เด็กคนนี้ค่อยๆ ปรับว่า “อะไรควรให้ความสำคัญมากน้อย” นั่นแหละครับคือการปรับ weight AI มันก็ทำแบบนี้เป๊ะ ตอนเราเรียกว่า “การเทรน AI” หรือ “การฝึก AI” จริงๆ แล้วเบื้องหลังมันคือการที่ระบบค่อยๆ ปรับตัวเลข weight พวกนี้ทีละนิดๆ ให้เดาแม่นขึ้นเรื่อยๆ นั่นเองครับ ไม่มีอะไรมากไปกว่านี้

💡 มุมเจ้าของกิจการ: เวลา vendor บอกว่า “ระบบเราเทรนมาด้วยข้อมูลมหาศาล” สิ่งที่เขากำลังพูดถึงจริงๆ ก็คือ “เราป้อนตัวอย่างเยอะๆ ให้มันค่อยๆ ปรับ weight จนเดาแม่น” นั่นแหละครับ และนี่คือเหตุผลว่าทำไม “ข้อมูลที่ใช้ฝึก” ถึงสำคัญมาก — ถ้าข้อมูลที่ป้อนมันเอียงหรือไม่ตรงกับงานจริงของคุณ weight ที่ได้ก็จะเพี้ยนตาม เหมือนเด็กฝึกงานที่ถูกสอนผิดมาตั้งแต่ต้น

neuron ตัวเดียวมันโง่ — ความเก่งมาจากการ “ต่อกันเป็นชั้น”#

ทีนี้มาถึงจุดที่สนุกแล้วครับ

อย่างที่บอกไปว่า neuron เทียมตัวเดียวมันทำได้แค่ตัดสินใจเรื่องเล็กๆ เรื่องเดียว มันโง่มาก แล้วมันมาฉลาดได้ยังไง? คำตอบคือ — เขาเอามันมาต่อกันเป็นชั้นๆ ครับ ภาษาอังกฤษเรียกชั้นว่า layer

ผมจะอุปมาให้ฟังแบบนี้นะครับ ลองนึกภาพว่าคุณเดินเข้าไปสมัครงานในบริษัทใหญ่แห่งหนึ่ง (เป็นฉากสมมตินะครับ) แล้วใบสมัครของคุณต้องผ่านการพิจารณาเป็นชั้นๆ —

ชั้นแรก — แผนกรับเรื่อง: พนักงานหลายคนช่วยกันอ่านใบสมัครของคุณ แต่ละคนดูแค่เรื่องเล็กๆ คนละจุด คนนึงดูแค่ “จบจากที่ไหน” อีกคนดูแค่ “เคยทำงานกี่ปี” อีกคนดูแค่ “เขียนภาษาอังกฤษได้ไหม” — แต่ละคนดูจุดเดียวง่ายๆ ของตัวเอง แล้วให้ความเห็นออกมา

ชั้นที่สอง — หัวหน้าแผนก: พวกเขาไม่ได้อ่านใบสมัครเองหรอกครับ แต่เขา รับความเห็นจากชั้นแรกมารวมกัน แล้วประเมินภาพที่ใหญ่ขึ้น เช่น “คนนี้ประสบการณ์ + ภาษา ดูเข้าท่านะ น่าจะเหมาะกับงานขายต่างประเทศ”

ชั้นสุดท้าย — ผู้บริหาร: ก็เอาความเห็นจากหัวหน้าแผนกทั้งหลายมาชั่ง แล้วสรุปออกมาเป็นคำตอบเดียวว่า — รับ หรือ ไม่รับ

เห็นภาพไหมครับ? พนักงานแต่ละคนในชั้นแรกมันโง่มาก ดูเป็นเรื่องๆ เล็กๆ แต่พอ ส่งผลการคิดต่อกันไปเรื่อยๆ จากชั้นนึงไปอีกชั้นนึง ภาพรวมที่ออกมามันฉลาดขึ้นเรื่อยๆ จนตัดสินใจเรื่องยากๆ ได้ในที่สุด

โครงข่ายประสาทเทียมมันทำงานแบบนี้เป๊ะเลยครับ มันคือ neuron เทียมโง่ๆ จำนวนเยอะๆ ที่จัดเรียงเป็นชั้นๆ แล้วส่งผลการคิดต่อกันไปข้างหน้า ทีละชั้นๆ จนได้คำตอบ

input / hidden / output — สามชั้นที่ต้องรู้จัก#

ทีนี้ในโครงข่ายประสาทเทียมมันแบ่งชั้นออกเป็น 3 ประเภทหลักๆ ครับ ผมจะเทียบกับฉากบริษัทเมื่อกี๊ให้เห็นชัดๆ

ชั้น (layer)หน้าที่บ้านๆเทียบกับฉากสมัครงานสมมติ
input layer (ชั้นรับข้อมูลเข้า)ประตูทางเข้า รับข้อมูลดิบที่เราป้อนให้”ใบสมัคร” ที่ยื่นเข้าไป ข้อมูลดิบล้วนๆ ยังไม่มีใครคิดอะไร
hidden layer (ชั้นซ่อน / ชั้นคิดงาน)ชั้นที่อยู่ตรงกลาง ทำงานคิด-ประมวลผลจริงๆ”พนักงาน + หัวหน้าแผนก” ที่ช่วยกันอ่าน ช่วยกันประเมิน เป็นชั้นๆ
output layer (ชั้นส่งคำตอบออก)ชั้นสุดท้าย สรุปออกมาเป็นคำตอบ”ผู้บริหาร” ที่เคาะคำตอบสุดท้ายว่า รับ/ไม่รับ

ผมจะขยายแต่ละชั้นให้นิดนึงนะครับ —

input layer — ประตูทางเข้า: ชั้นนี้ไม่ได้คิดอะไรเลย หน้าที่มันคือแค่รับ “ข้อมูลดิบ” เข้ามาแปลงให้อยู่ในรูปที่ระบบเอาไปใช้ต่อได้ ลองนึกภาพว่าถ้าเราอยากให้ AI ดูรูปแมวว่าเป็นแมวจริงไหม input layer มันก็คือชั้นที่รับ “รูปภาพ” เข้ามานั่นแหละครับ ยังไม่ได้ตัดสินอะไรทั้งนั้น แค่เปิดประตูรับของเข้า

hidden layer — ชั้นที่ทำงานจริง (และเป็นพระเอกของเรื่อง): ชั้นนี้คือที่ที่ความฉลาดทั้งหมดเกิดขึ้น เขาเรียกว่า “ชั้นซ่อน” (hidden) เพราะมันอยู่ตรงกลาง เราไม่ได้ยุ่งกับมันโดยตรง เราแค่ป้อนของเข้าทางหน้า แล้วรอรับคำตอบทางหลัง ส่วนที่มันคิดอะไรอยู่ตรงกลางเรามองไม่เห็น (นี่แหละครับเหตุผลนึงที่คนชอบเรียก AI ว่า “กล่องดำ” — เพราะชั้นที่มันคิดงานจริงๆ มันซ่อนอยู่ข้างใน)

ในฉากดูรูปแมว ชั้นซ่อนชั้นแรกๆ อาจจะคิดเรื่องเล็กๆ แค่ว่า “ตรงนี้มีเส้นขอบไหม” “ตรงนี้สีตัดกันไหม” พอส่งต่อไปชั้นถัดไปก็เริ่มประกอบร่างเป็นเรื่องใหญ่ขึ้น “อันนี้น่าจะเป็นหู” “อันนี้น่าจะเป็นหนวด” พอส่งต่อไปอีกชั้นก็ “เออ มีหูแหลม + หนวด + ตากลม รวมกันแล้วน่าจะเป็นแมว” — ค่อยๆ ไต่จากเรื่องเล็กไปเรื่องใหญ่ทีละชั้นๆ

ผมอยากขยายภาพ “การไต่ทีละชั้น” ตรงนี้ให้ชัดอีกหน่อย เพราะมันเป็นหัวใจที่ทำให้คนร้องอ๋อกันเยอะ ลองดูเป็นตารางว่าถ้าเราส่งรูปแมวเข้าไป แต่ละชั้นมันจะ “เห็น” อะไรไล่กันขึ้นมา (เป็นภาพอธิบายแบบง่ายๆ นะครับ ของจริงไม่ได้แบ่งหน้าที่เป็นข้อๆ สวยงามขนาดนี้ แต่ทิศทางมันประมาณนี้) —

ชั้นที่มันเริ่ม “เห็น” อะไรเทียบกับสายตาคน
ชั้นต้นๆจุดสี เส้นขอบ มุมมืด-สว่าง ดิบๆเหมือนตอนเราเหลือบเห็นแวบแรก ยังไม่รู้ว่าอะไร
ชั้นกลางๆเริ่มประกอบเป็นรูปทรง — วงกลม เส้นโค้ง ปื้นขน”เอ๊ะ มีอะไรกลมๆ มีอะไรเป็นปุย”
ชั้นค่อนปลายประกอบเป็นส่วนประกอบ — นี่หู นี่ตา นี่หนวด”อันนี้น่าจะหู อันนี้น่าจะหนวดนะ”
ชั้นสุดท้ายรวมทุกส่วนแล้วสรุป — หูแหลม + หนวด + ตากลม = แมว”อ๋อ แมวนี่เอง!”

เห็นไหมครับว่ามันไล่จาก “ของดิบๆ ที่ไม่มีความหมาย” ขึ้นไปเป็น “ความหมายที่เราเข้าใจได้” ทีละขั้น เหมือนตอนเราค่อยๆ เพ่งมองอะไรในที่มืดสลัวแล้วภาพมันค่อยๆ ชัดขึ้นนั่นแหละครับ — แต่ละชั้นช่วยทำให้ชัดขึ้นอีกนิดนึง

output layer — ชั้นสรุปคำตอบ: ชั้นสุดท้ายที่เคาะออกมาเป็นคำตอบให้เราเห็น เช่น “นี่คือแมว 90 ขีด”, “นี่คือหมา 10 ขีด” (ขอย้ำว่าตัวเลขนี้ผมยกเป็นตัวอย่าง สมมติ ให้เห็นภาพนะครับ ไม่ใช่ค่าจริงจากระบบไหน) แล้วเราก็เอาคำตอบนั้นไปใช้ต่อ

ลองดูภาพการไหลของข้อมูลแบบง่ายๆ นะครับ —

ข้อมูลดิบ → [ input layer ] → [ hidden layer ] → [ hidden layer ] → [ output layer ] → คำตอบ
(รูปแมว) ประตูรับเข้า เริ่มเห็นเส้นขอบ เริ่มเห็นหู/หนวด เคาะว่า "แมว!"

ข้อมูลมันไหลจากซ้ายไปขวา ผ่านมือ neuron เป็นชั้นๆ แต่ละชั้นช่วยกันคิดต่อยอดจากชั้นก่อนหน้า จนได้คำตอบที่ปลายทาง — นี่แหละครับคือ “โครงข่ายประสาทเทียม” ทั้งหมดทั้งมวล

”เส้นเชื่อม” ระหว่าง neuron — และทำไม weight ถึงเยอะมหาศาล#

ตรงนี้ผมขอเติมอีกนิดให้ภาพมันสมบูรณ์ เพราะมันจะช่วยให้เข้าใจคำว่า weight ลึกขึ้น และเข้าใจว่าทำไม “การฝึก AI” ถึงกินเวลาและกินพลังมากนัก

กลับไปที่ฉากบริษัทสมมตินะครับ neuron แต่ละตัว (พนักงานแต่ละคน) มันไม่ได้ลอยอยู่เดี่ยวๆ ใช่ไหม มันต้อง “ส่งความเห็นต่อ” ให้คนในชั้นถัดไป การส่งต่อนี้แหละครับที่เรียกว่า เส้นเชื่อม (ฝรั่งเรียก connection) ลองนึกภาพเส้นด้ายที่โยงพนักงานชั้นแรกทุกคน ไปหาหัวหน้าแผนกทุกคนในชั้นถัดไป โยงกันเต็มไปหมด

แล้วประเด็นสำคัญคือ — weight (น้ำหนักความสำคัญ) มันไม่ได้อยู่ที่ตัว neuron แต่มันอยู่ที่ “เส้นเชื่อม” แต่ละเส้นต่างหาก พูดอีกแบบคือ เส้นด้ายแต่ละเส้นมันมี “ความหนา” ไม่เท่ากัน เส้นไหนหนา (weight สูง) แปลว่า “ความเห็นที่ส่งผ่านเส้นนี้ ให้น้ำหนักเยอะนะ ฟังให้ดี” เส้นไหนบาง (weight ต่ำ) แปลว่า “ความเห็นนี้ฟังหูไว้หูพอ ไม่ต้องซีเรียส”

ทีนี้ลองคิดเล่นๆ นะครับ ถ้าชั้นแรกมีพนักงาน 10 คน ชั้นถัดไปมีหัวหน้า 10 คน แล้วทุกคนในชั้นแรกต้องโยงเส้นไปหาทุกคนในชั้นถัดไป — นั่นคือ 10 คูณ 10 = เส้นด้าย 100 เส้นแล้วครับ และแต่ละเส้นก็มี weight ของตัวเองที่ต้องปรับให้ถูก (ขอย้ำว่าตัวเลข 10 กับ 100 นี้ผมยกเป็นตัวอย่าง สมมติ ง่ายๆ ให้เห็นภาพเฉยๆ นะครับ ของจริงไม่ได้เป๊ะแบบนี้)

แล้วนี่แค่สองชั้นนะครับ ของจริงที่เป็น deep มันมีหลายชั้น และแต่ละชั้นมี neuron เยอะกว่านี้มากมาย จำนวนเส้นด้าย (และ weight ที่ต้องปรับ) เลยพุ่งขึ้นไปเป็นจำนวนมหาศาลจนนึกภาพแทบไม่ออก นี่แหละครับคือเหตุผลว่าทำไม “การฝึก AI” ถึงต้องใช้คอมพิวเตอร์แรงๆ และกินไฟกินเวลา — เพราะมันต้องนั่งปรับน้ำหนักของเส้นด้ายเป็นล้านๆ เส้นให้ลงตัวพร้อมกัน ไม่ใช่ปรับแค่สองสามตัว

💡 มุมเจ้าของกิจการ: ตรงนี้ช่วยอธิบายว่าทำไมการ “เทรน AI ขึ้นมาเองตั้งแต่ศูนย์” ถึงแพงและกินทรัพยากรมหาศาล (เฉพาะบริษัทใหญ่ๆ เท่านั้นที่ทำไหว) ส่วนเจ้าของกิจการทั่วไปอย่างเราในทางปฏิบัติแทบไม่ต้องไปฝึกเองหรอกครับ เราไปหยิบของที่เขาฝึกมาเรียบร้อยแล้วมาใช้ต่อ (เหมือนเช่าพนักงานที่ผ่านการอบรมมาแล้ว ไม่ต้องเสียเงินส่งไปเรียนเอง) — เดี๋ยวเรื่องนี้ผมจะเล่าละเอียดในตอนหลังๆ ของซีรีส์

ลองเดินดูทีละสเต็ป — neuron หนึ่งตัวคิดยังไง (ฉบับตัวเลขสมมติ)#

เผื่อใครยังนึกภาพ “การชั่งน้ำหนัก” ไม่ออก ผมขอเดินให้ดูทีละสเต็ปด้วยตัวเลขง่ายๆ ครับ — ขอย้ำตัวหนาเลยว่าตัวเลขทั้งหมดต่อจากนี้เป็นตัวอย่างสมมติที่ผมแต่งขึ้นเองล้วนๆ เพื่อให้เห็นกลไก ไม่ใช่ค่าจริงจากระบบไหนทั้งนั้น และของจริงมันซับซ้อนกว่านี้เยอะ ผมแค่ทำให้มันง่ายที่สุดเพื่อให้เห็นหลักการ

สมมติเรามี neuron หนึ่งตัวที่ทำหน้าที่ตัดสินใจว่า “อีเมลฉบับนี้น่าจะเป็นสแปมไหม” มันรับสัญญาณเข้ามา 3 อย่าง —

สัญญาณที่รับเข้ามาเห็นแล้วให้ค่า (สมมติ)weight ความสำคัญ (สมมติ)
มีคำว่า “ฟรี” ในอีเมลไหมมี = 1สำคัญปานกลาง
มีลิงก์แปลกๆ ที่ไม่รู้จักไหมมี = 1สำคัญมาก
มาจากคนที่เราเคยคุยด้วยไหมเคยคุย = 1สำคัญมาก (แต่ดึงไปทาง “ไม่ใช่สแปม”)

ทีนี้ neuron มันก็เอาแต่ละสัญญาณ “คูณกับ weight” ของมัน แล้วบวกรวมกัน —

  • “มีคำว่าฟรี” → ดันคะแนนความเป็นสแปมขึ้นมานิดหน่อย
  • “มีลิงก์แปลกๆ” → ดันคะแนนขึ้นมาเยอะ (เพราะ weight สูง)
  • “มาจากคนที่เคยคุย” → อันนี้กลับ ดึงคะแนนลง เพราะถ้าเป็นคนรู้จัก ก็ไม่น่าใช่สแปม

พอบวกลบทุกอย่างรวมกันแล้ว ถ้าคะแนนสุดท้ายมันสูงเกิน “เส้นแบ่ง” ที่ตั้งไว้ → neuron ก็จุดติด ส่งสัญญาณว่า “อันนี้น่าจะสแปม” ออกไป แต่ถ้าคะแนนรวมยังต่ำกว่าเส้น → มันก็เงียบ บอกว่า “ยังไม่น่าใช่สแปม”

เห็นไหมครับว่าทั้งหมดมันคือการ ชั่งน้ำหนักหลายๆ ปัจจัยแล้วบวกรวมกัน ที่เราทำในหัวทุกวันนั่นเอง ไม่มีอะไรเป็นเวทมนตร์ และที่สำคัญ — เจ้า weight ทั้งสามค่าในตารางข้างบนนี่แหละครับคือสิ่งที่ระบบ “ค่อยๆ ปรับ” ระหว่างฝึก ตอนแรกมันมั่วๆ มา พอฝึกไปเรื่อยๆ มันก็เรียนรู้เองว่า “อ๋อ ลิงก์แปลกๆ นี่สำคัญกว่าคำว่าฟรีนะ” แล้วก็ขยับ weight ให้เหมาะ

แล้วมันรู้ได้ยังไงว่าควรขยับ weight ไปทางไหน? ตรงนี้ผมขออธิบายแบบบ้านๆ พอให้เห็นภาพ (ส่วนกลไกเต็มๆ ขอยกไปเล่าตอนหน้านะครับ เดี๋ยวตอนนี้จะยาวเกิน) — ลองนึกถึงเกมที่เราเคยเล่นตอนเด็กๆ ครับ เกมที่เพื่อนซ่อนของไว้ แล้วเราเดินหา โดยเพื่อนคอยบอกว่า “ร้อนขึ้นๆ” (ใกล้แล้ว) หรือ “เย็นลงๆ” (ห่างแล้ว) เราก็ค่อยๆ ขยับทิศตามคำใบ้จนเจอของในที่สุด

การฝึก AI มันคล้ายเกมนี้เลยครับ ทุกครั้งที่มันเดาคำตอบออกมา ระบบจะเทียบกับเฉลยว่า “เดาห่างจากคำตอบจริงแค่ไหน” ถ้าเดาแล้วยังห่าง (เย็น) มันก็จะรู้ว่าต้องขยับ weight ไปอีกทาง ถ้าเดาแล้วใกล้ขึ้น (ร้อนขึ้น) ก็ขยับไปทางนั้นต่อ ทำซ้ำแบบนี้เป็นล้านๆ รอบ weight ทุกตัวก็ค่อยๆ เข้าที่เข้าทางจนเดาแม่น — เหมือนเราค่อยๆ เดินเข้าใกล้ของที่ซ่อนไว้ตามคำใบ้ร้อน-เย็นนั่นแหละครับ

แล้วคำว่า “deep” ที่ได้ยินบ่อยๆ มันคืออะไร#

มาถึงคำสุดท้ายที่ผมอยากเคลียร์ให้ชัด เพราะมันโผล่มาในชื่อเทคโนโลยีที่เราได้ยินบ่อยที่สุดอย่าง deep learning (แปลตรงตัวว่า “การเรียนรู้เชิงลึก”) เคยสงสัยไหมครับว่ามันลึกตรงไหน ลึกเหมือนปรัชญาลึกซึ้งหรือเปล่า?

คำตอบบ้านๆ มากครับ คำว่า “deep” มันแปลว่า “มี hidden layer (ชั้นซ่อน) ซ้อนกันหลายๆ ชั้น” เท่านั้นเอง ไม่ได้แปลว่าลึกซึ้งทางความคิดอะไรเลย มันลึกในแง่ “มีชั้นเยอะ ซ้อนกันลงไปลึก” แบบที่เรานับชั้นตึกนั่นแหละ

ลองเทียบกันแบบนี้นะครับ —

แบบจำนวน hidden layerเทียบกับการตัดสินใจ
โครงข่ายแบบตื้น (ธรรมดา)มีชั้นซ่อนน้อย (อาจแค่ชั้นเดียว)เหมือนตัดสินใจเรื่องง่ายๆ ไม่กี่สเต็ป
โครงข่ายแบบลึก (deep)มีชั้นซ่อนเยอะ ซ้อนกันหลายชั้นเหมือนเรื่องยากที่ต้องคิดต่อยอดหลายทอด

ทำไมต้องมีหลายชั้น? กลับไปที่ฉากดูรูปแมวครับ ถ้ามีแค่ชั้นเดียว มันจะไต่จาก “จุดสีกับเส้นขอบดิบๆ” กระโดดไปเป็น “นี่คือแมว” เลย — มันยากเกินไปสำหรับชั้นเดียว เหมือนให้เด็ก ป.1 อ่านโจทย์เลขแล้วตอบคำตอบสุดท้ายเลยโดยไม่ให้ทดอะไรเลย มันทำไม่ได้

แต่พอมีหลายชั้น มันก็ค่อยๆ ไต่ทีละขั้น — ชั้นแรกดูเส้นขอบ ชั้นต่อมาประกอบเป็นรูปทรง ชั้นต่อมาประกอบเป็นหู เป็นหนวด ชั้นต่อมาถึงสรุปว่าแมว เหมือนการ “ทด” เลขทีละขั้นนั่นแหละครับ ยิ่งเรื่องยากซับซ้อนเท่าไหร่ ก็ยิ่งต้องการชั้นเยอะขึ้นเท่านั้น

ฉะนั้นเวลาได้ยินคำว่า “deep learning” ให้แปลในใจง่ายๆ ว่า “โครงข่ายประสาทเทียมที่มีชั้นซ่อนเยอะๆ ซ้อนกันลึกลงไป” เท่านั้นพอครับ มันคือคำเดียวกับที่เราคุยกันมาทั้งตอนนี่แหละ แค่เติมความ “ลึก” (= ชั้นเยอะ) เข้าไป

ผมอยากเสริมอุปมาอีกอันที่ผมชอบมาก เพราะมันช่วยให้เห็นว่าทำไม “ไต่ทีละชั้น” ถึงได้ผลกว่า “กระโดดทีเดียว” ครับ ลองนึกถึงโรงงานทำเฟอร์นิเจอร์สมมติแห่งหนึ่ง — ถ้าจะให้คนคนเดียวเอาท่อนไม้ดิบๆ มา แล้วเสกออกมาเป็นตู้เสื้อผ้าทั้งใบในทีเดียว มันยากมากใช่ไหมครับ แทบเป็นไปไม่ได้เลย แต่ถ้าเราแบ่งเป็นสายงานเป็นชั้นๆ — แผนกแรกแค่เลื่อยไม้เป็นแผ่นๆ แผนกต่อมาขัดให้เรียบ แผนกต่อมาประกอบเป็นชิ้นส่วน แผนกต่อมาประกอบเป็นตู้ แผนกสุดท้ายทาสีเก็บงาน — แต่ละแผนกทำเรื่องเล็กๆ ที่ตัวเองถนัด แล้วส่งงานต่อ สุดท้ายตู้ทั้งใบก็ออกมาสวยงาม

โครงข่ายแบบ deep มันได้เปรียบตรงนี้แหละครับ มันแบ่งงานยากๆ ออกเป็นขั้นเล็กๆ ทีละชั้น ชั้นต้นๆ จัดการเรื่องหยาบๆ ง่ายๆ (เส้น สี ขอบ) ชั้นกลางๆ ประกอบเป็นชิ้นส่วนที่ใหญ่ขึ้น (รูปทรง ส่วนประกอบ) ชั้นปลายๆ ถึงสรุปเป็นภาพรวม (นี่คือแมว นี่คือโดนัท) ยิ่งงานซับซ้อน ก็ยิ่งต้องการ “สายงาน” ที่ยาวขึ้น = ชั้นเยอะขึ้น นั่นเอง

💡 มุมเจ้าของกิจการ: เวลาเจอ vendor พ่นคำว่า “deep learning” ใส่จนดูล้ำ ให้รู้ทันในใจว่ามันไม่ใช่เวทมนตร์ใหม่ มันคือโครงข่ายประสาทเทียมที่มีชั้นเยอะขึ้นเท่านั้นเอง คำถามที่ควรถามกลับไม่ใช่ “ลึกแค่ไหน” แต่เป็น “มันถูกฝึกมากับข้อมูลแบบไหน และเหมาะกับงานของฉันจริงไหม” — ความลึกของชั้นไม่ได้แปลว่าเหมาะกับงานคุณเสมอไปครับ

ลองร้อยทุกคำเข้าด้วยกัน ในฉากเดียว#

เผื่อใครอ่านมาถึงตรงนี้แล้วศัพท์เริ่มตีกันในหัว ผมขอเอาทุกคำมาร้อยในฉากเดียวให้เห็นภาพรวมนะครับ (ฉากสมมติ)

สมมติว่าเราอยากสร้างผู้ช่วย AI ที่ดูรูปขนมที่ลูกค้าถ่ายส่งมา แล้วบอกว่าเป็นขนมชนิดไหน —

  • เราป้อน รูปขนม เข้าทาง input layer (ประตูรับเข้า)
  • รูปนั้นวิ่งเข้าไปเจอ hidden layer หลายๆ ชั้น (เพราะงานนี้ยาก เราเลยใช้แบบ deep — ชั้นเยอะ)
  • ในแต่ละชั้นมี neuron โง่ๆ เยอะแยะ แต่ละตัวดูเรื่องเล็กๆ ของตัวเอง “ตรงนี้สีน้ำตาลไหม” “ตรงนี้มีรูพรุนแบบขนมปังไหม”
  • neuron แต่ละตัวให้ weight (น้ำหนักความสำคัญ) กับสิ่งที่มันเห็นไม่เท่ากัน อันที่บ่งบอกชนิดขนมได้ชัดก็ให้น้ำหนักเยอะ
  • ค่าพวกนี้ไหลผ่านชั้นแล้วชั้นเล่า ค่อยๆ ประกอบภาพใหญ่ขึ้นเรื่อยๆ
  • สุดท้ายมาโผล่ที่ output layer ที่เคาะคำตอบออกมาว่า “นี่คือโดนัท”

แล้วที่มันทำได้แม่นๆ ก็เพราะตอนฝึก เราป้อนรูปขนมตัวอย่างให้มันดูเยอะๆ พร้อมเฉลย แล้วมันค่อยๆ ปรับ weight ของทุก neuron จนเดาแม่นขึ้นเรื่อยๆ — เหมือนเด็กฝึกงานคัดอีเมลสแปมที่เราคุยกันตอนต้นนั่นแหละครับ

ครบทุกคำในตอนนี้แล้ว — neuron, weight, input/hidden/output layer, และ deep — มันร้อยเป็นเรื่องเดียวกันแบบนี้เองครับ

เอ๊ะ แล้วเจ้านี่มันโผล่อยู่ตรงไหนในชีวิตเราบ้าง#

อ่านมาถึงตรงนี้บางคนอาจคิดว่า “เออ เข้าใจแล้วล่ะ แต่มันไกลตัวจัง” — เปล่าเลยครับ จริงๆ แล้วเจ้าโครงข่ายประสาทเทียมที่เราคุยกันมาทั้งตอนเนี่ย มันแอบทำงานอยู่รอบตัวเราทุกวันจนเราไม่ทันสังเกตด้วยซ้ำ ผมขอยกตัวอย่างที่เจ้าของกิจการน่าจะคุ้นๆ (ตัวอย่างทั่วไปนะครับ ไม่ได้เจาะจงยี่ห้อไหน) —

  • ตอนมือถือปลดล็อกด้วยใบหน้าเรา — เบื้องหลังมันคือโครงข่ายที่รับ “รูปหน้า” เข้า input layer แล้วไต่ชั้นไปจนสรุปที่ output ว่า “ใช่เจ้าของไหม” เป๊ะตามที่เราคุยกัน
  • ตอนแอปรูปภาพในมือถือจัดอัลบั้มให้เองว่ารูปไหนเป็นรูปอาหาร รูปไหนเป็นรูปคน — นั่นก็โครงข่ายดูรูปแบบเดียวกับฉากดูรูปแมว/ขนมที่เรายกตัวอย่าง
  • ตอนแอปแชทเดาคำถัดไปที่เราจะพิมพ์ได้ — ก็โครงข่ายที่เรียนรู้รูปแบบภาษาจากข้อความมหาศาล
  • ตอนระบบธนาคารทักว่า “รายการนี้น่าสงสัย” เวลามีการใช้บัตรแปลกๆ — ก็โครงข่ายที่เรียนรู้รูปแบบการใช้จ่ายปกติของเรา แล้วสะดุดเมื่อเจออะไรผิดแผน

จะเห็นว่ามันไม่ใช่ของล้ำในห้องแล็บไกลตัวเลยครับ มันอยู่ในกระเป๋าเราทุกคนมานานแล้ว เราแค่ไม่เคยรู้ว่าข้างในมันคือเจ้า neuron กับ layer ที่เราเพิ่งเปิดฝาดูกันไปนี่เอง

”เลียนแบบสมองคน” — เหมือนแค่ไหนกันแน่ (อย่าเพิ่งตื่นเต้นเกิน)#

ทีนี้กลับมาที่ประโยคชวนขนลุกตอนต้นเรื่อง — “AI มันเลียนแบบสมองคนนะ” ผมอยากชวนคุยตรงนี้หน่อยครับ เพราะมันจริงแค่ “ครึ่งเดียว” และอีกครึ่งที่ไม่จริงนี่แหละที่คนชอบเข้าใจผิดจนกลัวเกินเหตุ

ที่มันจริงคือ — ไอเดียตั้งต้น ของโครงข่ายประสาทเทียมมันได้แรงบันดาลใจมาจากสมองคนจริงๆ ครับ คือไอเดียที่ว่า “เอาหน่วยเล็กๆ โง่ๆ มาต่อกันเยอะๆ แล้วให้มันส่งสัญญาณหากัน” อันนี้ลอกมาจากธรรมชาติของสมองเราตรงๆ

แต่ที่มัน ไม่จริง และคนชอบคิดเกินไปคือ — มันไม่ได้ “เหมือน” สมองคนขนาดนั้น มันเป็นแค่การยืมไอเดียคร่าวๆ มา เหมือนเครื่องบินที่ได้แรงบันดาลใจจากนก แต่เครื่องบินมันก็ไม่ได้กระพือปีก ไม่ได้ออกไข่ ไม่ได้สร้างรัง มันแค่ยืมหลักการ “ปีกทำให้ลอยได้” มาแล้วไปทำในแบบของเครื่องจักรเอง — โครงข่ายประสาทเทียมก็แบบนั้นครับ มันยืมแค่หลักการ “หน่วยเล็กๆ ต่อกันเป็นโครงข่าย” มา แต่ข้างในมันคือคณิตศาสตร์กับตัวเลขล้วนๆ ไม่ได้มีเซลล์ชีวภาพ ไม่ได้มีความรู้สึก ไม่ได้มีความตั้งใจ ไม่ได้ “รู้ตัว” ว่ามันกำลังทำอะไรอยู่เลยแม้แต่นิดเดียว

ผมว่าจุดนี้สำคัญมากสำหรับเจ้าของกิจการนะครับ เพราะเวลาเราได้ยินคำว่า “เลียนสมองมนุษย์” เราชอบเผลอคิดว่ามันมีสติปัญญาแบบคน เข้าใจโลกแบบคน ซึ่งมันไม่ใช่เลย มันแค่เก่งเรื่อง “จับรูปแบบจากตัวเลขมหาศาล” เท่านั้น — เก่งมากในเรื่องนั้นจริง แต่มันไม่ได้ “เข้าใจ” อะไรแบบที่เราเข้าใจ

และพอเข้าใจตรงนี้ มันก็จะอธิบายอีกเรื่องที่ผมเคยเล่าไว้ในซีรีส์นี้ได้พอดี — คือเรื่องที่ว่าทำไม AI ถึง “เดาเก่งแต่ก็มั่วได้” ครับ ในเมื่อหัวใจของมันคือการ “เดาว่าอะไรน่าจะใช่จากรูปแบบที่เคยเห็น” โดยการชั่ง weight ไปมา มันก็เลยไม่ได้มีอะไรการันตีว่าจะถูกเป๊ะ 100% ทุกครั้ง ถ้าเจอของแปลกที่ต่างจากตัวอย่างที่มันเคยฝึกมามากๆ มันก็เดาพลาดได้ — เหมือนเด็กฝึกงานหัวไวที่เดาเก่งมากในเรื่องที่คุ้นเคย แต่พอเจอเคสที่ไม่เคยเห็นเลย ก็อาจตอบมั่นหน้าทั้งที่ผิด ฉะนั้นต่อให้ข้างในมันเป็นโครงข่ายที่ดูล้ำแค่ไหน งานสำคัญที่ห้ามพลาดก็ยังควรมีคนคอยตรวจอยู่ดีครับ

เคลียร์ความเข้าใจผิดที่เจอบ่อย#

ก่อนสรุป ผมขอรวบความเข้าใจผิดที่ผมเจอคนพูดกันบ่อยๆ มาเคลียร์ทีเดียวเลยนะครับ เผื่อช่วยให้ภาพชัดขึ้น

ที่คนชอบเข้าใจว่า…ที่จริงแล้ว…
”ชั้นซ่อน (hidden) แปลว่ามันแอบทำอะไรลับๆ น่ากลัว”hidden แปลว่า “อยู่ตรงกลาง เรามองไม่เห็นตอนมันคิด” เฉยๆ ไม่ได้มีอะไรลึกลับน่ากลัว แค่ชื่อมันชวนเข้าใจผิด
”deep แปลว่าฉลาดลึกซึ้งเหมือนนักปราชญ์”deep แปลว่า “ชั้นเยอะ ซ้อนกันลึก” เฉยๆ เป็นเรื่องจำนวนชั้น ไม่ใช่ความลึกซึ้งทางความคิด
”weight คือคะแนนสอบ / น้ำหนักเป็นกิโล”weight คือ “น้ำหนักความสำคัญ” ของข้อมูลที่วิ่งเข้ามา ไม่เกี่ยวกับการสอบหรือชั่งกิโลใดๆ
”neuron เทียมหนึ่งตัวฉลาดเหมือนเซลล์สมองจริง”neuron เทียมตัวเดียวโง่มาก ทำได้แค่ชั่งตัวเลขแล้วตัดสินใจครั้งเดียว ความเก่งมาจากการต่อกันเยอะๆ
”มันเลียนสมองคน เลยมีความคิด/ความรู้สึกแบบคน”มันยืมแค่ไอเดียโครงสร้างมา ข้างในเป็นตัวเลขล้วนๆ ไม่มีความรู้สึก ไม่รู้ตัวว่ากำลังทำอะไร

สรุปสั้นๆ ส่งท้าย#

ถ้าให้ผมย่อทั้งตอนนี้เหลือไม่กี่บรรทัดเอาไว้จำง่ายๆ คือแบบนี้ครับ —

  • neuron (เทียม) = กล่องเล็กๆ โง่ๆ ที่ทำได้แค่ “รับตัวเลขเข้า ชั่งน้ำหนัก แล้วตัดสินใจส่งต่อ” เหมือนเราตัดสินใจว่าจะพกร่มไหม
  • weight (น้ำหนักความสำคัญ) = ตัวเลขบอกว่า “ข้อมูลแต่ละอย่างสำคัญมากน้อยแค่ไหน” — และการ “ฝึก AI” จริงๆ ก็คือการค่อยๆ ปรับ weight พวกนี้ให้เดาแม่นขึ้น (ย้ำอีกที weight ตัวนี้ไม่เกี่ยวกับน้ำหนักคะแนนสอบหรือชั่งกิโลนะครับ)
  • layer (ชั้น) = เอา neuron โง่ๆ มาจัดเรียงเป็นชั้นๆ แล้วส่งผลการคิดต่อกันไปข้างหน้า มี input (รับเข้า) / hidden (คิดงานจริง) / output (สรุปคำตอบ)
  • deep = แปลว่า “มีชั้นซ่อนเยอะๆ ซ้อนกันลึก” เท่านั้น ไม่ได้ลึกซึ้งทางปรัชญาอะไร
  • ภาพรวม: ความฉลาดของ AI ไม่ได้มาจาก neuron ตัวเดียว แต่มาจากการเอา neuron โง่ๆ มาต่อกันเยอะๆ เป็นชั้นๆ แล้วช่วยกันคิดต่อยอดทีละทอด

ผมไม่ใช่ผู้เชี่ยวชาญด้าน AI อะไรหรอกนะครับ เป็นแค่คนที่เคยกลัวคำว่า “โครงข่ายประสาทเทียม” มากๆ จนต้องนั่งหาทางอุปมาให้ตัวเองเข้าใจ พอเข้าใจแล้วก็เลยอยากเล่าต่อแบบภาษาคน ตรงไหนผมอธิบายคลาดเคลื่อนไป ทักท้วงกันเข้ามาได้เลยครับ ยินดีมากๆ

ตอนหน้าของซีรีส์ AI 101 ภาคเบื้องหลังนี้ ผมอยากเล่าต่อเรื่องที่หลายคนน่าจะค้างคาใจ — ในเมื่อ AI มันแค่ปรับ weight ไปมาเฉยๆ แล้วมันรู้ได้ยังไงว่าปรับไปทางไหนถึงจะ “เดาถูกขึ้น”? เจ้ากระบวนการ “ฝึก” ที่ผมพูดถึงบ่อยๆ ในตอนนี้ จริงๆ แล้วข้างในมันทำยังไง ไว้เจอกันตอนหน้าครับ