686 คำ
3 นาที
AI 101 EP.07 — ตระกูล Neural Network — FNN / RNN / CNN งานไหนใช้ตัวไหน
สารบัญ

AI 101 — ปัญญาประดิษฐ์ฉบับภาษาคน · Part 1 (เบื้องหลัง: AI ทำงานยังไง) ซีรีส์นี้ผมเขียนให้เจ้าของกิจการกับคนทำงานทั่วไปที่ไม่ใช่สาย IT อ่านสนุกๆ แต่ได้ของกลับไปใช้จริง ไม่มีศัพท์ยากๆ ขู่ให้กลัว ตอนนี้เป็นเรื่อง “ตระกูล Neural Network — FNN / CNN / RNN งานไหนใช้ตัวไหน” — เพราะหลายคนพอได้ยินว่า AI ใช้ “โครงข่ายประสาทเทียม” ก็คิดว่ามันมีอยู่แบบเดียว ทั้งที่จริงๆ มันมีหลายชนิด แต่ละชนิดถนัดงานคนละแบบ (สารบัญเต็มของซีรีส์จะตามมาทีหลังนะครับ)

ลองนึกภาพฉากนี้ดูครับ#

สมมติว่ามีเจ้าของกิจการคนหนึ่งไปงานสัมมนาเรื่อง AI มา กลับมาเล่าให้ทีมฟังด้วยความตื่นเต้นว่า “วิทยากรเขาบอกว่า AI สมัยนี้มันใช้ neural network หรือโครงข่ายประสาทเทียมเหมือนสมองคนเลยนะ”

ทีมก็พยักหน้าหงึกๆ ฟังดูเท่ดี จนมีน้องในทีมคนหนึ่งยกมือถามว่า “พี่ครับ แล้วเจ้า AI ที่ตรวจใบหน้าตอนสแกนเข้าออฟฟิศ กับ AI ที่ช่วยร่างอีเมลให้เรา มันใช้ neural network ตัวเดียวกันไหมครับ? เพราะมันก็เรียกเหมือนกันนี่”

เงียบไปแป๊บนึงเลยครับ 555+ เพราะคำถามนี้มันแอบลึกกว่าที่คิด

คำตอบคือ มันใช้คนละตัวกันครับ ถึงจะเรียกรวมๆ ว่า “neural network” เหมือนกัน แต่ข้างในมันมีหลายสายพันธุ์ เหมือนคำว่า “รถ” ที่ครอบคลุมทั้งรถเก๋ง รถบรรทุก รถสปอร์ต รถตู้ เรียกว่ารถเหมือนกันหมดนั่นแหละ แต่คุณคงไม่เอารถสปอร์ตไปขนปูนใช่ไหมครับ

ตอนนี้แหละที่ผมอยากชวนเปิดฝาดูกันเบาๆ ว่าในตระกูล neural network เนี่ย มันมีลูกหลานหลักๆ อยู่ 3 สาย คือ FNN, CNN, RNN แต่ละตัวถนัดงานคนละแบบ พอเข้าใจแล้วเวลามีใครมาเสนอขายของ หรือเราจะเลือกใช้ AI ทำงานอะไรสักอย่าง เราจะมองออกเองว่า “งานแบบนี้ควรใช้เครื่องมือชิ้นไหน” ครับ

ทบทวนนิดนึง — “neural network” คืออะไร (แบบสั้นที่สุด)#

ก่อนจะแยกสายพันธุ์ ผมขอเท้าความสั้นๆ ว่าตัวแม่มันคืออะไรก่อนนะครับ (ใครเคยอ่านตอนก่อนๆ ที่ผมเล่าเรื่องข้างในสมอง AI มาแล้วข้ามย่อหน้านี้ได้เลย)

Neural network (อ่านว่า นิวรอล เน็ตเวิร์ก แปลว่า “โครงข่ายประสาทเทียม”) คือวิธีสร้าง AI แบบหนึ่ง ที่เขาเอาแรงบันดาลใจมาจากสมองคนครับ ในสมองเรามีเซลล์ประสาทเป็นล้านๆ ตัวต่อกันเป็นโครงข่าย ส่งสัญญาณไปมา เขาก็เลยลองสร้างของเลียนแบบขึ้นมาในคอมพิวเตอร์ เป็น “จุดคำนวณ” เล็กๆ เยอะๆ ต่อกันเป็นชั้นๆ

ผมอยากให้นึกภาพง่ายๆ แบบนี้ครับ ลองนึกถึง โรงงานที่มีสายการผลิตหลายชั้น วัตถุดิบ (ข้อมูลดิบ เช่น รูปภาพ หรือข้อความ) ใส่เข้าไปทางต้นสาย แล้วของก็วิ่งผ่านคนงานทีละชั้นๆ แต่ละชั้นช่วยกัน “แต่งของ” ให้ชัดขึ้นเรื่อยๆ จนสุดท้ายออกมาเป็นคำตอบที่ปลายสาย เช่น “รูปนี้คือแมว” หรือ “ประโยคต่อไปน่าจะเป็นคำนี้”

หัวใจของมันคือ มันไม่ได้มีคนมานั่งเขียนกฎให้ว่า “แมวต้องมีหูแหลม มีหนวด” แต่เราเอาตัวอย่างให้มันดูเยอะๆ แล้วมันค่อยๆ จับ pattern (อ่านว่า แพตเทิร์น แปลว่า “รูปแบบ”) เอาเองว่าแมวหน้าตาประมาณไหน นี่คือเสน่ห์ของมันครับ

ทีนี้คำถามคือ ในเมื่อหลักการพื้นฐานเหมือนกัน แล้วทำไมต้องมีหลายสายพันธุ์? คำตอบคือเพราะ ข้อมูลแต่ละแบบมันมีนิสัยไม่เหมือนกัน ครับ รูปภาพมีนิสัยแบบหนึ่ง ข้อความมีนิสัยอีกแบบ ตัวเลขในตารางก็อีกแบบ พอนิสัยข้อมูลต่างกัน เครื่องมือที่เหมาะก็เลยต่างกัน เหมือนช่างที่ต้องเลือกเครื่องมือให้ตรงกับเนื้องานนั่นแหละครับ

อุปมาหลักของตอนนี้ — “กล่องเครื่องมือช่าง”#

ก่อนจะไล่ทีละตัว ผมขอวางอุปมาหลักของตอนนี้ไว้ตรงนี้ก่อนนะครับ เพราะมันจะร้อยทั้งตอนเลย

ลองนึกถึง กล่องเครื่องมือของช่างคนหนึ่ง ครับ ในกล่องมีทั้งค้อน ไขควง เลื่อย ประแจ สว่าน ทุกชิ้นก็คือ “เครื่องมือ” เหมือนกัน ทำจากเหล็กคล้ายๆ กัน แต่คุณคงไม่เอาค้อนไปขันน็อต หรือเอาไขควงไปตอกตะปูใช่ไหมครับ มันไม่ใช่ว่าชิ้นไหนดีกว่าชิ้นไหน แต่มันคือ “ชิ้นไหนเหมาะกับงานไหน” ต่างหาก

ตระกูล neural network ก็เป๊ะแบบนั้นเลยครับ —

  • FNN = เครื่องมือพื้นฐานสารพัดประโยชน์ เหมือนไขควงธรรมดาที่มีติดกล่องทุกบ้าน
  • CNN = เครื่องมือเฉพาะทางสำหรับงาน “ภาพ” เหมือนสว่านที่เกิดมาเพื่อเจาะ
  • RNN = เครื่องมือเฉพาะทางสำหรับงาน “ลำดับ/ข้อความ” เหมือนเลื่อยที่เกิดมาเพื่อตัดของยาวๆ ทีละท่อน

จำภาพนี้ไว้ก่อนนะครับ เดี๋ยวเราไปดูทีละชิ้นกัน

FNN — เครื่องมือพื้นฐานสารพัดประโยชน์#

มาเริ่มที่ตัวพื้นฐานที่สุดก่อนครับ FNN (อ่านว่า เอฟ-เอ็น-เอ็น ย่อมาจาก Feedforward Neural Network แปลแบบบ้านๆ คือ “โครงข่ายที่ส่งข้อมูลไปข้างหน้าทางเดียว”)

ชื่อมันบอกนิสัยมันเลยครับ คำว่า feedforward แปลว่า “ป้อนไปข้างหน้า” คือข้อมูลมันวิ่งทางเดียวจากต้นสายไปปลายสาย ไม่ย้อนกลับ ไม่วน เหมือนสายพานโรงงานที่ผมเล่าไปเมื่อกี้เป๊ะเลย ของใส่เข้าทางซ้าย วิ่งผ่านชั้นต่างๆ ออกคำตอบทางขวา จบ ไม่มีการวกกลับมาดูของเดิม

ผมอยากให้นึกถึง FNN เหมือน เครื่องคัดของง่ายๆ ครับ คุณป้อนข้อมูลชุดหนึ่งเข้าไป มันประมวลผลแล้วให้คำตอบออกมา แต่ละครั้งที่ป้อนเข้าไป มันมองเป็น “เรื่องใหม่” ทุกครั้ง ไม่จำว่าเมื่อกี้คุณป้อนอะไรไป

FNN เหมาะกับงานแบบไหน? เหมาะกับงานที่ข้อมูลมันเป็น “ชุดตัวเลขตายตัว” ไม่ได้มีลำดับก่อนหลังสำคัญ และไม่ได้เป็นรูปภาพที่ต้องดูตำแหน่ง ลองนึกภาพตัวอย่างสมมติแบบนี้ครับ —

สมมติว่าคุณมีข้อมูลลูกค้าเป็นตาราง แต่ละแถวมีอายุ รายได้ จำนวนครั้งที่เคยซื้อ ฯลฯ แล้วคุณอยากให้ AI ทายว่าลูกค้าคนนี้ “มีแนวโน้มจะซื้อซ้ำไหม” — งานแบบนี้ FNN เอาอยู่สบายครับ เพราะมันคือการเอาตัวเลขชุดหนึ่งใส่เข้าไป แล้วให้คำตอบออกมาว่าใช่หรือไม่ใช่ ข้อมูลแต่ละแถวก็เป็นเอกเทศ ไม่เกี่ยวกับแถวก่อนหน้า

พูดง่ายๆ FNN คือ ตัวพื้นฐานของตระกูลนี้ ครับ มันคือไขควงธรรมดาในกล่องเครื่องมือ ใช้งานทั่วๆ ไปได้กว้าง แต่พอเจองานเฉพาะทางหนักๆ อย่าง “รูปภาพ” หรือ “ข้อความยาวๆ” เมื่อไหร่ มันจะเริ่มอืด ทำได้ไม่เก่งเท่าตัวที่ออกแบบมาเพื่องานนั้นโดยเฉพาะ ซึ่งก็คือสองตัวถัดไปที่เรากำลังจะคุยกันนี่แหละครับ

💡 มุมเจ้าของกิจการ: เวลาใครพูดว่า “ใช้ neural network” เฉยๆ โดยไม่บอกชนิด ส่วนใหญ่ภาพในหัวเขามักหมายถึง FNN ตัวพื้นฐานนี่แหละครับ ไม่ผิดอะไร แต่ถ้างานคุณเป็นเรื่องภาพหรือข้อความ ลองถามต่อว่า “แล้วใช้ตัวที่ออกแบบมาเพื่องานภาพ/ข้อความโดยเฉพาะหรือเปล่า” — คำถามนี้ทำให้คนขายรู้เลยว่าคุณไม่ได้มาเล่นๆ

CNN — เครื่องมือที่เกิดมาเพื่องาน “ภาพ”#

มาดูตัวต่อไปที่เก่งเรื่องภาพโดยเฉพาะครับ CNN (อ่านว่า ซี-เอ็น-เอ็น ย่อมาจาก Convolutional Neural Network แปลแบบบ้านๆ คือ “โครงข่ายที่ค่อยๆ กวาดดูภาพทีละส่วน”)

ทำไมเราต้องมีตัวพิเศษสำหรับภาพ? ผมขออธิบายปัญหาก่อนครับ ลองนึกภาพว่ารูปถ่ายหนึ่งใบ ถ้ามองในมุมคอมพิวเตอร์ มันคือตารางจุดสีเล็กๆ (เม็ดสีที่เรียกว่า pixel หรือ “พิกเซล”) เป็นล้านๆ จุด ทีนี้ถ้าเราเอา FNN ตัวพื้นฐานมาดูรูป มันจะมองทุกจุดแยกกันหมดเลย เหมือนคนที่จ้องรูปโดยเอาแว่นขยายส่องดูทีละจุด — มันเลยไม่เห็น “ภาพรวม” ว่าจุดพวกนี้รวมกันเป็นหูแมว เป็นตา เป็นจมูก

CNN แก้ปัญหานี้ด้วยวิธีที่ฉลาดมากครับ คือแทนที่จะมองทีละจุด มันใช้วิธี “เลื่อนกรอบเล็กๆ กวาดดูภาพไปทีละส่วน” เหมือนคุณเอากระดาษเจาะรูสี่เหลี่ยมเล็กๆ แล้วเลื่อนไปทั่วรูป มองทีละหน้าต่าง ทีนี้พอกวาดไปเรื่อยๆ มันก็เริ่มจับได้ว่า “ตรงนี้มีเส้นขอบนะ” “ตรงนี้มีมุมนะ” แล้วชั้นถัดๆ ไปก็เอาเส้นขอบพวกนี้มาประกอบกันเป็น “นี่คือหู” “นี่คือตา” จนสุดท้ายรวมเป็น “อ๋อ นี่คือหน้าแมว”

อุปมาที่ผมชอบคือ มันเหมือน การต่อจิ๊กซอว์ ครับ คุณไม่ได้มองภาพทั้งใบรวดเดียว แต่คุณดูทีละชิ้นเล็กๆ ว่าชิ้นนี้เป็นขอบ ชิ้นนี้เป็นมุม แล้วค่อยๆ ประกอบขึ้นมาเป็นภาพใหญ่ CNN ก็ทำงานแบบนั้นเลยครับ ไล่จากรายละเอียดเล็กๆ ประกอบขึ้นไปเป็นของใหญ่

เพราะวิธีนี้ มันเลยมีจุดเด่นที่สำคัญมากอย่างหนึ่งครับ คือ มันไม่สนว่าของที่จะหาอยู่ตรงไหนในรูป สมมติคุณสอนให้มันรู้จักแมว ไม่ว่าแมวจะอยู่มุมซ้ายบน หรือกลางรูป หรือมุมขวาล่าง มันก็ยังจับได้ เพราะกรอบมันกวาดไปทั่วทั้งรูปอยู่แล้ว นี่คือสาเหตุว่าทำไม CNN ถึงเก่งเรื่องภาพแบบทิ้งห่างตัวอื่น

CNN เหมาะกับงานแบบไหน? ลองนึกตัวอย่างสมมติในธุรกิจดูครับ —

  • ระบบสแกนใบหน้าตอนพนักงานเข้าออฟฟิศ
  • กล้องในโรงงานที่คอยดูว่าสินค้าชิ้นไหนมีตำหนิ ชิ้นไหนปกติ
  • แอปที่ถ่ายรูปใบเสร็จแล้วอ่านตัวเลขออกมาให้
  • ระบบที่ดูรูปสินค้าแล้วจัดหมวดหมู่ให้อัตโนมัติ

เห็นไหมครับว่ามันคืองานที่ “input เป็นภาพ” ทั้งนั้น (input อ่านว่า อินพุต แปลว่า “ข้อมูลที่ป้อนเข้าไป”) ถ้าเจองานที่เกี่ยวกับรูปภาพ กล้อง วิดีโอ ให้นึกถึง CNN ไว้ก่อนเลยครับ มันคือสว่านที่เกิดมาเพื่อเจาะโดยเฉพาะ

RNN — เครื่องมือที่เกิดมาเพื่องาน “ลำดับ” และ “ข้อความ”#

มาถึงตัวสุดท้ายในสามตัวหลัก ที่เก่งเรื่องลำดับและข้อความครับ RNN (อ่านว่า อาร์-เอ็น-เอ็น ย่อมาจาก Recurrent Neural Network แปลแบบบ้านๆ คือ “โครงข่ายที่วนกลับมาจำของเดิมได้”)

จำตอน FNN ได้ไหมครับ ที่ผมบอกว่ามันมองทุกครั้งเป็น “เรื่องใหม่” ไม่จำว่าเมื่อกี้ป้อนอะไรไป นั่นแหละคือปัญหาใหญ่เวลาเจองานที่ “ลำดับมันสำคัญ”

ผมยกตัวอย่างให้เห็นภาพชัดๆ ครับ ลองนึกถึงประโยคนี้ “วันนี้อากาศดีมาก เลยตัดสินใจออกไป____” คำที่หายไปคืออะไร? คุณเดาได้ใช่ไหมครับ ว่าน่าจะเป็น “เดินเล่น” หรือ “วิ่ง” อะไรประมาณนี้ ที่คุณเดาได้เพราะคุณ จำคำก่อนหน้าทั้งหมด แล้วเอามาปะติดปะต่อ ถ้าผมตัดให้เหลือแค่คำว่า “ออกไป” คำเดียวลอยๆ คุณก็เดาไม่ถูกหรอกครับ ว่าจะออกไปทำอะไร

RNN ถูกออกแบบมาให้ “จำของเดิม” ได้ครับ คำว่า recurrent แปลว่า “วนซ้ำ” คือพอมันอ่านคำหนึ่ง มันจะจดโน้ตย่อๆ ไว้ในใจว่า “ตอนนี้เรื่องราวมาถึงไหนแล้ว” แล้วพออ่านคำต่อไป มันก็เอาโน้ตอันเดิมมาประกอบด้วย ไม่ได้มองคำใหม่โดดๆ เหมือนมีความทรงจำติดตัวไปเรื่อยๆ ระหว่างอ่าน

อุปมาแบบบ้านๆ ของผมคือ มันเหมือน คนอ่านนิยายทีละบรรทัด ครับ คุณอ่านบรรทัดที่ 50 ได้เข้าใจ เพราะคุณจำเรื่องตั้งแต่บรรทัดที่ 1 มาได้ ตัวละครนี้เป็นใคร เกิดอะไรขึ้นมาก่อนหน้า ถ้าจู่ๆ ผมโยนบรรทัดที่ 50 ให้คุณอ่านโดยไม่ให้อ่าน 49 บรรทัดก่อนหน้า คุณก็งงสิครับ FNN กับ CNN มันงงแบบนั้นแหละเวลาเจอข้อความยาวๆ แต่ RNN ไม่งง เพราะมันจำมาตลอดทาง

RNN เหมาะกับงานแบบไหน? งานที่ “ลำดับก่อนหลังมีความหมาย” ครับ ลองนึกตัวอย่างสมมติดู —

  • ข้อความ/ประโยค (คำก่อนหน้าเปลี่ยนความหมายคำถัดไป)
  • เสียงพูด (เสียงมันมาเป็นลำดับตามเวลา)
  • ยอดขายรายวันที่เรียงตามวันที่ แล้วอยากให้ทายแนวโน้มวันถัดไป
  • ข้อมูลอะไรก็ตามที่ “เรียงตามเวลา” แล้วของก่อนหน้ามีผลกับของถัดไป

ถ้าเจองานที่เกี่ยวกับ “ภาษา” “เสียง” หรือ “ข้อมูลที่เรียงตามเวลา” ให้นึกถึงตระกูล RNN ไว้ก่อนครับ มันคือเลื่อยที่เกิดมาเพื่อตัดของยาวๆ ทีละท่อนตามลำดับ

💡 มุมเจ้าของกิจการ: มีเกร็ดเล็กๆ ที่อยากบอกไว้ครับ — เจ้า AI สายแชตที่เราใช้คุยกันทุกวันนี้ (พวกที่ร่างอีเมล สรุปเอกสารให้) มันพัฒนาต่อยอดมาจากแนวคิด “จำลำดับของข้อความ” แบบ RNN นี่แหละครับ เพียงแต่รุ่นใหม่ๆ เขาเปลี่ยนไปใช้เทคนิคที่เก่งกว่าและจำได้ยาวกว่า (ชื่อมันว่า Transformer — เดี๋ยวตอนหลังๆ ผมจะเล่าให้ฟัง) แต่ “หัวใจ” ที่ว่างานภาษา = ต้องเข้าใจลำดับ ยังเป็นเรื่องเดียวกันครับ

ตารางสรุป — เทียบสามตัวให้เห็นภาพรวด#

เอาล่ะ ถึงตรงนี้ผมเดาว่าหลายคนเริ่มเห็นภาพแล้ว ผมขอเอาทั้งสามตัวมาวางเทียบกันในตารางเดียว จะได้เห็นชัดๆ ว่าใครเก่งอะไร (ตัวอย่างในตารางเป็นตัวอย่าง สมมติ ที่ผมแต่งขึ้นเองเพื่อให้เห็นภาพนะครับ)

FNNCNNRNN
ชื่อเต็มแปลบ้านๆส่งข้อมูลไปข้างหน้าทางเดียวกวาดดูภาพทีละส่วนวนกลับมาจำของเดิมได้
ถนัดข้อมูลแบบตัวเลขเป็นชุดๆ (ตาราง)รูปภาพ / วิดีโอข้อความ / เสียง / ของที่เรียงตามเวลา
ความสามารถเด่นพื้นฐานสารพัดประโยชน์จับ “ของในภาพ” ได้ไม่ว่าอยู่มุมไหนจำลำดับก่อนหน้าได้
งานสมมติที่เหมาะทายว่าลูกค้าจะซื้อซ้ำไหมจากข้อมูลในตารางสแกนใบหน้า / ตรวจสินค้าตำหนิจากกล้องเข้าใจประโยค / ทายยอดขายวันถัดไป
เปรียบเป็นเครื่องมือช่างไขควงธรรมดา (มีติดทุกกล่อง)สว่าน (เกิดมาเพื่อเจาะ)เลื่อย (เกิดมาเพื่อตัดของยาวตามลำดับ)

อยากให้สังเกตบรรทัดสุดท้ายเป็นพิเศษครับ ไม่มีตัวไหน “ดีที่สุด” หรอก มีแต่ตัวที่ “เหมาะกับงานที่สุด” เท่านั้น เอาสว่านไปตัดไม้ก็ได้อยู่หรอก แต่มันทรมานและได้งานห่วย จะเอา CNN ไปทำงานข้อความก็พอได้ แต่มันจะอืดและไม่เก่งเท่า RNN เพราะมันไม่ได้ถูกสร้างมาเพื่องานนั้น

แล้วในชีวิตจริงเราต้องเลือกเองไหม?#

อ่านมาถึงตรงนี้ บางคนอาจจะเริ่มกังวลว่า “โอ๊ย แล้วฉันต้องมานั่งจำว่างานไหนใช้ตัวไหนด้วยเหรอ” ใจเย็นครับ ผมมีข่าวดี

ในความเป็นจริง เจ้าของกิจการอย่างเราแทบไม่ต้องเลือกเองเลยครับ เพราะนี่เป็นงานของวิศวกรหรือคนทำระบบ AI ที่เขาจะเลือกเครื่องมือให้เหมาะกับงาน เหมือนเวลาคุณจ้างช่างมาทำบ้าน คุณไม่ต้องไปบอกช่างว่า “ตรงนี้ใช้สว่านนะ ตรงนั้นใช้ค้อนนะ” ช่างเขารู้ของเขาเองอยู่แล้ว

แล้วผมเล่าเรื่องนี้ไปทำไม? เพราะผมอยากให้คุณ “เห็นภาพว่ามันมีเครื่องมือหลายชิ้น” มากกว่าให้จำชื่อครับ พอคุณรู้ว่ามันมีเครื่องมือเฉพาะทางอยู่ ประโยชน์มันจะตามมาเองสามอย่าง —

หนึ่ง — คุยกับทีมหรือ vendor ได้รู้เรื่องขึ้น เวลาเขาพูดว่า “งานนี้เราใช้ CNN เพราะเป็นเรื่องภาพ” คุณจะ “อ๋อ” ตามได้ ไม่ใช่ฟังแล้วพยักหน้าหงึกๆ ทั้งที่ไม่เข้าใจ

สอง — จับพิรุธได้ สมมติมีคนมาเสนอว่า “ระบบเราใช้ AI วิเคราะห์ภาพสินค้าให้” แต่พอถามลึกๆ กลับใช้เครื่องมือที่ไม่ได้ออกแบบมาเพื่อภาพเลย นั่นก็อาจเป็นสัญญาณว่าเขายังไม่ได้ทำการบ้านมาดีพอ

สาม — เข้าใจว่าทำไมบางงาน AI ทำได้ดี บางงานทำได้แย่ เพราะมันขึ้นอยู่กับว่าเอาเครื่องมือถูกชิ้นมาทำหรือเปล่า ไม่ใช่ว่า “AI โง่” หรือ “AI ฉลาด” แบบเหมารวม

พูดง่ายๆ ครับ คุณไม่ต้องเป็นช่างเอง แต่ถ้าคุณรู้ว่ากล่องเครื่องมือมีอะไรบ้าง คุณจะเป็น “เจ้าของบ้านที่คุยกับช่างรู้เรื่อง” ซึ่งมีค่ามากครับ

สรุปสั้นๆ ส่งท้าย#

ถ้าให้ผมย่อทั้งเรื่องนี้เหลือไม่กี่บรรทัดเอาไว้จำง่ายๆ คือแบบนี้ครับ —

  • Neural network ไม่ได้มีแบบเดียว — มันเป็นตระกูลที่มีหลายสายพันธุ์ เหมือนคำว่า “รถ” ที่มีทั้งเก๋ง บรรทุก สปอร์ต
  • FNN = ตัวพื้นฐานสารพัดประโยชน์ เหมาะกับข้อมูลตัวเลขเป็นชุดๆ (เหมือนไขควงธรรมดา)
  • CNN = เกิดมาเพื่องาน “ภาพ” จับของในรูปได้ไม่ว่าอยู่มุมไหน (เหมือนสว่าน)
  • RNN = เกิดมาเพื่องาน “ลำดับ/ข้อความ/เวลา” เพราะมันจำของก่อนหน้าได้ (เหมือนเลื่อย)
  • หัวใจคือ “เลือกเครื่องมือให้ตรงงาน” ไม่มีตัวไหนดีที่สุด มีแต่ตัวที่เหมาะที่สุดกับงานตรงหน้า
  • เราไม่ต้องเลือกเอง แต่พอรู้ว่ามีเครื่องมือหลายชิ้น เราจะคุยกับช่างรู้เรื่อง จับพิรุธได้ และไม่โดนป้ายยาง่ายๆ

ผมไม่ใช่ผู้เชี่ยวชาญด้าน AI อะไรหรอกนะครับ เป็นแค่เจ้าของกิจการคนหนึ่งที่อยากเข้าใจว่าของพวกนี้มันทำงานยังไง แล้วก็เลยอยากเล่าให้เพื่อนเจ้าของกิจการด้วยกันฟังแบบภาษาคนๆ ตรงไหนผมเข้าใจคลาดเคลื่อนไป ทักท้วงกันเข้ามาได้เลยนะครับ ยินดีมากๆ

ตอนหน้าของซีรีส์ AI 101 ผมแอบเกริ่นไปนิดนึงแล้วในตอนนี้ เจ้าคำว่า Transformer ที่ผมบอกว่าเป็นเทคนิคใหม่ที่มาแทน RNN ในงานภาษา แล้วกลายเป็นหัวใจของ AI สายแชตทุกวันนี้เนี่ย จริงๆ แล้วมันต่างจาก RNN ยังไง ทำไมมันถึงเก่งกว่าจนพลิกวงการ ไว้เจอกันตอนหน้าครับ