GPT-3 คืออะไร ทำไม AI ที่เก่ง ๆ ที่กำลังถูกพูดถึงมากในตอนนี้ อย่าง Dall-E2 ที่สามารถสร้างภาพได้จากประโยค หรือ ChatGPT แชตบอทที่รู้ทุกเรื่อง ตอบได้ทุกอย่าง เก่งจนเป็นผู้ช่วยส่วนตัวได้ หรือ Vall E AI ที่เลียนแบบเสียงมนุษย์ให้พูดอะไรก็ได้ ด้วยตัวอย่างเสียงของเขาแค่ 3 วินาที AI เหล่านี้ล้วนแต่มีโมเดลด้านภาษาที่ทำงานเบื้องหลังตัวเดียวกัน นั้นคือ GPT-3
GPT-3 เบื้องหลังสำคัญของสุดยอด AI หลายตัว
GPT-3 คืออะไร
GPT-3 ย่อมาจาก Generative Pre-trained Transformer 3 เป็นโมเดลภาษาล้ำสมัยที่ถูกพัฒนาโดย OpenAI องค์กรวิจัยที่ไม่แสวงหาผลกำไร
โดยโปรเจกต์ GPT นี้เริ่มต้นจาก GPT-1 ในปี 2018 และพัฒนาต่อมาเรื่อย ๆ เป็น GPT-2 ในปี 2019 มาถึง GPT-3 ซึ่งเปิดตัวในเดือนมิถุนายนปี 2020 ซึ่ง GPT-3 เป็นโมเดลประมวลผลด้านภาษาที่มีพารามิเตอร์มากถึง 1.75 แสนล้านพารามิเตอร์ นับว่าเป็นโมเดลด้านภาษาที่ใหญ่ที่สุด และทรงพลังที่สุด เท่าที่เคยมีมา
โมเดล GPT-3 มีขนาดใหญ่มาก เพราะมันถูกออกแบบให้เข้าในภาษามนุษย์ และภาษามนุษย์มีความซับซ้อนมาก เราอาจไม่ได้สังเกตเพราะใช้อยู่ทุกวันจนเป็นเรื่องปกติ แต่ลองมาดูตัวอย่างนี้กัน
จากตัวอย่างนี้จะเห็นว่ามีคำว่า “เดี๋ยว” อยู่ 4 จุด ซึ่งเป็น “เดี๋ยว” คำเดียวกัน เขียนเหมือนกัน แต่ถ้าสังเกตกันจริง ๆ ความหมายของเดี๋ยวแต่ละคำจะต่างกันทั้งหมด
“เดี๋ยว” ตรงนี้มีหมายความว่า ให้รอหน่อย อาจจะไม่กี่นาที
แต่ “เดี๋ยว” ตรงนี้กินเวลาหลายวันหรืออาจเกือบเดือนเลยก็ได้
แล้ว “เดี๋ยว” ตรงนี้นี้หมายถึงระยะเวลาที่ไม่นาน
แต่ “เดี๋ยว” ตรงนี้กลับหมายถึงตอนนี้
นอกจากนี้ยังมีการพิมพ์ผิด ตรงคำว่า “แป้บ” ที่ควรจะเป็นคำว่า “แป๊บ” และคำว่า “ชั้น” ที่สะกดตามการออกเสียงของคำว่า “ฉัน” แต่เราก็สามารถอ่านได้และเข้าใจความหมายของมันทันที
เพราะคนเราใช้ภาษาแบบนี้กันอยู่เป็นประจำ ถึงจะเจอคำผิด คำสแลง อักษรย่อ ก็เข้าเข้าใจความหมายได้ไม่ยาก แต่ว่ามันกลับเป็นเรื่องยากมากสำหรับ AI ที่จะเข้าใจภาษาเหล่านี้ ซึ่งการประมวลผลภาษาธรรมชาติหรือว่าภาษามนุษย์ที่เราพูดคุยกันแบบนี้เรียกว่า Natural Language Processing หรือ NLP
แล้วทำไม GPT-3 ถึงเข้าใจภาษาเหล่านี้ได้?
การสอน AI ให้เรียนรู้ก็เหมือนกับการสอนเด็กให้รู้เรื่องต่างๆ โดยเราจะบอกข้อมูลให้กับเด็ก แล้วเด็กก็เก่งขึ้นเรื่อย ๆ การสอนให้ AI ฉลาดขึ้น เราก็ต้องใช้ข้อมูลใส่เข้าไปให้มันเรียน ยิ่งมีข้อมูลมาก AI ก็จะมีโอกาสฉลาดมากขึ้น
นำข้อมูลไปสอน AI เอไอ เรียกว่า การเทรน (Train) โดย GPT-3 ถูกเทรนจากข้อมูลที่เป็นข้อความจำนวนมหาศาล มากถึง 45 เทราไบต์ โดยข้อมูลมาจากหลายแหล่ง เช่น คลังข้อมูล หนังสือ บทความ เว็บไซต์ และแหล่งข้อมูลต่าง ๆ บนอินเทอร์เน็ต
แล้วเอาข้อมูลเหล่านี้มาใช้ในการสอนเพื่อสร้างโมเดล AI ขึ้นมา ด้วยเทคนิค Deep Learning ช่วงแรกผลลัพธ์อาจจะยังไม่ดี แต่มันก็จะถูกปรับจูนทำซํ้าไปเรื่อย และผลลัพธ์ก็จะดีขึ้นเรื่อย ๆ เช่นกัน
แล้ว GPT-3 ทำงานยังไง?
เมื่อเจ้าโมเดล AI นี้ได้รับคำหรือประโยค มันก็จะวิเคราะห์บริบทของสิ่งที่ใส่เข้ามา แล้วก็คาดการณ์คำหรือวลีถัดไปที่เป็นไปได้มากที่สุด
โมเดล GPT-3 ประกอบไปด้วย Neural Network หลายๆชั้น โดยแต่ละชั้นจะคำนวณ input ด้วยวิธีที่ต่างกัน โดยชั้นแรกจะวิเคราะห์คำแต่ละคำ และความสัมพันธ์ของคำเหล่านั้น ขณะที่ชั้นต่อ ๆ ไป ก็จะพิจารณาบริบทที่กว้างขึ้นในประโยค ย่อหน้า หรือเอกสารทั้งหมด
ซึ่งปริมาณข้อมูลที่ใช้เทรนมีขนาดถึง 45 เทราไบต์ แถมยังทำหลายๆรอบ ก็ต้องทำบน Hardware ที่ทรงพลังสุด ๆ อย่าง GPU NVIDIA V100 และใช้ซูเปอร์คอมพิวเตอร์จำนวนมาก
แล้ว GPT-3 ถูกใช้ใน AI ตัวไหนบ้าง?
ซึ่งนอกจาก GPT-3 นี้จะถูกใช้ใน AI เก่ง ๆ อย่างเช่น Dall E2, Vall E หรือว่า Chat GPT แล้ว ตัวโมเดล GPT-3 นี้ยังถูกนำไปใช้ใน Service ต่างๆ อีกกว่า 300 ตัวเลย นั้นก็เพราะ GPT-3 มี API ที่ช่วยให้เหล่านักพัฒนานำ GPT-3 ไปสนับสนุนการทำงานของแอปพลิเคชันหรือบริการนั้นได้ เลยทำให้ตอนนี้มีหลายแอปพริเคชัน หลายบริการเลยที่ใช้ความสามารถของ GPT-3
GPT-3 รอบๆ ตัวคุณ
และในอนาคตอันใกล้มากๆ GPT-3 ก็จะมาอยู่รอบๆ ตัวเรามากขึ้นเช่น
Microsoft Teams Premium ก็จะใช้ GPT-3.5 ที่พัฒนาต่อมาจาก GPT-3 ช่วยในการสรุปย่อ และไฮไลท์การประชุมแบบอัตโนมัติ
Bing เสิร์ชเอนจินของ Microsoft ที่ใช้ GPT-3.5 มาช่วยให้คำตอบ และไฮไลท์ข้อความที่เกี่ยวข้องกับคำค้นทางฝั่งขวา และฟังค์ชั้นอื่น ๆ ที่มากกว่าแค่เสิร์ช
Outlook ก็จะเอา ChatGPT ที่ก็พัฒนาขึ้นมาโดยใช้ GPT-3 มาช่วยเขียน Email
Powerpoint ก็จะเอา Dall E2 มาช่วยสร้างภาพประกอบ
ถ้า GPT-3 ถูกเอามาใช้ในแอปพลิเคชันมากกว่านี้ เราก็คงสะดวกสบายขึ้นอีกเยอะ แต่นี้ยังเป็นแค่เวอร์ชันที่สามเท่านั้น และในอนาคตมันก็จะถูกพัฒนาเป็นเวอร์ชัน 4 6 และ 6 ไปเรื่อยๆ และก็จะเก่งขึ้นไปเรื่อย ๆ อย่างแน่นอน
รายการ Digital Thailand ตอน “GPT-3 เบื้องหลังสำคัญของสุดยอด AI หลายตัว” รายการย้อนหลัง ตอนนี้เลยนะคะ
www.it24hrs.com/2023/what-is-gpt-3
ออกอากาศวันเสาร์ที่ 25 กุมภาพันธ์ 2566
ในรายการ Digital Thailand ทุกวันเสาร์ ทางช่อง 3 กด 33 เวลา 4.40 น.- 5.05 น.
อย่าลืมกดติดตามอัปเดตข่าวสาร เทคนิคดีๆกันนะคะ Please follow us
Youtube it24hrs
Twitter it24hrs
Tiktok it24hrs
facebook it24hrs
ติดต่อโฆษณา [email protected] โทร 0802345023