AI Text-to-Video เอไอที่สร้างแรงสั่นสะเทือนให้โลกอีกครั้ง OpenAI ปล่อย Sora ออกมา ขณะที่ Google ก็มี Lumiere เพียงแค่ข้อความไม่กี่บรรทัดเท่านั้น ก็สามารถสร้างคลิปวิดีโอได้ แล้วจะมีงานเหลือให้คนทำอีกไหม
ปี 2022 OpenAI ได้เปิดตัว ChatGPT จนสร้างการเปลี่ยนแปลงไปทั่วโลก หลังจากนั้นใครๆ ก็หันมาสนใจ AI และ AI ก็ถูกปล่อยออกมาให้เราได้ทึ่งได้ surprise ในความสามารถของมันเพิ่มขึ้นเรื่อยๆ จนล่าสุด OpenAI ก็ได้ปล่อยผลงานของเอไอที่สามารถสร้างคลิปวิดีโอจากข้อความแค่ไม่กี่บรรทัด แล้วคลิปเหมือนจริงมากด้วย และเอไอตัวนั้นมีชื่อว่า Sora
Sora คืออะไร
Sora คือโมเดล AI ที่มีความสามารถสร้างวิดีโอจากข้อความ หรือ Text-to-Video ตอนนี้ Sora สามารุถสร้างวิดีโอที่มีความยาวสูงสุดได้ 1 นาที และ Sora ก็มีความสามารถหลายด้าน เช่น สามารถสร้างฉากที่ซับซ้อนด้วยตัวละครหลายตัว การเคลื่อนไหวเฉพาะ และรายละเอียดที่แม่นยำของวัตถุและฉากหลัง Sora ไม่ได้แค่เข้าใจถึงข้อความที่ผู้ใช้ป้อนข้อความลงไปเท่านั้น แต่ยังเข้าใจถึงบริบทของโลกจริงด้วย และเพราะ Sora เข้าใจภาษาอย่างลึกซึ้ง ทำให้สามารถตีความข้อความที่ป้อนเข้าไปได้อย่างแม่นยำ และสร้างตัวละครที่น่าสนใจ ซึ่งแสดงอารมณ์ความรู้สึกที่มีชีวิตชีวา นอกจากนี้ Sora ยังสามารถสร้างภาพหลายภาพ ภายในวิดีโอที่คงลักษณะตัวละคร และสไตล์ภาพได้อย่างแม่นยำ
แต่ถึงจะเก่งมากแค่ไหน Sora ก็ยังมีจุดอ่อนด้านฟิสิกส์ของฉาก และอาจไม่เข้าใจความสมเหตุสมผลได้ดีมากพอ หรือยังมีความสับสนและให้การเคลื่อนไหวที่ไม่สมจริง เช่น การสลับซ้ายขวา
Sora สามารถสร้างออกมาก็สมจริงเกินกว่าที่คาด บางคลิปแทบจะดูไม่ออกเลยว่าสร้างจาก AI นอกจากการสร้างวิดีโอจากข้อความแล้ว Sora ยังสามารถสร้างวิดีโอจากภาพนิ่งได้ด้วย หรือ Image-to-Video สามารถขยายหรือเติมเฟรมที่ขาดหายไปได้ของวิดีโอได้ แต่ว่า Sora ไม่ใช่ AI ตัวเดียวที่สร้างวิดีโอจากข้อความได้ โดยก่อนที่ Sora จะเปิดตัวไม่นาน Google ก็เปิดตัว Lumiere ออกมา
Lumiere คืออะไร
Lumiere คือโมเดลเอไอที่สามารถสร้างวิดีโอจากข้อความหรือรูปภาพได้เหมือนกัน โดยรายละเอียดที่ปล่อยออกมาส่วนใหญ่ทำได้เหมือน Sora เลย แต่ก็มีส่วนที่แตกต่างออกไปเล็กน้อย เช่น Lumiere มีฟีเจอร์สร้างวิดีโอจากภาพนิ่งและข้อความ โดยรูปแบบของวิดีโอที่สร้างใหม่นั้นเป็นแบบเดียวกันกับภาพนิ่งต้นแบบ
Lumiere สามารถแก้ไขคลิปวิดีโอให้แตกต่างออกไปจากคลิปวิดีโอต้นแบบได้ เพียงแค่พิมพ์ข้อความกำกับลงไป Lumiere สามารถสร้างภาพเคลื่อนไหวเฉพาะจุดที่เราต้องการบนภาพนิ่งได้ ซึ่งฟีเจอร์นี้เราไม่จำเป็นต้องพิมพ์ข้อความบอกลงไป แค่ตีกรอบตรงจุดนั้น เอไอก็จะเปลี่ยนส่วนนั้นเป็นภาพเคลื่อนไหวให้เอง และเพิ่มวิดีโอในส่วนที่ขาดหายไปให้ได้
จะเห็นว่าทั้ง Sora และ Lumiere สร้างคลิปวิดีโอออกมาได้น่าทึ่งมาก ๆ ทั้ง ๆ ที่สั่งผ่านข้อความแค่ไม่กี่ประโยคเท่านั้น และนั้นทำให้เกิดความกังวลมากมายตามมา
ความเสี่ยงที่อาจเกิดขึ้น
ถึงแม้ว่าทั้ง Sora และ Lumiere จะยังไม่ได้ถูกปล่อยออกมาสู่สาธารณะในตอนนี้ แต่ความกังวลเรื่องจริยธรรมก็เป็นเรื่องที่ใคร ๆ ตั้งคำถาม อย่างเช่นคอมเมนต์ใน X เหล่านี้
SORA is a huge leap for the world, just wondering what exactly stops people or government entities with unrestricted access to tech similar to sora from generating realistic videos (which definitely will be in the future) and abusing it for crimes or even fabricating evidence
— phuwintang (@phuwintang) February 16, 2024
เป็นเรื่องที่ต้องdevelopกันต่อในอนาคตมั้ยนะ เพราะTechไม่เคยstop เหมือนพวกแอพธนาคารที่ต้องปรับให้securityที่สุด ต่อไปอะไรหลายๆอย่างคงต้องปรับ ตอนนี้ยังมองไม่ออก แต่ต่อไปคงเห็นชัดขึ้นว่ามันทำให้เกิดอะไรได้บ้าง แล้วเราจะต้องรับมือป้องกันยังไง ยังหวังได้มั้ยว่าไทยจะมีหน่วยงานดูแล😅
— M 🐋🌿💖⁺◟ (@muiza_muyun) February 16, 2024
ซึ่งคิดว่าในอนาคตอาจทำได้มากกว่านี้อีก แล้วก็ไม่ใช่ทุกคนที่จะแยกแยะได้ ก็ไม่รู้เหมือนกันว่าจะแก้ปัญหานี้กันยังไง
— ซินดี้ chocokorn (@chocokorn) February 16, 2024
The potential of abuse that might occur is scary, I don’t think our society completely ready for that. I mean, we’ve seen how text-to-text AI is misused in some cases. SORA could create propaganda that leads to harmful occurrences if used by irresponsible parties.
— key. (@makkurokuro819) February 16, 2024
แล้วเหตุการณ์ที่กังวลกันจะเกิดขึ้นจริง ๆ หรือไม่ก็ต้องดูกันต่อไปว่า จะทำอย่างไรให้เทคโนโลยีนี้ไม่ถูกเอาไปใช้ในทางที่ผิด เพราะที่ผ่านมา การตัดต่อรูป Deepfake ก็สร้างความเสียหายให้หลาย ๆ คน และตอนนี้ก็ยังคงอยู่ แล้วถ้าต่อไปคลิปถูกสร้างได้โดยแค่พิมพ์สั่งเท่านั้น ก็จะยิ่งสร้างความเสียหายเยอะมากขึ้น ๆ ไปอีก
ซึ่งหลังจากนี้ Sora จะถูกประเมินเพื่อหาอันตรายหรือความเสี่ยง เช่น เนื้อหาที่แสดงถึงความเกลียดชัง นอกจากนี้ยังให้สิทธิ์การเข้าใช้งานแก่ ศิลปิน ทัศนศิลป์ นักออกแบบ และผู้สร้างภาพยนตร์จำนวนหนึ่งเพื่อรับคำติชมเกี่ยวกับวิธีพัฒนาโมเดลให้มีประโยชน์มากที่สุดสำหรับมืออาชีพด้านงานสร้างสรรค์
และอีกเรื่องที่หลายๆ คนกังวลก็คือ เรื่อง AI แย่งงานมนุษย์ ก่อนหน้างานที่ได้รับการคาดหมายว่า AI จะเข้ามาแทนที่คืองานด้าน STEM ที่ประกอบด้วยงานในสาขา วิทยาศาสตร์, เทคโนโลยี, วิศวกร และ คณิตศาสตร์ แปลว่าคนที่ทำงานที่เกี่ยวกับความคิดสร้างสรรค์ก็ยังรอด แต่พอ AI ที่สร้างภาพจากข้อความ (Text-to-Image) เกิดขึ้น คนที่ทำงานด้านกราฟฟิกก็ได้รับความเดือดร้อนไปแล้ว แล้วถ้า Text-to-Video เกดขึ้นมาแบบนี้งานสายวีดีโอ สร้างหนัง ยังรอดอยู่หรือไม่? เพราะมันใช้ทั้งคน และเงินที่น้อยกว่ามาก ๆ
ถึงแม้ว่าทั้ง Sora และ Lumiere จะยังไม่ได้ถูกปล่อยออกมาสู่สาธารณะในตอนนี้ และไม่รู้ว่าจะปล่อยออกมาให้ใช้จริงเมื่อไหร่ แต่ถ้าเรามองดูพัฒนาการของ ChatGPT ที่เปิดตัวในเดือนพฤศจิกายน ปี 2022 ผ่านไปแค่ปีนิด ๆ แต่ AI แชทบอทแบบ ChatGPT พัฒนาไปอย่างก้าวหน้ามากๆ แถมยังมีแชทบอทแบบเดียวกันให้เราใช้เพียบเลย นั้นแปลว่าในวันนี้ของปีหน้า ก็อาจจะมีหนังที่ทำมาจาก AI ทั้งเรื่องเลยก็ได้
ชมรายการ Digital Thailand ตอน “ AI Text-to-Video สะเทือนอุตสาหกรรม Soft Power จะเหลือที่ไหนให้มนุษย์ยืน! ” ได้ที่รายการย้อนหลังตอนนี้เลย
https://www.it24hrs.com/2024/ai-text-to-video-sora-lumiere/
ออกอากาศวันเสาร์ที่ 2 มีนาคม 2567
ในรายการ Digital Thailand ทุกวันเสาร์ ทางช่อง 3 กด 33 เวลา 4.40-5.05 น.
ยังมีบทความที่น่าสนใจ
BCI คืออะไร เกี่ยวอะไรกับ Neuralink การรวมมนุษย์กับ AI
Sora AI สร้างวิดีโอจากข้อความ Text-to-Video โมเดลใหม่ล่าสุดจาก OpenAI ทำอะไรได้บ้าง?
Lumiere เอไอ Text to Video สร้างวิดีโอจากข้อความหรือรูปภาพ
อย่าลืมกดติดตามอัปเดตข่าวสาร เทคนิคดีๆกันนะคะ Please follow us
Youtube it24hrs
Twitter it24hrs
Tiktok it24hrs
facebook it24hrs
ติดต่อโฆษณา [email protected] โทร 0802345023