รวมบริการ Generative AI ประเภทต่าง ๆ ที่ใช้งานได้จริงมีอะไรบ้าง? ตอนนี้เป็นยุคของ AI หลังจากที่ ChatGPT เปิดตัวมา โลกก็หันมาสนใจเอไออย่างจริงจัง และเอไอก็ถูกพัฒนาเพื่อใช้งานในหลายประเภท แล้วตอนนี้เอไอมีอะไรบ้างที่เราสามารถใช้งานได้จริง หรือน่าจะใช้ได้ในอนาคตอันใกล้นี้
Generative AI คืออะไร
Generative AI หรือ ปัญญาประดิษฐ์เชิงกำเนิด คือ เทคโนโลยี AI รูปแบบใหม่ ที่สามารถสร้างเนื้อหาใหม่ ๆ ได้ โดยไม่ต้องอาศัยข้อมูลที่มีอยู่จริง โดยมีหลักการดังนี้
- การเรียนรู้: โดย Generative AI จะเรียนรู้รูปแบบและโครงสร้างของข้อมูลตัวอย่าง (Training Data)
- การสร้าง: โดย Generative AI จะสร้างเนื้อหาใหม่ ๆ โดยใช้รูปแบบและโครงสร้างที่เรียนรู้มา
การมาของ Generative AI จะช่วย เพิ่มประสิทธิภาพการทำงาน: ช่วยให้ทำงานได้เร็วขึ้น ประหยัดเวลาและทรัพยากร ช่วยได้ไอเดียใหม่ๆโดยมี AI เป็นผู้ช่วย และช่วยได้ข้อมูลที่ไม่สามารถหาได้จากแหล่งข้อมูลทั่วไป จากข้อดีดังกล่าวทำให้ Generative AI มีแนวโน้มจะถูกนำมาใช้ในทุกงานและทุกอุตสาหกรรมมากขึ้น แต่ก็เป็นเรื่องที่ต้องระวังในเรื่องความถูกต้องของเนื้อหาด้วย
Generative AI ประเภทต่าง ๆ มีอะไรบ้าง
AI ถูกนำมาประยุกต์ใช้กับงานที่หลายหลาย ทั้งที่เรารู้และใช้งานได้โดยตรง และเอไอที่ทำานอยู่เบื่องหลังแอป หรือโปรแกรมต่าง ๆ ที่เราไม่รู้ว่ามันมีตัวตนอยู่ แต่ในบทความนี้จะกล่าวถึงเอไอในขอบเขตของบริการที่เราสามารถใช้งานได้โดยตรง เพื่อดูว่า ณ. ปัจจุบันนี้เราสามารถใช้เอไอทำงานอะไรให้เราได้บ้าง ซึ่งเราสามารถแบ่งบริการ Generative AI ตามประเภทการใช้งานได้ 7 ประเภท ได้แก่
- Text Generation
- Code Generation
- Image Generation
- 3D Generation
- Music Generation
- Audio Generation
- Video Generation
1) Text Generation
Text Generation คือประเภทของ AI ที่ใช้เพื่อสร้างข้อความจาก Prompt ที่ผู้ใช้ป้อนเข้าไป เช่น การสร้างบทกวี บทความ บทพูด บทละคร คำแนะนำ คำโฆษณา ไปจนถึงการเขียนสคริปต์แนะนำธุรกิจ สคริปต์แนะนำสินค้าและบริการ การเขียนสรุปบทความที่น่าสนใจ มีตัวอย่างเอไอที่ให้บริการรูปแบบนี้ดังต่อไปนี้
ChatGPT คือแชทบอทที่มี AI ที่ชื่อว่า GPT ทำงานอยู่เบื้องหลัง พัฒนาโดย OpenAI โดย GPT นี้เป็นโมเดลเอไอภาษาขนาดใหญ่ที่ชื่อว่า LLM หรือ Large Language Models รองรับภาษาไทยได้ โดย ChatGPT ที่มี GPT-3.5 ทำงานอยู่เบื่องหลังจะสามารถใช้ได้ฟรี แต่ฐานข้อมูลที่ใช้ในการเทรนจะมีจนถึงเดือน ม.ค. 2020 เท่านั้น ขณะ ChatGPT ที่มี GPT-4 จะต้องเสียเงินแต่ก็มีฟีเจอร์มากขึ้น และฐานข้อมูลที่ใช้ในการเทรนจะอัปเดตจนถึงปัจจุบัน
Gemini คือแชทบอทที่มี AI ทำงานอยู่เบื่องหลัง พัฒนาโดย Google ก่อนที่จะใช้ชื่อ Gemini เคยใช้ชื่อว่า Bard มาก่อน Gemini นี้รองรับภาษาไทย และใช้งานฟรี มีการอัปเดตฐานข้อมูลเป็นปัจจุบัน
ถึงแม้ว่าทั้ง ChatGPT และ Gemini จะมีบริการหลักเป็น แชทบอทแต่ก็มีความสามารถอื่นๆ อีกมากมาย เช่นการรับอินพุตเป็นภาพ เสียง หรือคลิปวิดีโอ และเอาท์พุตของเอไอทั้งสองตัวนี้ก็ไม่มีมีแต่ข้อความเท่านั้น แต่ยังมีเอาท์พุตในรูปแบบอื่นเช่นการเขียนโค้ด ซึ่งถ้าจะกล่าวถึงเอไอที่ให้บริการเพื่อสร้างข้อความเป็นหลักก็มีเอไอตัวอื่น ๆ อีกเช่น
AI ที่ใช้ในการช่วยสร้างงานเขียนรูปแบบต่างๆ สำหรับ นักเขียน นักการตลาด และเจ้าของธุรกิจ รองรับภาษาไทยมีทั้งเวอร์ชั่นฟรีและเสียเงิน
AI สำหรับเขียนบทความ SEO โดยเฉพาะ มีเครื่องมือที่ชื่อว่า SEO Competitive Research ที่จะวิเคราะห์ข้อมูลคู่แข่งที่ปรากฏบนผลการค้นหาของกูเกิ้ลแบบละเอียด เช่น บทความคู่แข่งมาจากเว็บไหน มีหัวข้อ และเนื้อหาอะไรบ้าง มีการแสดงข้อมูลต่าง ๆ ที่ช่วยในการเขียนบทความ เช่น คำถาม สถิติ ข้อมูลใหม่ ๆ เอไอตัวนี้สามารถใช้งานเป็นภาษาไทยได้ แต่มีเฉพาะเวอร์ชั่นเสียเงินเท่านั้น
AI เขียนคอนเทนต์ เช่น แต่งเรื่อง เขียน Youtube Description อีเมล และ บทความ SEO เป็นต้น สามารถเขียนบทความที่กระชับ เข้าใจง่าย รองรับภาษาไทยมีทั้งเวอร์ชั่นฟรีและเสียเงิน
2) Code Generation
Code Generation คือประเภทของ AI ที่สามารถเขียนโค้ดให้เรา โดยที่เราเพียงแค่ Prompt สั่งงานเท่านั้น นอกจากเขียนโค้ดแล้วยังสามารถวิเคราะห์โค้ด ระบุจุดบกพร่อง ชี้ช่องโหว่ และให้คำแนะนำเกี่ยวกับวิธีการแก้ไขได้อีกด้วย Generative AI ในกลุ่มของ Code Generation มีตัวอย่างดังต่อไปนี้
GitHub Copilot พัฒนาโดย GitHub ร่วมกับ OpenAI เพื่อเป็นเครื่องมือช่วยเหลือด้านการเขียนโปรแกรมที่ขับเคลื่อนด้วย AI สามารถแนะนำบรรทัด หรือบล็อกของโค้ดขณะที่เราเขียนโปรแกรมได้
เป็นผลิตภัณฑ์ของ Replit สิ่งที่ทำให้ GhostWriter แตกต่างคือการทำงานร่วมกับโปรแกรมแก้ไขโค้ดออนไลน์อย่างราบรื่น Replit ทำให้ผู้เขียนโค้ดสามารถเขียน รัน และดีบักโค้ดได้ในที่เดียว
Amazon สามารถให้คำแนะนำได้แบบเรียลไทม์ เช่น ฟังก์ชันต่างๆ และรับประกันคุณภาพของโค้ดด้วยการเน้นคำแนะนำที่มาจากข้อมูลโอเพ่นซอร์ส นอกจากนี้ ยังจัดลำดับความสำคัญด้านความปลอดภัยของโค้ด โดยระบุจุดที่ควรแก้ไข และนำเสนอวิธีที่ควรแก้ไขทันที
3) Image Generation
Image Generation คือประเภทของ AI ที่สามารถสร้างภาพจาก Prompt หรือที่เราเรียกว่า Text-to-Image สามารถสร้างภาพได้หลายประเภท เช่น ภาพ Sketch, ภาพสีนํ้า, ภาพสีนํ้ามัน, ภาพการ์ตูน หรือภาพสมจริง นอกจากการสร้างภาพทั้งภาพแล้วยังสามารถตัดต่อบางส่วนของภาพได้เช่น การลบพื้นหลัง หรือบางส่วนออกจากภาพ โดย AI จะเติมเต็มพื้นหลังให้อัตโนมัติ ถึงจะสร้างภาพได้เหมือนจริง แต่ก็ยังมีปัญหาในเรื่องการสร้างภาพนิ้วของคนอยู่บ้าง เช่น มีนิ้วเกิน 5 นิ้ว หรือมีไม่ครบ AI ในกลุ่มของ Image Generation มีตัวอย่างดังต่อไปนี้
DALL-E เป็น Text-to-Image AI ที่พัฒนาโดย Microsoft สามารถใช้งานได้ฟรี 100 ครั้ง โดยในแต่ละครั้งจะ AI จะสร้างภาพให้เรา 4 ภาพ นอกจากการสร้างภาพที่เป็นฟีเจอร์หลักแล้ว ยังสามารถค้นหาไอเดียจากภาพของคนอื่นๆ รวมถึงมีปุ่ม Surprise Me ที่ระบบจะคิดประโยคสำหรับสร้างรูปให้เรา
Midjourney เปิดโอกาสให้สามารถทดลองสร้างภาพฟรีได้ 25 ครั้ง ซึ่งการใช้ Midjourney นั้นจะต้องเข้าไปใน Discord ของ Midjourney แล้วป้อน Prompt ลงในนั้น แล้ว AI จะสร้างภาพให้เราครั้งละ 4 ภาพ สามารถเลือกภาพที่ถูกใจ แล้วเพิ่มความละเอียดได้ แต่ถ้าอยากใช้ 25 ครั้งจะต้องเสียเงิน แล้ว จะใช้ Midjourney ได้ในลักษณะของ Bot ใน Discord
Stable Diffusion
Stable Diffusion คือเอไอแบบ Open source ที่สามารถใช้ได้ฟรี ๆ และเพราะเป็น Open source ทำให้ Stable Diffusion มีลูกเล่นที่เยอะมาก ๆ สามารถปรับแต่งและตั้งค่าต่าง ๆ ได้เยอะ ไปจนถึงผู้ใช้สร้างมากสร้างโมเดลของตัวเอง และแชร์ให้คนอื่นใช้ได้ แต่ Stable Diffusion จะไม่มี UI ให้ใช้ผ่านเว็บไซต์หรือแอปพลิเคชัน ถ้าต้องการใช้จะต้องดาวน์โหลดจาก GitHub ไปติดตั้งที่เครื่องคอมพิวเตอร์ หรือใช้ผ่าน Google Colab นั้นทำให้เห็นว่า ถึงแม้ว่า Stable Diffusion จะมีฟีเจอร์เยอะ และฟรี แต่ก็ไม่ได้ใช้งานง่าย ทำให้มีหลายเว็บไซต์ที่สร้างเว็บ หรือแอป Text-to-Image AI ที่มี Stable Diffusion ทำงานอยู่เบื่องหลัง
4) 3D Generation
3D Generation คือประเภทของ AI ที่สามารถสร้างโมเดล 3 มิติจาก Prompt หรือ Text-to-3D ซึ่งจะมีลักษณะคล้ายๆ Text-to-Image
การใช้งาน Luma AI จะเป็นลักษณะเดียวกันกับ Midjourney คือต้องเข้าไปใช้ใน Discord ป้อน Prompt ลงในนั้น แล้ว AI จะสร้างโมเดลมาให้เราครั้งละ 4 โมเดล สามารถปรับแต่งโมเดลได้เล็กน้อยก่อนดาวน์โหลด
ฟีเจอร์หนึ่งที่ Meshy.ai แตกต่างจากเอไอตัวอื่นคือ นอกจากการสร้างโมเดล 3D จาก Prompt แล้ว ยังสามารถ สร้างโมเดล 3D จากภาพได้ด้วย
สามารถทำโมเดล 3D ได้ใน 4 ขั้นตอน โดยทำได้ 3 ประเภทก็คือ สิ่งของ สัตว์ และคน และฟีเจอร์ที่แตกต่างคือสามารถขยับส่วนของโมเดลได้
5) Music Generation
Music Generation คือประเภทของ AI ที่สามารถแต่งเพลงได้จาก Prompt ที่ป้อนเข้าไป สามารถแต่งเพลงได้หลากหลายแนว โดยกระบวนการสร้างเพลงนั้น AI จะเริ่มต้นด้วยการวิเคราะห์ข้อมูลเพลงที่มีอยู่ เช่น การเรียบเรียงดนตรี การบันทึกเสียง และโน้ตเพลง ข้อมูลเหล่านี้จะถูกนำมาใช้เพื่อฝึกอัลกอริธึมให้เกิดการเรียนรู้ เพื่อสร้างเพลงใหม่ ๆ ตามรูปแบบ และโครงสร้างที่ผู้ใช้งานกำหนด Generative AI ในกลุ่มของ Music Generation มีตัวอย่างดังต่อไปนี้
ผู้ใช้งาน Amper Music ไม่จำเป็นต้องมีความรู้เชิงลึกเกี่ยวกับทฤษฎีดนตรี หรือการประพันธ์เพลงเนื่องจาก Amper สามารถแทร็กดนตรีจากตัวอย่างที่บันทึกไว้ล่วงหน้า จากนั้นจะแปลงสิ่งเหล่านั้นเป็นเสียงจริง ซึ่งสามารถแก้ไขได้ด้วยคีย์เพลง จังหวะ และเครื่องดนตรีแต่ละชิ้นให้เหมาะกับอารมณ์หรือบรรยากาศ
AIVA ถูกพัฒนามาตั้งแต่ปี 2016 และได้รับการปรับปรุงอย่างต่อเนื่อง สามารแต่งเพลงประกอบสำหรับโฆษณา วิดีโอเกม ภาพยนตร์ และอื่น ๆ ช่วยให้ผู้ใช้สามารถพัฒนาเพลงตั้งแต่เริ่มต้น และช่วยสร้างรูปแบบต่าง ๆ ของเพลงที่มีอยู่ได้
เป็น AI สร้างเพลงที่สามารถใช้ได้ผ่านแอปบน iOS Amadeus Code อาศัยเอนจิ้น AI ที่บรรจุคอร์ดของเพลงดังๆ ในโลก จากนั้นก็จะใช้เพลงเหล่านี้สร้างโครงสร้างใหม่ของเพลงขึ้นมาใหม่ หรือสร้างแค่บางส่วนของเพลงก็ได้
How Amadeus Code creates melodies
6) Audio Generation
Audio Generation คือประเภทของ AI ที่สามารถสร้างเสียง หรือเลียนแบบเสียงพูดของมนุษย์ได้ หรือ Text-to-Speech เราสามารถนำ AI ไปสร้างหนังสือเสียง หรือ เสียงบรรยายต่าง ๆ ได้ แต่ถึงแม้ว่า AI จะสามารถพูดได้อย่างลื่นไหลและสามารถปรับแต่งอารมณ์ของเสียงได้บ้าง แต่เสียงที่ต้องใช้อารมณ์เยอะ ยังไม่สามารถทำได้ดีนัก Generative AI ในกลุ่มของ Audio Generation ที่เราคุ้นเคยกันดีก็คือ Siri หรือ Google translate และนอกจากเอไอสองตัวนี้ยังมีตัวอย่างเช่น
Typecast.ai มีตัวละครให้เลือกได้ โดยแต่ละตัวละครจะมีน้ำเสียงต่างกัน เช่น น้ำเสียงสำหรับการบรรยายสารคดี หรือน้ำเสียงสำหรับการบรรยายผ่านวิทยุ ผู้ใช้ยังสามารถเลือกอารมณ์ของน้ำเสียงได้ เช่น เศร้า โมโห หงุดหงิด แต่เอไอตัวนี้ยังไม่รองรับภาษาไทย
ผู้ใช้สามารถนำบทมาแปลงเป็นเสียงได้เหมือนกับให้เจ้าของภาษามาบรรยายจริงๆ จุดเด่นของ Play.ht คือมีภาษาให้เลือกมากกว่า 100 ภาษารวมถึงภาษาไทย โดยเราสามารถทดลองใช้ได้ฟรี แต่จะจำกัดจำนวนคำที่ใช้แปลงเป็นเสียงที่ 5,000 คำ และสามารถดาวน์โหลดเสียงได้ 3 ครั้ง
VoiceOverMaker รองรับภาษาไทย โดยจะมีเสียงภาษาไทยให้เลือกทั้งหมด 3 เสียง มีเครดิตให้ทดลองใช้ฟรี 800 เครดิต สามารถดาวน์โหลดเสียงนั้นเป็นไฟล์ wav และ mp3 ได้
นอกจากนี้ยังมี AI ที่ชื่อว่า Vall-E ที่สามารถเลียนแบบเสียงจากเสียงตัวอย่างแค่ 3 วินาที เพื่อนำไปพูดตามข้อความที่เรากำหนด นั้นหมายความว่าเราสามารถใช้ Vall-E สร้างเสียงที่เราต้องการให้พูดอะไรก็ได้ นอกจากนี้ยังมีฟีเจอร์ที่สามารถใส่อารมณ์ไปในประโยคได้ เช่น โกรธ หรือง่วง และในตอนนี้ Vall-E ก็ได้พัฒนาต่อมาเป็น Vall-E X ที่มีฟีเจอร์เพิ่มขึ้นมาคือ สามารถพูดข้ามภาษาได้ เช่น เราใช้เสียงต้นฉบับภาษาอังกฤษความยาว 3-10 วินาที แล้วให้ Vall-E X สร้างเสียงนั้นให้พูดภาษาจีนหรือญี่ปุ่น ซึ่งตอนนี้ Vall-E X สามารถสร้างเสียงข้ามภาษาแบบนี้ได้ 3 ภาษาได้แก่ อังกฤษ จีน และ ญี่ปุ่น ที่สำคัญ Vall-E X เปิดเป็น Opensource
7) Video Generation
Video Generation คือประเภทของ AI ที่มีฟีเจอร์หลักคือสามารถสร้างวิดีโอจากอินพุตประเภทต่างๆ เช่น ข้อความ หรือรูปภาพ ลักษณะเดียวกันกับ Text-to-Image โดยเอไอประเภทนี้มีอีกชื่อเรียกหนึ่งคือ Text-to-Video ซึ่ง Generative AI ในกลุ่มของ Video Generation มีตัวอย่างดังต่อไปนี้
Runway มีความสามารถในการสร้างรูปภาพ วิดีโอ และเสียง และยังสามารถแก้ไของค์ประกอบของรูปภาพและวิดีโอได้ สามารถใช้ได้บน iOS และมีให้ใช้ทั้งเวอร์ชั่นฟรี และเสียเงิน
Lumiere ถูกพัฒนาโดย Google นอกจากการสร้างวิดีโอจากข้อความ หรือรูปภาพนิ่งได้แล้ว ยังสามารถทำบางส่วนของภาพนิ่งให้เคลื่อนไหวได้ เปลี่ยนสไตร์วิดีโอได้ และเพิ่มส่วนที่ขาดหายไปของวิดีโอก็ได้ แต่ตอนนี้ยังไม่เปิดให้คนทั่วไปได้ใช้งาน
Sora ถูกพัฒนาโดย OpenAI โดยความสามารถของ Sora คล้ายกับ Lumiere แต่ฟีเจอร์ที่เปิดเผยออกมาในตอนนี้ยังไม่มากเท่า Lumiere แต่อธิบายถึงจุดอ่อนของ Sora ไว้ด้วย เช่นความเข้าใจของเอไอในเรื่องฟิสิกส์ และความเป็นเหตุเป็นผล และตอนนี้ยังไม่เปิดให้คนทั่วไปได้ใช้งาน
บริการ Generative AI ประเภทอื่น ๆ
และนี้คือ รวมบริการ Generative AI ที่เราสามารถใช้งานได้จริง แต่นอกจาก Generative AI ประเภทต่าง ๆ ที่กล่าวมาข้างต้นยังมีการนำเอไอไปประยุกต์ใช้ในแอปต่าง ๆ เช่น การออกแบบสไลด์เช่น AI ใน Canva หรือกาใช้ AI เพื่อช่วยออกแบบห้อง เช่นในเว็บไซต์ RoomGPT.io และ aihomedesign.com
ข้อจำกัดของ Generative AI ที่เวลาใช้ต้องระวัง
- ความถูกต้อง: เนื้อหาที่สร้างโดย Generative AI อาจไม่ถูกต้องเสมอไป
- ความเป็นต้นฉบับ: เนื้อหาที่สร้างโดย Generative AI อาจไม่ใช่ผลงานต้นฉบับก็ได้
- จริยธรรม: การใช้ Generative AI อาจส่งผลต่อประเด็นจริยธรรม เช่น การละเมิดลิขสิทธิ์ เป็นต้น
อ่านบทความและข่าวอื่นๆเพิ่มเติมได้ที่ it24hrs.com
รวมบริการ Generative AI ประเภทต่าง ๆ ที่ใช้งานได้จริงในปัจจุบัน
อย่าลืมกดติดตามอัพเดตข่าวสาร ทิปเทคนิคดีๆกันนะคะ Please follow us
Youtube it24hrs
Twitter it24hrs
Tiktok it24hrs
facebook it24hrs