รวมบริการ Generative AI ประเภทต่าง ๆ ที่ใช้งานได้จริงในปัจจุบัน

รวมบริการ Generative AI ประเภทต่าง ๆ ที่ใช้งานได้จริงมีอะไรบ้าง? ตอนนี้เป็นยุคของ AI หลังจากที่ ChatGPT เปิดตัวมา โลกก็หันมาสนใจเอไออย่างจริงจัง และเอไอก็ถูกพัฒนาเพื่อใช้งานในหลายประเภท แล้วตอนนี้เอไอมีอะไรบ้างที่เราสามารถใช้งานได้จริง หรือน่าจะใช้ได้ในอนาคตอันใกล้นี้

Generative AI คืออะไร

Generative AI หรือ ปัญญาประดิษฐ์เชิงกำเนิด คือ เทคโนโลยี AI รูปแบบใหม่ ที่สามารถสร้างเนื้อหาใหม่ ๆ ได้ โดยไม่ต้องอาศัยข้อมูลที่มีอยู่จริง โดยมีหลักการดังนี้

การเรียนรู้: โดย Generative AI จะเรียนรู้รูปแบบและโครงสร้างของข้อมูลตัวอย่าง (Training Data)
การสร้าง: โดย Generative AI จะสร้างเนื้อหาใหม่ ๆ โดยใช้รูปแบบและโครงสร้างที่เรียนรู้มา

การมาของ Generative AI จะช่วย เพิ่มประสิทธิภาพการทำงาน: ช่วยให้ทำงานได้เร็วขึ้น ประหยัดเวลาและทรัพยากร ช่วยได้ไอเดียใหม่ๆโดยมี AI เป็นผู้ช่วย และช่วยได้ข้อมูลที่ไม่สามารถหาได้จากแหล่งข้อมูลทั่วไป จากข้อดีดังกล่าวทำให้ Generative AI มีแนวโน้มจะถูกนำมาใช้ในทุกงานและทุกอุตสาหกรรมมากขึ้น แต่ก็เป็นเรื่องที่ต้องระวังในเรื่องความถูกต้องของเนื้อหาด้วย

Generative AI ประเภทต่าง ๆ มีอะไรบ้าง

AI ถูกนำมาประยุกต์ใช้กับงานที่หลายหลาย ทั้งที่เรารู้และใช้งานได้โดยตรง และเอไอที่ทำานอยู่เบื่องหลังแอป หรือโปรแกรมต่าง ๆ ที่เราไม่รู้ว่ามันมีตัวตนอยู่ แต่ในบทความนี้จะกล่าวถึงเอไอในขอบเขตของบริการที่เราสามารถใช้งานได้โดยตรง เพื่อดูว่า ณ. ปัจจุบันนี้เราสามารถใช้เอไอทำงานอะไรให้เราได้บ้าง ซึ่งเราสามารถแบ่งบริการ Generative AI ตามประเภทการใช้งานได้ 7 ประเภท ได้แก่

Text Generation
Code Generation
Image Generation
3D Generation
Music Generation
Audio Generation
Video Generation

1) Text Generation

Text Generation คือประเภทของ AI ที่ใช้เพื่อสร้างข้อความจาก Prompt ที่ผู้ใช้ป้อนเข้าไป เช่น การสร้างบทกวี บทความ บทพูด บทละคร คำแนะนำ คำโฆษณา ไปจนถึงการเขียนสคริปต์แนะนำธุรกิจ สคริปต์แนะนำสินค้าและบริการ การเขียนสรุปบทความที่น่าสนใจ มีตัวอย่างเอไอที่ให้บริการรูปแบบนี้ดังต่อไปนี้

ChatGPT

ChatGPT คือแชทบอทที่มี AI ที่ชื่อว่า GPT ทำงานอยู่เบื้องหลัง พัฒนาโดย OpenAI โดย GPT นี้เป็นโมเดลเอไอภาษาขนาดใหญ่ที่ชื่อว่า LLM หรือ Large Language Models รองรับภาษาไทยได้ โดย ChatGPT ที่มี GPT-3.5 ทำงานอยู่เบื่องหลังจะสามารถใช้ได้ฟรี แต่ฐานข้อมูลที่ใช้ในการเทรนจะมีจนถึงเดือน ม.ค. 2020 เท่านั้น ขณะ ChatGPT ที่มี GPT-4 จะต้องเสียเงินแต่ก็มีฟีเจอร์มากขึ้น และฐานข้อมูลที่ใช้ในการเทรนจะอัปเดตจนถึงปัจจุบัน

Introducing GPTs in ChatGPT

Gemini

Gemini คือแชทบอทที่มี AI ทำงานอยู่เบื่องหลัง พัฒนาโดย Google ก่อนที่จะใช้ชื่อ Gemini เคยใช้ชื่อว่า Bard มาก่อน Gemini นี้รองรับภาษาไทย และใช้งานฟรี มีการอัปเดตฐานข้อมูลเป็นปัจจุบัน

The capabilities of multimodal AI | Gemini Demo

ถึงแม้ว่าทั้ง ChatGPT และ Gemini จะมีบริการหลักเป็น แชทบอทแต่ก็มีความสามารถอื่นๆ อีกมากมาย เช่นการรับอินพุตเป็นภาพ เสียง หรือคลิปวิดีโอ และเอาท์พุตของเอไอทั้งสองตัวนี้ก็ไม่มีมีแต่ข้อความเท่านั้น แต่ยังมีเอาท์พุตในรูปแบบอื่นเช่นการเขียนโค้ด ซึ่งถ้าจะกล่าวถึงเอไอที่ให้บริการเพื่อสร้างข้อความเป็นหลักก็มีเอไอตัวอื่น ๆ อีกเช่น

Copi.AI

AI ที่ใช้ในการช่วยสร้างงานเขียนรูปแบบต่างๆ สำหรับ นักเขียน นักการตลาด และเจ้าของธุรกิจ รองรับภาษาไทยมีทั้งเวอร์ชั่นฟรีและเสียเงิน

Frase.io

AI สำหรับเขียนบทความ SEO โดยเฉพาะ มีเครื่องมือที่ชื่อว่า SEO Competitive Research ที่จะวิเคราะห์ข้อมูลคู่แข่งที่ปรากฏบนผลการค้นหาของกูเกิ้ลแบบละเอียด เช่น บทความคู่แข่งมาจากเว็บไหน มีหัวข้อ และเนื้อหาอะไรบ้าง มีการแสดงข้อมูลต่าง ๆ ที่ช่วยในการเขียนบทความ เช่น คำถาม สถิติ ข้อมูลใหม่ ๆ เอไอตัวนี้สามารถใช้งานเป็นภาษาไทยได้ แต่มีเฉพาะเวอร์ชั่นเสียเงินเท่านั้น

Rytr

AI เขียนคอนเทนต์ เช่น แต่งเรื่อง เขียน Youtube Description อีเมล และ บทความ SEO เป็นต้น สามารถเขียนบทความที่กระชับ เข้าใจง่าย รองรับภาษาไทยมีทั้งเวอร์ชั่นฟรีและเสียเงิน

2) Code Generation

Code Generation คือประเภทของ AI ที่สามารถเขียนโค้ดให้เรา โดยที่เราเพียงแค่ Prompt สั่งงานเท่านั้น นอกจากเขียนโค้ดแล้วยังสามารถวิเคราะห์โค้ด ระบุจุดบกพร่อง ชี้ช่องโหว่ และให้คำแนะนำเกี่ยวกับวิธีการแก้ไขได้อีกด้วย Generative AI ในกลุ่มของ Code Generation มีตัวอย่างดังต่อไปนี้

GitHub Copilot

GitHub Copilot พัฒนาโดย GitHub ร่วมกับ OpenAI เพื่อเป็นเครื่องมือช่วยเหลือด้านการเขียนโปรแกรมที่ขับเคลื่อนด้วย AI สามารถแนะนำบรรทัด หรือบล็อกของโค้ดขณะที่เราเขียนโปรแกรมได้

What is GitHub Copilot?

Replit GhostWriter

เป็นผลิตภัณฑ์ของ Replit สิ่งที่ทำให้ GhostWriter แตกต่างคือการทำงานร่วมกับโปรแกรมแก้ไขโค้ดออนไลน์อย่างราบรื่น Replit ทำให้ผู้เขียนโค้ดสามารถเขียน รัน และดีบักโค้ดได้ในที่เดียว

CodeWhisperer

Amazon สามารถให้คำแนะนำได้แบบเรียลไทม์ เช่น ฟังก์ชันต่างๆ และรับประกันคุณภาพของโค้ดด้วยการเน้นคำแนะนำที่มาจากข้อมูลโอเพ่นซอร์ส นอกจากนี้ ยังจัดลำดับความสำคัญด้านความปลอดภัยของโค้ด โดยระบุจุดที่ควรแก้ไข และนำเสนอวิธีที่ควรแก้ไขทันที

What is Amazon CodeWhisperer? | Amazon Web Services

3) Image Generation

Image Generation คือประเภทของ AI ที่สามารถสร้างภาพจาก Prompt หรือที่เราเรียกว่า Text-to-Image สามารถสร้างภาพได้หลายประเภท เช่น ภาพ Sketch, ภาพสีนํ้า, ภาพสีนํ้ามัน, ภาพการ์ตูน หรือภาพสมจริง นอกจากการสร้างภาพทั้งภาพแล้วยังสามารถตัดต่อบางส่วนของภาพได้เช่น การลบพื้นหลัง หรือบางส่วนออกจากภาพ โดย AI จะเติมเต็มพื้นหลังให้อัตโนมัติ ถึงจะสร้างภาพได้เหมือนจริง แต่ก็ยังมีปัญหาในเรื่องการสร้างภาพนิ้วของคนอยู่บ้าง เช่น มีนิ้วเกิน 5 นิ้ว หรือมีไม่ครบ AI ในกลุ่มของ Image Generation มีตัวอย่างดังต่อไปนี้

DALL-E

DALL-E เป็น Text-to-Image AI ที่พัฒนาโดย Microsoft สามารถใช้งานได้ฟรี 100 ครั้ง โดยในแต่ละครั้งจะ AI จะสร้างภาพให้เรา 4 ภาพ นอกจากการสร้างภาพที่เป็นฟีเจอร์หลักแล้ว ยังสามารถค้นหาไอเดียจากภาพของคนอื่นๆ รวมถึงมีปุ่ม Surprise Me ที่ระบบจะคิดประโยคสำหรับสร้างรูปให้เรา

Introducing DALL·E 3

Midjourney

Midjourney เปิดโอกาสให้สามารถทดลองสร้างภาพฟรีได้ 25 ครั้ง ซึ่งการใช้ Midjourney นั้นจะต้องเข้าไปใน Discord ของ Midjourney แล้วป้อน Prompt ลงในนั้น แล้ว AI จะสร้างภาพให้เราครั้งละ 4 ภาพ สามารถเลือกภาพที่ถูกใจ แล้วเพิ่มความละเอียดได้ แต่ถ้าอยากใช้ 25 ครั้งจะต้องเสียเงิน แล้ว จะใช้ Midjourney ได้ในลักษณะของ Bot ใน Discord

รวมบริการ Generative AI — ที่มาของภาพ : midjourney.com

Stable Diffusion

Stable Diffusion คือเอไอแบบ Open source ที่สามารถใช้ได้ฟรี ๆ และเพราะเป็น Open source ทำให้ Stable Diffusion มีลูกเล่นที่เยอะมาก ๆ สามารถปรับแต่งและตั้งค่าต่าง ๆ ได้เยอะ ไปจนถึงผู้ใช้สร้างมากสร้างโมเดลของตัวเอง และแชร์ให้คนอื่นใช้ได้ แต่ Stable Diffusion จะไม่มี UI ให้ใช้ผ่านเว็บไซต์หรือแอปพลิเคชัน ถ้าต้องการใช้จะต้องดาวน์โหลดจาก GitHub ไปติดตั้งที่เครื่องคอมพิวเตอร์ หรือใช้ผ่าน Google Colab นั้นทำให้เห็นว่า ถึงแม้ว่า Stable Diffusion จะมีฟีเจอร์เยอะ และฟรี แต่ก็ไม่ได้ใช้งานง่าย ทำให้มีหลายเว็บไซต์ที่สร้างเว็บ หรือแอป Text-to-Image AI ที่มี Stable Diffusion ทำงานอยู่เบื่องหลัง

4) 3D Generation

3D Generation คือประเภทของ AI ที่สามารถสร้างโมเดล 3 มิติจาก Prompt หรือ Text-to-3D ซึ่งจะมีลักษณะคล้ายๆ Text-to-Image

Luma AI

การใช้งาน Luma AI จะเป็นลักษณะเดียวกันกับ Midjourney คือต้องเข้าไปใช้ใน Discord ป้อน Prompt ลงในนั้น แล้ว AI จะสร้างโมเดลมาให้เราครั้งละ 4 โมเดล สามารถปรับแต่งโมเดลได้เล็กน้อยก่อนดาวน์โหลด

Luma AI – Launch

Meshy.ai

ฟีเจอร์หนึ่งที่ Meshy.ai แตกต่างจากเอไอตัวอื่นคือ นอกจากการสร้างโมเดล 3D จาก Prompt แล้ว ยังสามารถ สร้างโมเดล 3D จากภาพได้ด้วย

Introducing Meshy-1: Generate 3D Models with AI in Just a Minute

MasterpieceX

สามารถทำโมเดล 3D ได้ใน 4 ขั้นตอน โดยทำได้ 3 ประเภทก็คือ สิ่งของ สัตว์ และคน และฟีเจอร์ที่แตกต่างคือสามารถขยับส่วนของโมเดลได้

Introducing – Masterpiece X – 3D Remix Trailer

5) Music Generation

Music Generation คือประเภทของ AI ที่สามารถแต่งเพลงได้จาก Prompt ที่ป้อนเข้าไป สามารถแต่งเพลงได้หลากหลายแนว โดยกระบวนการสร้างเพลงนั้น AI จะเริ่มต้นด้วยการวิเคราะห์ข้อมูลเพลงที่มีอยู่ เช่น การเรียบเรียงดนตรี การบันทึกเสียง และโน้ตเพลง ข้อมูลเหล่านี้จะถูกนำมาใช้เพื่อฝึกอัลกอริธึมให้เกิดการเรียนรู้ เพื่อสร้างเพลงใหม่ ๆ ตามรูปแบบ และโครงสร้างที่ผู้ใช้งานกำหนด Generative AI ในกลุ่มของ Music Generation มีตัวอย่างดังต่อไปนี้

Amper Music

ผู้ใช้งาน Amper Music ไม่จำเป็นต้องมีความรู้เชิงลึกเกี่ยวกับทฤษฎีดนตรี หรือการประพันธ์เพลงเนื่องจาก Amper สามารถแทร็กดนตรีจากตัวอย่างที่บันทึกไว้ล่วงหน้า จากนั้นจะแปลงสิ่งเหล่านั้นเป็นเสียงจริง ซึ่งสามารถแก้ไขได้ด้วยคีย์เพลง จังหวะ และเครื่องดนตรีแต่ละชิ้นให้เหมาะกับอารมณ์หรือบรรยากาศ

AIVA

AIVA ถูกพัฒนามาตั้งแต่ปี 2016 และได้รับการปรับปรุงอย่างต่อเนื่อง สามารแต่งเพลงประกอบสำหรับโฆษณา วิดีโอเกม ภาพยนตร์ และอื่น ๆ ช่วยให้ผู้ใช้สามารถพัฒนาเพลงตั้งแต่เริ่มต้น และช่วยสร้างรูปแบบต่าง ๆ ของเพลงที่มีอยู่ได้

I am AI – AI Composed Music by AIVA

Amadeus Code

เป็น AI สร้างเพลงที่สามารถใช้ได้ผ่านแอปบน iOS Amadeus Code อาศัยเอนจิ้น AI ที่บรรจุคอร์ดของเพลงดังๆ ในโลก จากนั้นก็จะใช้เพลงเหล่านี้สร้างโครงสร้างใหม่ของเพลงขึ้นมาใหม่ หรือสร้างแค่บางส่วนของเพลงก็ได้

How Amadeus Code creates melodies

6) Audio Generation

Audio Generation คือประเภทของ AI ที่สามารถสร้างเสียง หรือเลียนแบบเสียงพูดของมนุษย์ได้ หรือ Text-to-Speech เราสามารถนำ AI ไปสร้างหนังสือเสียง หรือ เสียงบรรยายต่าง ๆ ได้ แต่ถึงแม้ว่า AI จะสามารถพูดได้อย่างลื่นไหลและสามารถปรับแต่งอารมณ์ของเสียงได้บ้าง แต่เสียงที่ต้องใช้อารมณ์เยอะ ยังไม่สามารถทำได้ดีนัก Generative AI ในกลุ่มของ Audio Generation ที่เราคุ้นเคยกันดีก็คือ Siri หรือ Google translate และนอกจากเอไอสองตัวนี้ยังมีตัวอย่างเช่น

Typecast.ai

Typecast.ai มีตัวละครให้เลือกได้ โดยแต่ละตัวละครจะมีน้ำเสียงต่างกัน เช่น น้ำเสียงสำหรับการบรรยายสารคดี หรือน้ำเสียงสำหรับการบรรยายผ่านวิทยุ ผู้ใช้ยังสามารถเลือกอารมณ์ของน้ำเสียงได้ เช่น เศร้า โมโห หงุดหงิด แต่เอไอตัวนี้ยังไม่รองรับภาษาไทย

Meet New Typecast: AI actors that perform along with your content

Play.ht

ผู้ใช้สามารถนำบทมาแปลงเป็นเสียงได้เหมือนกับให้เจ้าของภาษามาบรรยายจริงๆ จุดเด่นของ Play.ht คือมีภาษาให้เลือกมากกว่า 100 ภาษารวมถึงภาษาไทย โดยเราสามารถทดลองใช้ได้ฟรี แต่จะจำกัดจำนวนคำที่ใช้แปลงเป็นเสียงที่ 5,000 คำ และสามารถดาวน์โหลดเสียงได้ 3 ครั้ง

VoiceOverMaker

VoiceOverMaker รองรับภาษาไทย โดยจะมีเสียงภาษาไทยให้เลือกทั้งหมด 3 เสียง มีเครดิตให้ทดลองใช้ฟรี 800 เครดิต สามารถดาวน์โหลดเสียงนั้นเป็นไฟล์ wav และ mp3 ได้

Vall-E และ Vall-E X

นอกจากนี้ยังมี AI ที่ชื่อว่า Vall-E ที่สามารถเลียนแบบเสียงจากเสียงตัวอย่างแค่ 3 วินาที เพื่อนำไปพูดตามข้อความที่เรากำหนด นั้นหมายความว่าเราสามารถใช้ Vall-E สร้างเสียงที่เราต้องการให้พูดอะไรก็ได้ นอกจากนี้ยังมีฟีเจอร์ที่สามารถใส่อารมณ์ไปในประโยคได้ เช่น โกรธ หรือง่วง และในตอนนี้ Vall-E ก็ได้พัฒนาต่อมาเป็น Vall-E X ที่มีฟีเจอร์เพิ่มขึ้นมาคือ สามารถพูดข้ามภาษาได้ เช่น เราใช้เสียงต้นฉบับภาษาอังกฤษความยาว 3-10 วินาที แล้วให้ Vall-E X สร้างเสียงนั้นให้พูดภาษาจีนหรือญี่ปุ่น ซึ่งตอนนี้ Vall-E X สามารถสร้างเสียงข้ามภาษาแบบนี้ได้ 3 ภาษาได้แก่ อังกฤษ จีน และ ญี่ปุ่น ที่สำคัญ Vall-E X เปิดเป็น Opensource

7) Video Generation

Video Generation คือประเภทของ AI ที่มีฟีเจอร์หลักคือสามารถสร้างวิดีโอจากอินพุตประเภทต่างๆ เช่น ข้อความ หรือรูปภาพ ลักษณะเดียวกันกับ Text-to-Image โดยเอไอประเภทนี้มีอีกชื่อเรียกหนึ่งคือ Text-to-Video ซึ่ง Generative AI ในกลุ่มของ Video Generation มีตัวอย่างดังต่อไปนี้

Runway

Runway มีความสามารถในการสร้างรูปภาพ วิดีโอ และเสียง และยังสามารถแก้ไของค์ประกอบของรูปภาพและวิดีโอได้ สามารถใช้ได้บน iOS และมีให้ใช้ทั้งเวอร์ชั่นฟรี และเสียเงิน

Gen-2 Now Available | Runway

Lumiere

Lumiere ถูกพัฒนาโดย Google นอกจากการสร้างวิดีโอจากข้อความ หรือรูปภาพนิ่งได้แล้ว ยังสามารถทำบางส่วนของภาพนิ่งให้เคลื่อนไหวได้ เปลี่ยนสไตร์วิดีโอได้ และเพิ่มส่วนที่ขาดหายไปของวิดีโอก็ได้ แต่ตอนนี้ยังไม่เปิดให้คนทั่วไปได้ใช้งาน

Lumiere

Sora

Sora ถูกพัฒนาโดย OpenAI โดยความสามารถของ Sora คล้ายกับ Lumiere แต่ฟีเจอร์ที่เปิดเผยออกมาในตอนนี้ยังไม่มากเท่า Lumiere แต่อธิบายถึงจุดอ่อนของ Sora ไว้ด้วย เช่นความเข้าใจของเอไอในเรื่องฟิสิกส์ และความเป็นเหตุเป็นผล และตอนนี้ยังไม่เปิดให้คนทั่วไปได้ใช้งาน

Introducing Sora — OpenAI’s text-to-video model

บริการ Generative AI ประเภทอื่น ๆ

และนี้คือ รวมบริการ Generative AI ที่เราสามารถใช้งานได้จริง แต่นอกจาก Generative AI ประเภทต่าง ๆ ที่กล่าวมาข้างต้นยังมีการนำเอไอไปประยุกต์ใช้ในแอปต่าง ๆ เช่น การออกแบบสไลด์เช่น AI ใน Canva หรือกาใช้ AI เพื่อช่วยออกแบบห้อง เช่นในเว็บไซต์ RoomGPT.io และ aihomedesign.com

ข้อจำกัดของ Generative AI ที่เวลาใช้ต้องระวัง

ความถูกต้อง: เนื้อหาที่สร้างโดย Generative AI อาจไม่ถูกต้องเสมอไป
ความเป็นต้นฉบับ: เนื้อหาที่สร้างโดย Generative AI อาจไม่ใช่ผลงานต้นฉบับก็ได้
จริยธรรม: การใช้ Generative AI อาจส่งผลต่อประเด็นจริยธรรม เช่น การละเมิดลิขสิทธิ์ เป็นต้น

อ่านบทความและข่าวอื่นๆเพิ่มเติมได้ที่ it24hrs.com

รวมบริการ Generative AI ประเภทต่าง ๆ ที่ใช้งานได้จริงในปัจจุบัน

อย่าลืมกดติดตามอัพเดตข่าวสาร ทิปเทคนิคดีๆกันนะคะ Please follow us

Youtube it24hrs
Twitter it24hrs
Tiktok it24hrs
facebook it24hrs

รวมบริการ Generative AI ประเภทต่าง ๆ ที่ใช้งานได้จริงในปัจจุบัน

Generative AI คืออะไร

Generative AI ประเภทต่าง ๆ มีอะไรบ้าง

1) Text Generation

2) Code Generation

3) Image Generation

4) 3D Generation

5) Music Generation

6) Audio Generation

7) Video Generation

บริการ Generative AI ประเภทอื่น ๆ

ข้อจำกัดของ Generative AI ที่เวลาใช้ต้องระวัง

อ่านเพิ่มเติม

รมว.อว. เปิดค่าย Super AI Engineer Season 6 Level 2 สร้างกำลังคน AI แบบเข้มข้น สู่ AI Economy

Instagram for TV ดาวน์โหลดลงทีวีใช้งานจริงได้แล้ว ขยายภาพถ่ายและ Reel ชมบนจอทีวีเต็มตา

Five Eyes เตือน AI อาจเร่งการโจมตีไซเบอร์รุนแรงภายในไม่กี่เดือนข้างหน้า

Discord ทดสอบฟีเจอร์ Living Room เปลี่ยนหน้าจอคอมเป็นห้องนั่งเล่น

Generative AI คืออะไร

Generative AI ประเภทต่าง ๆ มีอะไรบ้าง

1) Text Generation

2) Code Generation

3) Image Generation

4) 3D Generation

5) Music Generation

6) Audio Generation

7) Video Generation

บริการ Generative AI ประเภทอื่น ๆ

ข้อจำกัดของ Generative AI ที่เวลาใช้ต้องระวัง

อ่านเพิ่มเติม

เว็บแนะนำ

Footer