Perfusion สร้างรูปภาพจากข้อความด้วย AI ผลงานวิจัย Nvidia หน้าใหม่ที่โหดกว่าเดิม เตรียมแข่ง Midjourney | Techsauce

Perfusion สร้างรูปภาพจากข้อความด้วย AI ผลงานวิจัย Nvidia หน้าใหม่ที่โหดกว่าเดิม เตรียมแข่ง Midjourney

หากใครเคยใช้ Midjourney สร้างงานรูปภาพศิลปะมาแล้ว ก็จะเข้าใจถึงศักยภาพ AI ที่สร้างงาน ขึ้นมาว่ามันโหดแค่ไหน แต่ไม่นานมานี้ Nvidia ได้เผยงานวิจัยเกี่ยวกับ Perfusion แพลตฟอร์มสร้างรูปภาพด้วย AI ที่โหดกว่าเดิม ซึ่งมีการจัดแสดงโชว์ในงาน SIGGRAPH 2023 ที่จัดขึ้นที่ Los Angeles สหรัฐอเมริกา

AI

รายละเอียดของ Perfusion

Perfusion เป็น AI สร้างรูปภาพแบบ text-to-image แบบเดียวกันกับ Midjourney ซึ่งเป็นความร่วมมือในการวิจัยและพัฒนาโดย Nvidia และ Tel-Aviv University ในอิสราเอล โดยขนาดสเปคอยู่ที่ 100 KB AI ใช้เวลาเรียนรู้โดยรวม 4 นาที 

ในโมเดล AI ของ Perfusion มีเทคโนโลยี Key-Locking หรือการ “ล็อคข้อความ” นี้ทำงานโดยการเชื่อมต่อ คำใหม่ๆที่ผู้ใช้ต้องการเพิ่ม เช่นเมื่อเราใส่ Keyword ว่า 

A teddy dress like a Super Hero หรือ A teddy dressed in a blue suit is cooking a gourmet meal

AI

ภาพจาก : Nvidia 

จะสังเกตได้ว่าคำว่า Teddy ถูกล็อคคำไว้เรียบร้อยและเมื่อเราเพิ่มคำอื่นลงไป AI ก็จะไม่สร้างรูปผิดเพี้ยนและวิธีนี้จะไม่ทำให้เกิดการ Overfitting นั่นคือการที่โมเดล AI ไม่สามารถเรียนรู้ในสภาวะที่ซับซ้อนเกินไปได้หรือมีชุดข้อมูลไม่เพียงพอ 

ซึ่งนอกจากจะล็อคข้อความแล้วตัวเทคโนโลยียังล็อครูปแบบของภาพที่เราใส่ Keyword ไว้ด้วยและยังสามารถสร้างรูปแบบออกมาได้หลากหลายและละเอียดอีกต่างหาก

AI

ภาพจาก : Nvidia

หากอยากศึกษาถึงระบบการทำงานของโมเดล AI ที่ Perfusion ใช้เพิ่มเติมสามารถไปดูได้ที่เว็บไซต์ Nvidia.com

เปิดตัวชิปตัวใหม่ที่ดีกว่าและถูกลง

Nvidia ยังเปิดตัวชิป AI ตัวใหม่ในชื่อ Nvidia GH200 มี GPU แบบเดียวกับรุ่น H100 ซึ่งเป็นชิป AI ระดับสูงสุดของบริษัทในปัจจุบัน แต่ GH200 นี้จะมี GPU ที่มีหน่วยความจำถึง 141 กิกะไบต์ รวมถึงโปรเซสเซอร์กลาง ARM 72-Core และจะวางจำหน่ายในไตรมาสที่ 2 ในปีหน้า 

ปกติแล้วการพัฒนาหรือฝึก AI ให้เรียนรู้ในตอนนี้ย่อมมีต้นทุนและค่าใช้จ่ายที่สูงและบางครั้งต้องใช้ GPU หลายพันตัวและข้อมูลมหาศาล จากนั้นโมเดลจะถูกใช้ในซอฟต์แวร์เพื่อทำการคาดการณ์ หรือสร้างเนื้อหา โดยใช้กระบวนการที่เรียกว่าการอนุมาน

แน่นอนว่าการอนุมานมีค่าใช้จ่ายสูงในการคำนวณ และต้องใช้พลังการประมวลผลจำนวนมากทุกครั้ง ที่ซอฟต์แวร์ทำงานและต้องทำงานตลอดเวลา เช่น เมื่อสร้างข้อความหรือรูปภาพ แตกต่างจากการฝึก AI ที่ใช้การอัปเดตโมเดล AI เท่านั้น

แต่ Nvidia GH200 ถูกพัฒนาขึ้นมาสำหรับการประมวลแบบอนุมานโดยเฉพาะและหน่วยความจำ มีความจุมากขึ้นทำให้สามารถใส่โมเดล AI ขนาดใหญ่เข้าไปในระบบเดียวได้

การเปิดตัวชิป AI ใหม่ในครั้งนี้คือการประกาศสงครามกันระหว่าง Nvidia และผู้ผลิตชิปประมวลผลเจ้าอื่น รวมไปถึงบริษัทเทคโนโลยียักษ์ใหญ่มากมาย เช่น AMD, Google และ Amazon นอกจากนี้ Nvidia ยังครองส่วนแบ่งการตลาดชิป AI ถึง 80% และ GPU ของ Nvidia ยังคงเป็นที่ต้องการของบริษัทที่กำลังพัฒนาเทคโนโลยี Generative AI 

ที่มา : Decrypt, Nvidia Research, CNBC

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

SpaceVIP จัดทริปกินมื้อหรูระดับมิชลินบนอวกาศ สนนราคาต่อหัว 17.8 ล้านบาท

โอกาสสำหรับการทานอาหารสุดหรูบนอวกาศมาถึงแล้ว SpaceVIP เตรียมเปิดประสบการณ์การทานอาหารจากเชฟระดับ Michelin Star ที่ความสูงกว่า 100,000 ฟุตเหนือระดับน้ำทะเลในการผจญภัยบนขอบอวกาศ โอกา...

Responsive image

Rare Beauty จะเปลี่ยนเจ้าของ? แหล่งข่าวชี้ Selena Gomez เตรียมขายแบรนด์

Rare Beauty จะเปลี่ยนเจ้าของ? ข่าวจาก Bloomberg ออกมาว่าตอนนี้ Selena Gomez ได้เริ่มดำเนินการปรึกษาผู้เชี่ยวชาญด้านการเงินและการลงทุนเพื่อประเมินมูลค่าแบรนด์แล้ว...

Responsive image

ลุยตลาด EV ปตท.ตั้งบริษัทลูก ‘X Mobility Plus’ เป็นดีลเลอร์ขายรถไฟฟ้าจีน XPENG

PTT ตั้งบริษัทลูก ‘X Mobility Plus’ เป็นตัวแทนจำหน่ายรถยนต์ไฟฟ้า XPENG...