Roblox เปิดตัวโมเดลพื้นฐาน 3D “Cube 3D” เพื่อการสร้างสรรค์ในเกม

Share

วันนี้ Roblox ประกาศเปิดตัวโมเดลพื้นฐาน 3D ใหม่ล่าสุด ซึ่งก็คือ Cube 3D โมเดลนี้จะช่วยให้ครีเอเตอร์บน Roblox สามารถสร้างสรรค์ผลงาน 3D ได้โดยตรงจากในเกมและประสบการณ์ของพวกเขาเอง

เมื่อช่วงฤดูใบไม้ร่วงที่ผ่านมา Roblox ได้ประกาศโปรเจกต์ในการสร้างโมเดลพื้นฐาน 3D แบบโอเพนซอร์ส เพื่อใช้สร้างวัตถุและฉาก 3D บนแพลตฟอร์ม Roblox และในสัปดาห์นี้ พวกเขาได้เปิดตัวโมเดลเวอร์ชันแรกให้ทุกคนสามารถนำไปใช้ได้บน Roblox, GitHub และ HuggingFace โดยมีชื่อว่า Cube 3D นอกจากนี้ Roblox ยังได้เปิดตัวความสามารถแรกของโมเดล นั่นก็คือ Mesh Generation API ในรุ่นเบต้า ซึ่ง Cube จะเป็นรากฐานสำคัญสำหรับเครื่องมือ AI ที่ Roblox จะพัฒนาขึ้นในอนาคต รวมถึงเครื่องมือสร้างฉากที่ซับซ้อนมากๆ ด้วย โดยในอนาคต Cube จะเป็นโมเดลแบบมัลติโมดอล ที่เทรนมากับข้อมูลหลากหลายประเภท ทั้งข้อความ รูปภาพ วิดีโอ และอื่นๆ อีกมากมาย และจะทำงานร่วมกับเครื่องมือ AI ที่มีอยู่ของ Roblox ได้อย่างลงตัว

Cube 3D

Cube 3D สามารถสร้างโมเดลและสภาพแวดล้อม 3D ได้โดยตรงจากข้อความ (Prompt) และในอนาคตก็จะสามารถสร้างจากรูปภาพได้ด้วย ปัจจุบัน การสร้าง 3D ที่ล้ำสมัยส่วนใหญ่จะใช้ภาพและวิธีการสร้างใหม่ แต่วิธีนี้เหมาะสำหรับกรณีที่ไม่มีข้อมูลการเทรน 3D ที่เพียงพอเท่านั้น ด้วยเหตุนี้ Roblox จึงใช้ประโยชน์จากลักษณะเฉพาะของแพลตฟอร์มตัวเอง โดยการเทรนโมเดลด้วยข้อมูล 3D ดั้งเดิม ทำให้วัตถุที่สร้างขึ้นสามารถใช้งานร่วมกับเอ็นจินเกมได้ในปัจจุบัน และยังขยายให้วัตถุเหล่านั้นใช้งานได้จริงอีกด้วย

ความแตกต่างนี้คล้ายกับการเปรียบเทียบฉากจำลองสนามแข่งรถกับสนามแข่งรถจริงๆ ในทีวี เราอาจจะเห็นสิ่งที่ดูเหมือนสนามแข่งรถที่ใช้งานได้สมบูรณ์ แต่ถ้าเราลองเดินเข้าไปในฉากนั้น เราก็จะรู้ว่าโครงสร้างต่างๆ นั้นแบนราบ การจะสร้างโลก 3D ที่สมจริงได้นั้น โครงสร้างต่างๆ จำเป็นต้องสมบูรณ์และใช้งานได้จริง

เพื่อให้บรรลุเป้าหมายนี้ Roblox ได้รับแรงบันดาลใจจากโมเดลล้ำสมัยที่เทรนมากับโทเค็นข้อความ เพื่อให้สามารถคาดการณ์โทเค็นถัดไปเพื่อสร้างประโยคได้ โดยนวัตกรรมของ Roblox มีพื้นฐานมาจากแนวคิดหลักเดียวกัน นั่นก็คือการสร้างความสามารถในการสร้างโทเค็นวัตถุ 3D และทำความเข้าใจรูปร่างเป็นโทเค็น และเทรน Cube 3D ให้คาดการณ์โทเค็นรูปร่างถัดไปเพื่อสร้างวัตถุ 3D ที่สมบูรณ์ และเมื่อขยายสิ่งนี้ไปสู่การสร้างฉากเต็มรูปแบบ Cube 3D ก็จะทำนายเลย์เอาต์ จากนั้นจึงทำนายรูปร่างแบบเรียกซ้ำ

ทุกคนสามารถปรับแต่ง พัฒนาปลั๊กอิน หรือเทรน Cube 3D ด้วยข้อมูลของตัวเองเพื่อให้ตรงกับความต้องการของตัวเองได้ ซึ่ง Roblox เชื่อว่าเครื่องมือ AI ควรถูกสร้างขึ้นบนหลักการของความเปิดเผยและความโปร่งใส และนั่นก็เป็นเหตุผลที่พวกเขามุ่งมั่นที่จะเป็นส่วนหนึ่งของชุมชน AI แบบโอเพนซอร์ส Roblox ได้เปิดตัวโมเดลความปลอดภัย AI ของตัวเอง เนื่องจากพวกเขารู้สึกว่าการแบ่งปันความก้าวหน้าในด้านความปลอดภัยของ AI จะช่วยให้อุตสาหกรรมโดยรวมสามารถเร่งนวัตกรรมและความก้าวหน้าทางเทคนิคได้ ด้วยเหตุนี้ Roblox จึงได้ช่วยก่อตั้ง ROOST ซึ่งเป็นองค์กรไม่แสวงหาผลกำไรแห่งใหม่ที่มุ่งมั่นที่จะจัดการกับประเด็นสำคัญในด้านความปลอดภัยทางดิจิทัลด้วยเครื่องมือความปลอดภัยแบบโอเพนซอร์ส และในการเปิดตัว Cube 3D นี้ Roblox มีเป้าหมายที่จะช่วยให้นักวิจัย นักพัฒนา และชุมชน AI ในวงกว้าง สามารถเรียนรู้ เพิ่มเติม และพัฒนาอุตสาหกรรมการสร้าง 3D ในวงกว้างได้

Cube 3D สำหรับการสร้างสรรค์

Roblox ได้พูดถึงไปก่อนหน้านี้แล้วว่า AI สามารถเร่งการสร้างแอสเซท 3D เครื่องประดับ และประสบการณ์ต่างๆ ได้อย่างไร ซึ่งในท้ายที่สุดแล้ว AI จะช่วยให้การเล่นและการเชื่อมต่อมีความสมจริงและเป็นส่วนตัวมากยิ่งขึ้น โดย Roblox ได้ลงทุนในโครงสร้างพื้นฐานเพื่อรองรับ AI ในทุกขั้นตอนของวงจรการสร้างสรรค์ ทั้งสำหรับนักพัฒนาประสบการณ์เหล่านี้ และผู้ใช้ที่ใช้เวลาอยู่ในนั้น ซึ่ง Roblox มองเห็นอนาคตที่นักพัฒนาจะมอบวิธีใหม่ๆ ให้ผู้ใช้ในการสร้างสรรค์ โดยการเปิดใช้งาน AI ในประสบการณ์ของพวกเขา ซึ่งจะทำให้ผู้ใช้งานมากกว่า 85 ล้านคนต่อวันสามารถเข้าถึงพลังของ AI ได้ ซึ่งเป็นส่วนหนึ่งของการเล่นเกมของพวกเขา

ในช่วงปีที่ผ่านมา Roblox ได้แนะนำฟีเจอร์ใหม่ๆ หลายอย่างผ่านผู้ช่วยที่ขับเคลื่อนด้วย AI ของพวกเขาภายใน Roblox Studio เพื่อให้นักพัฒนามีเครื่องมือและความสามารถที่พวกเขาต้องการในการสร้างสรรค์ และลดชั่วโมงการทำงานด้วยตนเอง และด้วย Cube นี้ Roblox ตั้งใจที่จะทำให้การสร้าง 3D มีประสิทธิภาพมากยิ่งขึ้น ด้วยการสร้างเมช 3D นักพัฒนาจะสามารถสำรวจทิศทางความคิดสร้างสรรค์ใหม่ๆ ได้อย่างรวดเร็ว และเพิ่มผลผลิตของพวกเขา โดยการตัดสินใจได้อย่างรวดเร็วว่าจะดำเนินการกับสิ่งใด

ลองจินตนาการถึงการสร้างเกมแข่งรถ ในวันนี้ นักพัฒนาสามารถใช้ Mesh Generation API ภายใน Assistant โดยการพิมพ์ข้อความสั้นๆ เช่น “/สร้างรถจักรยานยนต์” หรือ “/สร้างกรวยนิรภัยสีส้ม” ซึ่งในไม่กี่วินาที API ก็จะสร้างเมชของวัตถุเหล่านี้ออกมา และนักพัฒนาก็สามารถตกแต่งเพิ่มเติมด้วยพื้นผิว สี และอื่นๆ ได้ ซึ่งด้วย API นี้ นักพัฒนาจะสามารถสร้างแบบจำลองอุปกรณ์ประกอบฉาก หรือออกแบบพื้นที่ของพวกเขาได้เร็วขึ้นมาก โดยไม่ต้องเสียเวลาหลายชั่วโมงไปกับการสร้างแบบจำลองวัตถุธรรมดาๆ ทำให้พวกเขามีสมาธิกับสิ่งที่สนุกกว่า เช่น การออกแบบเลย์เอาต์แทร็ก และการปรับแต่งการควบคุมรถ ซึ่ง API นี้ช่วยประหยัดเวลาได้หลายชั่วโมงในแต่ละวัตถุที่สร้างขึ้น และช่วยให้นักพัฒนามีเวลามากขึ้นในการทดลองกับแนวคิดใหม่ๆ โดยไม่ต้องกังวลว่าจะใช้เวลาและความพยายามมากเกินไป และในระยะยาว Roblox วางแผนที่จะเปิดใช้งานวัตถุที่ซับซ้อนและใช้งานได้มากขึ้น รวมถึงฉากต่างๆ ด้วย

เทคโนโลยีนี้ยังครอบคลุมไปถึงผู้ที่มีความคิดสร้างสรรค์หลายสิบล้านคนที่เล่นและเชื่อมต่อบน Roblox ในทุกๆ วัน โดย Roblox มองเห็นอนาคตที่นักพัฒนาจะช่วยให้ผู้ใช้ของพวกเขากลายเป็นผู้สร้างได้ โดยใช้ AI และเมื่อเปิดใช้งาน Mesh Generation API แล้ว ผู้เล่นจะสามารถทำให้ทุกสิ่งที่พวกเขานึกภาพออกเป็นจริงได้ หากผู้เล่นต้องการรถแห่งอนาคต พวกเขาก็สามารถพิมพ์ว่า “รถสีแดงแห่งอนาคตที่มีปีกด้านข้าง” หรือ “เสื้อแจ็คเก็ตหนังสีดำสำหรับรถจักรยานยนต์” แล้วดูมันถูกสร้างขึ้นมาได้ ซึ่งการสร้าง AI ในเกมประเภทนี้จะปลดล็อกความคิดสร้างสรรค์ระดับใหม่ทั้งหมด และผู้เล่นจะสามารถปรับแต่งประสบการณ์ของพวกเขาในรูปแบบที่นักพัฒนาไม่เคยจินตนาการมาก่อน และนั่นก็จะทำให้เกมของพวกเขาน่าดึงดูดยิ่งขึ้น

เบื้องหลัง: Cross Attention ระหว่างโทเค็น 3D และข้อความ/รูปภาพ

ความท้าทายทางเทคนิคที่สำคัญคือการเชื่อมต่อข้อความและรูปภาพกับรูปร่าง 3D ซึ่งความก้าวหน้าทางเทคนิคหลักของ Roblox คือ 3D tokenization ซึ่งช่วยให้พวกเขาสามารถแสดงวัตถุ 3D เป็นโทเค็นในลักษณะเดียวกับที่ข้อความสามารถแสดงเป็นโทเค็นได้ สิ่งนี้ทำให้พวกเขามีความสามารถในการทำนายรูปร่างถัดไป เช่นเดียวกับที่โมเดลภาษาทำนายคำถัดไปในประโยค

เพื่อให้บรรลุการสร้าง 3D Roblox ได้ออกแบบสถาปัตยกรรมแบบรวมสำหรับการสร้างออบเจ็กต์เดี่ยวแบบอัตโนมัติ การเติมเต็มรูปร่าง และการสร้างเลย์เอาต์หลายออบเจ็กต์/ฉาก โดยหม้อแปลงไฟฟ้าอัตโนมัติคือโครงข่ายประสาทที่ใช้ข้อมูลป้อนเข้าก่อนหน้าเพื่อทำนายองค์ประกอบถัดไป สถาปัตยกรรมนี้ให้ทั้งความสามารถในการปรับขนาดและความเข้ากันได้หลายรูปแบบ เพื่อเมื่อ Roblox ขยายโมเดล มันจะทำงานกับอินพุตประเภทต่างๆ มากมาย (ข้อความ ภาพ เสียง และ 3D) ซึ่ง Roblox กำลังเปิดตัวโมเดลนี้ และในระยะเริ่มต้นนี้ ผู้สร้างจะสามารถสร้างวัตถุ 3D ตามข้อความแจ้งได้ และในอนาคต Roblox ตั้งใจที่จะให้ผู้สร้างสามารถสร้างฉากทั้งหมดตามอินพุตหลายรูปแบบได้

ในการฝึกอบรม Generative Pretrained Transformer (GPT) สำหรับการสร้างรูปร่าง Roblox ใช้โทเค็นรูปร่าง 3D แบบแยก และจัดตำแหน่งโทเค็นเหล่านั้นด้วยข้อความแจ้ง ซึ่งแนวทางใหม่นี้ทำให้พวกเขาพร้อมสำหรับโลกแห่งการสร้างฉาก 3D ที่เล่นได้

Cube มุ่งหน้าไปทางไหน

ในปัจจุบัน ผู้คนส่วนใหญ่ทั่วโลกใช้ AI สำหรับข้อความ เพื่อทำนายคำในประโยค และหลายคนก็ใช้มันสำหรับรูปภาพ เพื่อทำนายพิกเซล แต่สิ่งนี้จะซับซ้อนยิ่งขึ้นเมื่อสร้างฉาก ที่ซึ่งองค์ประกอบเหล่านี้ทั้งหมดมารวมกัน และจำเป็นต้องทำงานร่วมกันในบริบท ตัวอย่างเช่น ลองนึกถึงประสบการณ์ที่มีฉากเรียบง่ายที่สามารถอธิบายได้ว่าเป็น “อวตารบนรถจักรยานยนต์หน้าสนามแข่งรถที่มีต้นไม้”

มีองค์ประกอบหลายอย่างในการสร้างประสบการณ์นี้ ต้นไม้เป็นการผสมผสานระหว่างเมช 3D สองอัน รถจักรยานยนต์เป็นเมชหนาที่มีรายละเอียดและรูปสามเหลี่ยม และอาคารสร้างขึ้นจากส่วนต่างๆ ของ Roblox อวตารบนรถมอเตอร์ไซค์มีลักษณะทางเรขาคณิตที่ซับซ้อนกว่าสำหรับร่างกาย แขนขา และศีรษะ สุดท้าย Roblox ต้องการวิธีผูกทุกอย่างเข้าด้วยกันด้วยเลย์เอาต์ ซึ่งสำหรับสิ่งนั้น พวกเขาต้องการกล่องขอบเขต ซึ่งสรุปวัตถุเพื่อกำหนดขนาดและตำแหน่ง เพื่อให้ทราบวิธีจัดเรียงรูปทรงเรขาคณิตนี้ ซึ่งนี่เป็นกระบวนการที่ต้องใช้ความอุตสาหะ แต่ AI สามารถช่วยได้ในแต่ละขั้นตอน ด้วย AI นักพัฒนาจะสามารถเข้าถึงเวอร์ชันแรกได้เร็วขึ้น และมีเวลามากขึ้นในการทดสอบแนวคิดใหม่ๆ หรือปรับแต่งฉากของพวกเขา

เมื่อถึงจุดนั้น Roblox ต้องการให้วัตถุและฉาก 3D ที่พวกเขาสร้างขึ้นมาใช้งานได้อย่างสมบูรณ์ ซึ่งพวกเขาเรียกสิ่งนี้ว่าการสร้าง 4D โดยที่มิติที่สี่คือปฏิสัมพันธ์ระหว่างวัตถุ สภาพแวดล้อม และผู้คน การบรรลุเป้าหมายนี้ต้องมีความสามารถไม่เพียงแต่ในการสร้างวัตถุและฉาก 3D ที่สมจริงเท่านั้น แต่ยังต้องเข้าใจบริบทและความสัมพันธ์ระหว่างวัตถุเหล่านั้นด้วย ซึ่งนี่คือทิศทางที่ Roblox กำลังมุ่งหน้าไปกับ Cube

นอกเหนือจากกรณีการใช้งานแรกของการสร้างเมชนี้แล้ว Roblox วางแผนที่จะขยายไปสู่การสร้างและความเข้าใจฉาก โดยพวกเขาจะสามารถให้บริการผู้ใช้ด้วยประสบการณ์ที่พวกเขาสนใจมากที่สุด และเพิ่มพูนฉากโดยการเพิ่มวัตถุในบริบท ตัวอย่างเช่น ในประสบการณ์ที่มีฉากป่า นักพัฒนาสามารถขอให้ Assistant เปลี่ยนใบไม้สีเขียวชอุ่มทั้งหมดบนต้นไม้เป็นใบไม้ร่วงเพื่อบ่งบอกถึงการเปลี่ยนแปลงของฤดูกาล ซึ่งเครื่องมือ AI Assistant ของ Roblox จะตอบสนองต่อคำขอจากนักพัฒนา ช่วยให้พวกเขาสร้าง ปรับ และปรับขนาดประสบการณ์ของพวกเขาได้อย่างรวดเร็ว

Roblox จะแบ่งปันข้อมูลอัปเดตและฟังก์ชันการทำงานใหม่ๆ ในขณะที่พวกเขาปรับปรุงและขยายโมเดลพื้นฐานของพวกเขาต่อไป และจนกว่าจะถึงตอนนั้น พวกเขาหวังว่าผู้ใช้จะสนุกกับการใช้และสร้างต่อยอดจากโมเดล Cube 3D เวอร์ชันโอเพนซอร์สของพวกเขา ซึ่งสามารถเข้าถึงได้บน GitHub และ HuggingFace

รายละเอียดเพิ่มเติม https://corp.roblox.com/newsroom/2025/03/introducing-roblox-cube

เรื่องที่น่าสนใจ