เปิดฉากไปแล้วอย่างยิ่งใหญ่สำหรับงาน Google I/O ประจำปี 2025 และวันแรกก็ไม่ทำให้ผิดหวัง Google ได้ขนทัพนวัตกรรมและเทคโนโลยี AI ล่าสุดมาเปิดตัวมากมาย สร้างความฮือฮาให้กับวงการเทคโนโลยีทั่วโลกอย่างแท้จริง หากคุณพลาดการติดตามสดๆ ไม่ต้องกังวล! เราได้รวบรวม 12 ประกาศสำคัญที่น่าจับตามองและจะส่งผลต่ออนาคตของเทคโนโลยีมาให้คุณแล้วที่นี่
1. 🎬 Flow: เครื่องมือสร้างภาพยนตร์ด้วย AI
Google เปิดตัว Flow เครื่องมือใหม่สำหรับผู้สร้างภาพยนตร์และนักเล่าเรื่องด้วยภาพ ช่วยให้การสร้างสรรค์คลิปวิดีโอสไตล์ภาพยนตร์มีความซับซ้อนและควบคุมได้มากขึ้น
Flow ผสานความสามารถของโมเดล AI ขั้นสูงของ Google DeepMind อย่าง Veo, Imagen และ Gemini ช่วยให้ผู้ใช้สามารถบรรยายช็อตที่ต้องการด้วยภาษาธรรมชาติ จัดการองค์ประกอบต่างๆ ของเรื่องราว (ตัวละคร, สถานที่, สไตล์) และร้อยเรียงออกมาเป็นฉากที่สวยงามได้ง่ายขึ้น โดยเน้นการควบคุมตัวละคร ฉาก และสไตล์ได้อย่างละเอียด เปิดให้ผู้ใช้ Google AI Pro และ Ultra Plan ในสหรัฐฯ ได้ทดลองใช้แล้ว
2. 📹 Veo 3: ยกระดับการสร้างวิดีโอด้วย AI พร้อมเสียงประกอบ
Veo โมเดลสร้างวิดีโอจาก AI ของ Google ได้รับการอัปเกรดเป็นเวอร์ชัน 3 โดยมีความสามารถที่โดดเด่นคือการสร้างเสียงประกอบที่สอดคล้องกับวิดีโอได้แล้ว
Veo 3 ไม่เพียงแต่ปรับปรุงคุณภาพของวิดีโอที่สร้างจากข้อความหรือรูปภาพให้ดียิ่งขึ้น แต่ยังสามารถสร้างเสียงประกอบต่างๆ เช่น เสียงการจราจรในฉากเมือง, เสียงนกร้องในสวนสาธารณะ หรือแม้กระทั่งบทสนทนาระหว่างตัวละคร พร้อมความสามารถในการทำ Lip Sync ที่แม่นยำ นอกจากนี้ Veo 2 รุ่นก่อนหน้าก็ได้รับการอัปเดตความสามารถใหม่ๆ เช่น การควบคุมกล้อง, outpainting และการลบวัตถุในวิดีโอ Veo 3 เปิดให้ผู้ใช้ AI Ultra ในสหรัฐฯ ทดลองผ่านแอป Gemini และ Flow รวมถึงผู้ใช้ระดับองค์กรผ่าน Vertex AI
3. 🎶 Lyria 2: ขุมพลังใหม่สำหรับ Music AI Sandbox
Lyria 2 โมเดล AI สำหรับสร้างสรรค์ดนตรีรุ่นใหม่ จะเข้ามาเสริมพลังให้กับ Music AI Sandbox ของ Google เปิดโอกาสให้นักดนตรีและผู้สร้างสรรค์ได้สำรวจการใช้ AI ในการสร้างเพลง
Google ได้อธิบายถึงการทำงานของ Music AI Sandbox ที่ขับเคลื่อนโดย Lyria 2 ซึ่งจะช่วยให้นักสร้างสรรค์สามารถทดลองสร้างดนตรีด้วย AI ได้หลากหลายรูปแบบมากขึ้น เครื่องมือนี้เปิดให้ใช้งานผ่าน YouTube Shorts และสำหรับลูกค้าองค์กรผ่าน Vertex AI
4. 🖼️ Imagen 4: โมเดลสร้างภาพสุดล้ำ รายละเอียดคมชัด
Imagen โมเดลสร้างภาพ AI ของ Google ได้รับการอัปเกรดเป็น Imagen 4 ซึ่งมาพร้อมความสามารถในการสร้างภาพที่มีรายละเอียดสูงและความแม่นยำที่น่าทึ่ง โดยเฉพาะการจัดการข้อความภายในภาพ




Imagen 4 สามารถสร้างภาพความละเอียดสูงถึง 2K มีความคมชัดในรายละเอียดเล็กๆ น้อยๆ เช่น ผิวหนัง ขนสัตว์ และพื้นผิวที่ซับซ้อน รองรับทั้งสไตล์ภาพถ่ายสมจริงและนามธรรม และยังเก่งเรื่องการสร้างตัวอักษรและข้อความในภาพ ทำให้เหมาะกับการสร้างโปสเตอร์ การ์ด หรือการ์ตูน ปัจจุบัน Imagen 4 พร้อมใช้งานแล้วในแอป Gemini, Whisk และสำหรับลูกค้าองค์กรใน Vertex AI และจะพร้อมใช้งานใน Google Docs, Slides, Vids และแอป Workspace อื่นๆ ในเร็วๆ นี้
5. 🕶️ Android XR: ก้าวต่อไปของโลกเสมือนผสานความจริง
Google เดินหน้าเต็มกำลังกับ Android XR แพลตฟอร์มสำหรับอุปกรณ์ Augmented Reality (AR), Mixed Reality (MR), และ Virtual Reality (VR) โดยได้มีการสาธิตและเปิดตัวอุปกรณ์ใหม่จากพาร์ทเนอร์
มีการสาธิตคุณสมบัติของ Android XR เช่น การแสดงแผนที่ขนาดเล็กบนจอแสดงผลในตัวอุปกรณ์ และการดูวิดีโอแบบ 360 องศา นอกจากนี้ Xreal ได้เปิดตัว Project Aura แว่นตา AR แบบมีสายซึ่งเป็นส่วนหนึ่งของ Android XR และมีการกล่าวถึง Project Moohan เฮดเซต MR ที่ Samsung กำลังพัฒนาร่วมกับ Google ซึ่งอาจเปิดตัวปลายปีนี้ การสาธิตที่น่าสนใจคือฟีเจอร์แปลภาษาแบบเรียลไทม์บนต้นแบบแว่นตาอัจฉริยะที่พัฒนาร่วมกับ Samsung นอกจากนี้ แบรนด์แว่นตาอย่าง Gentle Monster และ Warby Parker ก็จะร่วมผลิตแว่นตาอัจฉริยะที่ใช้ Android XR ด้วย
6. 🤖 Agent Mode ใน Gemini: ผู้ช่วย AI อัจฉริยะที่ทำงานแทนคุณ
Google กำลังเพิ่มความสามารถแบบ “Agent” หรือการเป็นตัวแทนดำเนินการให้กับ Gemini ทำให้ AI สามารถโต้ตอบกับเว็บและเครื่องมือต่างๆ เพื่อทำงานที่ซับซ้อนให้สำเร็จได้
Agent Mode ใหม่ในแอป Gemini (ขับเคลื่อนโดย Project Mariner สำหรับผู้ใช้ AI Ultra) จะช่วยให้ผู้ใช้ทำงานต่างๆ ได้ง่ายขึ้น เช่น การค้นหาข้อมูลที่พักตามเงื่อนไขที่กำหนด โดย Gemini จะทำการค้นหาผ่านเว็บไซต์ต่างๆ และสรุปข้อมูลมาให้ ผู้ใช้จะสามารถเข้าถึงเวอร์ชันทดลองของ Agent Mode ผ่านแอป Gemini ได้เร็วๆ นี้ ความสามารถแบบ Agent นี้จะถูกนำไปใช้กับนักพัฒนา และในอนาคตอาจรวมถึงการช่วยจองตั๋ว, ร้านอาหาร หรือนัดหมายต่างๆ
7. 🌀 Gemini Diffusion: โมเดลทดลองสร้างข้อความแบบใหม่
Google DeepMind เปิดตัว Gemini Diffusion โมเดลทดลองสำหรับการวิจัย ซึ่งเป็นโมเดล Text Diffusion ที่ล้ำสมัย สามารถสร้างข้อความหรือโค้ดได้รวดเร็วกว่าโมเดลที่เร็วที่สุดในปัจจุบันของ Google โดยที่ยังคงประสิทธิภาพการเขียนโค้ดไว้ได้
Diffusion Model ทำงานแตกต่างจากโมเดลภาษาแบบ Autoregressive ทั่วไปที่สร้างข้อความทีละคำ โดย Diffusion Model จะเรียนรู้ที่จะสร้างผลลัพธ์จากการค่อยๆ ปรับแต่ง Noise (สัญญาณรบกวน) ให้กลายเป็นข้อความหรือโค้ดที่สมบูรณ์ ทำให้สามารถทำซ้ำและแก้ไขข้อผิดพลาดระหว่างกระบวนการสร้างได้ดีเยี่ยม เหมาะสำหรับงานแก้ไข รวมถึงคณิตศาสตร์และโค้ด ปัจจุบันเปิดให้ลงทะเบียนใน Waitlist เพื่อทดลองเดโม
8. 🔊 Gemini Native Audio: เสียง AI ที่เป็นธรรมชาติยิ่งขึ้น
Gemini 2.5 Pro ได้รับการอัปเกรดให้มี Native Audio Output ทำให้การสนทนากับ AI เป็นธรรมชาติมากขึ้น สามารถพูดด้วยโทนเสียง สำเนียง และสไตล์ที่หลากหลาย (มีภาษาไทยด้วยนะครับ)
Gemini สามารถพูดด้วยน้ำเสียงดราม่าเมื่อเล่าเรื่อง, ตรวจจับอารมณ์ของผู้ใช้และตอบสนองได้อย่างเหมาะสม (Affective Dialogue), ไม่สนใจเสียงรบกวนรอบข้าง (Proactive Audio) และจัดการงานที่เกี่ยวกับเสียงที่ซับซ้อนขึ้นได้ เครื่องมือ Text-to-Speech ตอนนี้รองรับผู้พูดหลายคนและมากกว่า 24 ภาษา สามารถสลับภาษากลางการสนทนาได้ ฟีเจอร์เหล่านี้จะพร้อมใช้งานผ่าน Gemini API
9. 👨💻 Jules Code Assistant: ผู้ช่วยเขียนโค้ดแบบ Autonomous
Jules ผู้ช่วยเขียนโค้ดแบบ Autonomous ของ Google เข้าสู่ช่วง Public Beta แล้ว เปิดให้ทุกคนใช้งานได้โดยไม่ต้องรอ Jules ไม่ใช่แค่ผู้ช่วยแนะนำโค้ด แต่เป็น Agent ที่สามารถอ่านโค้ด, ทำความเข้าใจเจตนา และทำงานต่างๆ ได้ด้วยตัวเอง
Jules จะโคลน Codebase ของคุณไปยัง Google Cloud VM ที่ปลอดภัย, ทำความเข้าใจบริบททั้งหมดของโปรเจกต์ และทำงานต่างๆ เช่น เขียนเทสต์, สร้างฟีเจอร์ใหม่, แก้บั๊ก, อัปเดต Dependencies และแม้กระทั่งสร้าง Audio Changelog สรุปการเปลี่ยนแปลงล่าสุด Jules ทำงานแบบ Asynchronously และมีการผสานรวมกับ GitHub โดยตรง ในช่วง Public Beta นี้ยังใช้งานได้ฟรี (มี giới hạnการใช้งาน)
10. 🛍️ Google Search Try-On: ลองเสื้อผ้าเสมือนจริงผ่านการค้นหา
AI Mode ใน Google Search เพิ่มประสบการณ์ช้อปปิ้งออนไลน์ไปอีกขั้นด้วยเทคโนโลยี Virtual Try-On ให้ผู้ใช้สามารถลองเสื้อผ้าเสมือนจริงได้จากภาพถ่ายของตัวเอง
ผู้ใช้สามารถอัปโหลดภาพถ่ายเต็มตัวของตนเอง และลองเสื้อผ้าแบบต่างๆ ได้โดยตรงจากผลการค้นหาของ Google AI จะทำความเข้าใจว่าเสื้อผ้าแต่ละชิ้นจะเข้ากับรูปร่างที่แตกต่างกันอย่างไร และแสดงผลลัพธ์ที่สมจริงโดยคำนึงถึงเนื้อผ้าและสรีระ ฟีเจอร์นี้กำลังเริ่มทยอยเปิดให้ใช้งานในสหรัฐอเมริกาผ่าน Search Labs นอกจากนี้ยังมีฟีเจอร์ Agentic Checkout ที่ช่วยติดตามราคาสินค้าและสามารถทำการสั่งซื้อให้โดยอัตโนมัติผ่าน Google Pay เมื่อเป็นไปตามเงื่อนไขที่ผู้ใช้ตั้งไว้
11. 🌟 Project Astra (Live Demo): ผู้ช่วย AI แห่งอนาคตที่มองเห็นและเข้าใจโลก
Google สาธิตความสามารถล่าสุดของ Project Astra ผู้ช่วย AI อเนกประสงค์ที่สามารถเข้าใจและโต้ตอบกับโลกรอบตัวผ่านกล้องและการสนทนาแบบเรียลไทม์ ความสามารถเหล่านี้กำลังถูกผสานเข้ากับ Gemini Live
การสาธิตแสดงให้เห็น Project Astra (ซึ่งปัจจุบันความสามารถต่างๆ ถูกรวมเข้ากับ Gemini Live) สามารถโต้ตอบกับผู้ใช้โดยใช้กล้องและหน้าจอร่วมกัน สามารถช่วยงานต่างๆ ตั้งแต่การเตรียมสัมภาษณ์ไปจนถึงการฝึกซ้อมวิ่งมาราธอน และแม้กระทั่งควบคุมโทรศัพท์ Android, นำทางในแอป หรือโทรออกได้ ฟีเจอร์ Gemini Live พร้อมความสามารถของ Astra นี้จะเปิดให้ผู้ใช้ iOS ได้ใช้งานด้วย
12. 📝 Video Overview ใน NotebookLM: เปลี่ยนโน้ตเป็นวิดีโอสรุป
NotebookLM เครื่องมือจดโน้ตพลัง AI ของ Google กำลังจะเปิดตัวฟีเจอร์ใหม่ “Video Overviews” ซึ่งสามารถเปลี่ยนเนื้อหาในโน้ตบุ๊กของผู้ใช้ให้กลายเป็นวิดีโอเพื่อการศึกษาหรือสรุปเนื้อหาได้
จากเดิมที่มี Audio Overviews เปลี่ยนโน้ตเป็นพอดแคสต์ ฟีเจอร์ Video Overviews ใหม่นี้จะช่วยให้ผู้ที่เรียนรู้ผ่านภาพและวิดีโอได้ประโยชน์มากขึ้น โดยจะสร้างสไลด์และใช้รูปภาพจากเนื้อหาต้นฉบับ (หรืออาจเป็นภาพที่ AI สร้างขึ้น) เพื่อสร้างวิดีโอสรุปที่เข้าใจง่าย ตัวอย่างที่แสดงในงาน Google I/O เป็นคลิปสั้นๆ ที่มีภาพประกอบ แผนภาพ และการเน้นข้อความสำคัญ พร้อมเสียงบรรยายที่เป็นธรรมชาติ เหมาะสำหรับการทบทวนบทเรียนหรือสรุปข้อมูลที่ซับซ้อน
นี่เป็นเพียงส่วนหนึ่งของประกาศที่น่าสนใจจากวันแรกของ Google I/O 2025 ซึ่งแสดงให้เห็นถึงทิศทางที่ชัดเจนของ Google ในการนำ AI มาขับเคลื่อนนวัตกรรมในทุกผลิตภัณฑ์และบริการ น่าติดตามอย่างยิ่งว่าเทคโนโลยีเหล่านี้จะเปลี่ยนแปลงชีวิตประจำวันของเราไปอย่างไรในอนาคตครับ!