Google ประกาศว่า Gemini AI ได้ขยายฟีเจอร์การแปลแบบเรียลไทม์ไปยัง iOS

ChainNewsAbmedia

Google ประกาศฟีเจอร์การแปลภาษาแบบเรียลไทม์ของ Gemini ปรับขยายจากแพลตฟอร์ม Android สู่ระบบ iOS โดยพร้อมให้บริการในหลายตลาด เช่น สหราชอาณาจักร ญี่ปุ่น ไต้หวัน เยอรมนี เป็นต้น การอัปเดตนี้ตั้งเป้าที่จะให้บริการการแปลเสียงแบบเรียลไทม์ที่มีความเข้าใจในบริบทและน้ำเสียงที่เป็นธรรมชาติมากขึ้นผ่านอุปกรณ์เคลื่อนที่และอุปกรณ์สวมใส่ จุดเด่นสำคัญคือ แอปสามารถทำงานร่วมกับหูฟังบลูทูธจากทุกแบรนด์ ไม่จำกัดเฉพาะที่มีสเปคของ Apple

แอปการแปลแบบเรียลไทม์บน iOS สามารถทำงานร่วมกับหูฟังบลูทูธจากทุกแบรนด์

ฟีเจอร์การแปลแบบเรียลไทม์ของแบรนด์เฉพาะก่อนหน้านี้มักถูกจำกัดด้วยฮาร์ดแวร์เฉพาะ Google จึงได้เปิดตัวฟีเจอร์ “การแปลหูฟังแบบเรียลไทม์” ที่ใช้โครงสร้างเปิด โดยผู้ใช้เพียงดาวน์โหลดแอป Google Translate บน iPhone หรือ iPad ก็สามารถใช้กับหูฟังบลูทูธไร้สายจากทุกแบรนด์ ฟีเจอร์ใหม่นี้สามารถใช้ได้ข้ามอุปกรณ์ฮาร์ดแวร์ ทำให้ผู้ใช้ iOS สามารถเข้าถึงข้อมูลเรียลไทม์ในขณะเคลื่อนที่ได้ ฟังก์ชันพื้นฐานขับเคลื่อนด้วยโมเดล Gemini 3.1 Flash Live ที่เน้นการประมวลผลเสียงที่มีความหน่วงต่ำ ขณะนี้รองรับมากกว่า 70 ภาษา และเพิ่มคุณค่าการใช้งานของเครื่องมือนี้ในบริบทของธุรกิจระหว่างประเทศและการเดินทางส่วนบุคคลอย่างมาก

ปัญญาประดิษฐ์ปรับปรุงความเป็นธรรมชาติของการแปลเสียง

เมื่อเปรียบเทียบกับการแปลแบบคำต่อคำ (Word-for-word translation) เครื่องมือการแปลที่ใช้เทคโนโลยี Gemini จะมุ่งเน้นที่การวิเคราะห์ความหมายและการรักษาอารมณ์ โดยระบบจะไม่เพียงแค่แปลคำ แต่ยังพยายามเลียนแบบน้ำเสียง น้ำหนักเสียง และจังหวะของผู้พูดดั้งเดิม เพื่อลดความรู้สึกห่างเหินที่เกิดจากเสียงที่เป็นกลไก ในการจัดการสำนวน (Idioms) หรือสแลง ปัญญาประดิษฐ์สามารถให้คำแนะนำการแปลที่แม่นยำยิ่งขึ้นตามบริบท โดยแปลงสำนวนภาษาอังกฤษให้เป็นคำที่ตรงกับความหมายในวัฒนธรรมท้องถิ่น

Google Meet อัปเดตฟีเจอร์การแปลเสียงแบบเรียลไทม์

ฟีเจอร์การแปลเสียงได้เปิดตัวอย่างเป็นทางการสำหรับผู้ใช้ Google Workspace และบัญชีส่วนบุคคลในโครงการ Google AI โดยจะเพิ่มเสียงบรรยายแบบเรียลไทม์ไปยังเสียงของผู้พูด ทำให้ผู้เข้าร่วมสามารถได้ยินการแปลในภาษาพื้นเมืองและเข้าใจบริบทอารมณ์ของผู้พูด ขณะนี้รองรับการแปลแบบสองทางระหว่างภาษาอังกฤษและหลายภาษา รวมถึงภาษาสเปน ภาษาฝรั่งเศส ภาษาเยอรมัน ภาษาโปรตุเกส และภาษาอิตาลี

ฟีเจอร์มัลติโหมดช่วยสนับสนุนการรับรู้สภาพแวดล้อม

นอกเหนือจากการสื่อสารด้วยเสียง Google ยังเสริมการใช้งานปัญญาประดิษฐ์แบบมัลติโหมด (Multimodal) ผ่านฟีเจอร์ “การค้นหาแบบเรียลไทม์” และกล้อง Google Lens ผู้ใช้สามารถชี้ไปที่ป้าย สั่งอาหาร หรือคู่มือแล้วทำการแปลแบบเรียลไทม์และสนทนากับ Gemini ในรายละเอียดเพิ่มเติม ในด้านการเรียนรู้ภาษา แอป Google Translate ได้ขยายฟีเจอร์การฝึกพูด โดยเปิดตัวระบบข้อเสนอแนะแบบปรับปรุงใน 20 ประเทศเช่น ไต้หวัน สวีเดน และอินเดีย ระบบสามารถให้คำแนะนำเฉพาะเกี่ยวกับการออกเสียงของผู้ใช้และช่วยติดตามความก้าวหน้าในการเรียนรู้ (เช่น จำนวนวันฝึกติดต่อกัน) เพื่อช่วยให้ผู้ใช้บรรลุเป้าหมายในการเรียนรู้ภาษาและยกระดับประสบการณ์การเรียนรู้ที่เป็นส่วนตัว

เปิดตัวแว่นตาอัจฉริยะสวมใส่ในช่วงครึ่งปีหลัง

Google จะร่วมมือกับผู้ผลิต เช่น Samsung และ Warby Parker คาดว่าจะเปิดตัวแว่นตาอัจฉริยะที่มีฟังก์ชันปัญญาประดิษฐ์ในช่วงครึ่งปีหลังของปี 2026 หนึ่งในแอปพลิเคชันหลักของผลิตภัณฑ์คือเทคโนโลยีการแสดงผลภายในเลนส์ที่สามารถให้ “คำบรรยายแบบเรียลไทม์” โดยการฉายข้อความแปลลงในฉากจริง การพัฒนาอุปกรณ์สวมใส่ประเภทนี้แสดงให้เห็นว่าเทคโนโลยีการแปลกำลังเปลี่ยนจากการแสดงผลบนหน้าจออย่างง่ายไปสู่บริการการรับรู้สภาพแวดล้อมที่รวมการมองเห็นและการได้ยิน ขณะนี้ฟังก์ชันชุดนี้อยู่ในระยะการทดสอบและการเผยแพร่ทีละน้อย โดยจะมีการปรับแต่งโมเดลตามข้อเสนอแนะแบบใช้งานจากผู้ใช้ในแต่ละประเทศ

บทความนี้ Google ประกาศฟีเจอร์การแปลภาษาแบบเรียลไทม์ของ Gemini ขยายสู่ iOS ปรากฏครั้งแรกใน ข่าวสาร Blockchain ABMedia.

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น