หน้าแรก >> ข่าวทั้งหมด >> อ่านบทความ/ข่าว

Google พัฒนา AI อ่านริมฝีปากคนที่แม่นที่สุดเท่าที่เคยมีมา อ่านปากได้แม่นกว่ามืออาชีพเกือบ 4 เท่า!

ยุคนี้ถือเป็นยุคทองของการพัฒนาปัญญาประดิษฐ์ (AI) เลยก็ว่าได้ เพราะบริษัทใหญ่ๆ ในซิลิคอนวัลเลย์ต่างก็หันมาทุ่มเทให้กับเรื่องนี้อย่างเต็มที่ และที่โดดเด่นที่สุดคงหนีไม่พ้น DeepMind ซึ่งเป็น AI ของ Google ที่สามารถเรียนรู้ด้วยตัวเองได้อย่ารวดเร็วจนน่ากลัว ล่าสุดทีมวิจัย DeepMind พร้อมด้วยมหาวิทยาลัยอ็อกซ์ฟอร์ดได้ใช้ AI ตัวนี้สร้างซอฟต์แวร์สำหรับอ่านริมฝีปากคนที่แม่นยำที่สุดเท่าที่เคยมีมา โดยให้มันเรียนรู้จากบันทึกเทปรายการทีวีต่างๆ ของ BBC ความยาวรวมกันหลายพันชั่วโมง และจากการทดสอบล่าสุด มันสามารถอ่านริมฝีปากได้ถูกต้องแม่นยำถึง 46.8% แม้ดูเผินๆ จะเป็นตัวเลขที่ไม่มาก แต่จากการทดสอบแบบเดียวกัน นักอ่านริมฝีปากมืออาชีพอ่านได้ถูกต้องเพียง 12.4% เท่านั้น ทำให้ AI ตัวนี้อ่านริมฝีปากได้แม่นยำกว่าผู้เชี่ยวชาญที่เป็นมนุษย์เกือบ 4 เท่า!

ก่อนหน้านี้นักวิจัยจากมหาวิทยาลัยอ็อกซ์ฟอร์ดได้พัฒนาซอฟต์แวร์อ่านริมฝีปากมาก่อนแล้วโดยใช้ชื่อว่า LipNet ซึ่งจากการทดสอบในห้องแลบเบื้องต้น LipNet มีความแม่นยำสูงถึง 93.4% ในขณะที่มนุษย์ทำได้เพียง 52.3% แต่วิดีโอที่นำมาใช้ทดสอบเป็นวิดีโอที่บันทึกมาเป็นพิเศษ โดยมีอาสาสมัครพูดเป็นประโยคตามที่กำหนดไว้แล้วเท่านั้น แต่ DeepMind ต้องเผชิญกับบททดสอบที่โหดหินยิ่งกว่า นั่นคือการให้ถอดสคริปต์รายการทอล์คโชว์แนวการเมืองของ BBC ที่เป็นบทสนทนาตามธรรมชาติและไม่ได้เตรียมการมาก่อน

วิดีโอความยาวกว่า 5,000 ชั่วโมงจากรายการทีวีได้แก่ Newslight, Question Time และ World Today (ประมาณจับเข่าคุยบ้านเรา) ได้นำมาใช้ฝึกฝน DeepMind วิดีโอทั้งหมดนี้ประกอบไปด้วยประโยคที่ไม่ซ้ำกัน 118,000 ประโยคและคำศัพท์เฉพาะที่ไม่ได้ใช้ในชีวิตประจำวันอีก 17,500 คำ เมื่อเทียบกับวิดีโอที่ใช้ทดสอบ LipNet ที่มีศัพท์เฉพาะแค่ 51 คำแล้วนับว่าบททดสอบที่ DeepMind ต้องเผชิญนั้นท้าทายกว่าอย่างเทียบกันไม่ได้

ทีมวิจัย DeepMind กล่าวว่าตัวโปรแกรมอาจนำไปฝังอยู่ในแอปพลิเคชันต่างๆ ได้ โดยอาจนำไปใช้ช่วยเหลือผู้บกพร่องทางการได้ยินให้สามารถเข้าใจการสนทนา ใช้สร้างคำบรรยายใต้หนังเงียบ หรือใช้สั่งการ AI Assistant อย่าง Siri ผ่านกล้องได้ ซึ่งจะเป็นประโยชน์เมื่อเราต้องการพูดคุยกับ  AI Assistant ในที่ที่มีเสียงจอแจ

อย่างไรก็ตาม AI ดังกล่าวอาจเป็นดาบสองคม หากมองในอีกแง่หนึ่งความสามารถเช่นนี้สามารถนำไปใช้สอดแนมหรือล้วงความลับได้เป็นอย่างดี หากมันตกไปอยู่ในมือแฮ็กเกอร์ ความเป็นส่วนตัวของเราจะยิ่งเปราะบางมากขึ้นอย่างแน่นอน

ขณะนี้ DeepMind สามารถอ่านริมฝีปากจากคลิปวิดีโอที่คมชัดและมีความละเอียดสูงได้แม่นยำกว่าการอ่านจากวิดีโอคุณภาพต่ำ แต่จุดอ่อนนี้จะค่อยๆ หายไปด้วยการพัฒนาอย่างต่อเนื่องและรวดเร็วของ ในอนาคตเราจะได้เห็น AI ทำอะไรได้อีกบ้าง น่าติดตามจริงๆ ครับ

---------------------------------------
ที่มา : The Verge

แปลและเรียบเรียง : techmoblog.com

Update : 17/01/2019

google DeepMind





Cookie Consent

Our website uses cookies to provide your browsing experience and relavent informations.Before continuing to use our website, you agree & accept of our Cookie Policy & Privacy