راهکار گوگل برای بهبود کیفیت صدا در Duo
کسب و کار
بزرگنمايي:
سیاست و بازاریابی - زومیت / گوگل برای بهبود کیفیت صدا در Duo از یادگیری ماشین کمک میگیرد.
اپلیکیشن Google Duo که با هدف برقراری تماس در گوشی پیکسل 4 معرفی شده است، برای افزایش کیفیت صدا از تکنولوژی WaveNetEQ بهره خواهد برد.
از نظر بسیاری از کارشناسان، گوگل دوئو بهترین سرویس تماس تصویری است که هنوز اغلب کاربران با آن آشنا نشدهاند. این اپلیکیشن آنقدر موفق عمل کرده است که سامسونگ قصد دارد آن را بهعنوان پیشفرض در دستگاههای هوشمند خود قرار دهد. بااینهمه، گوگل قصد ندارد فقط بر این پیروزی تکیه کند و در تلاش است با توسعهی بیشتر ویژگیهای جدید، رقابت را برای دیگر شرکتها دشوار کند.
آخرین خلاقیت شگفتانگیزی که گوگل برای توسعهی این اپلیکیشن در اولویت قرار داده، استفاده از الگوریتمهای یادگیری ماشین برای حل مشکل ازدسترفتن بستههای صوتی حین جابجایی در اینترنت (Packet Loss) است. بهعبارتدیگر، این تکنولوژی به گوگل کمک میکند کیفیت صدا را در تماسهای دوئو افزایش دهد؛ بهویژه در زمانیکه سرویس اتصال باثباتی به اینترنت وجود نداشته باشد. گوگل با یاری تکنولوژی DeepMind خود قسمتهای نامفهوم یا بهعبارتی بستههای ازدسترفتهی صدا را با صدای مصنوعی شبیه به صدای انسان تولید و جایگزین میکند. بهنقل از بلاگ AI گوگل، این قابلیت با نام WaveNetEQ شناخته میشود.
وقتی تماس آنلاین برقرار میشود، دادهها را شرکت پشتیبان به بستههای متعددی تقسیم خواهد کرد که در فضای اینترنت منتقل میشوند. حین انتقال دادهها ممکن است برخی دادهها از بین بروند و بخشهایی از صدا دچار قطعی شوند. تکنولوژی WaveNetEQ در اپلیکیشن دوئو بستههای دادهای ازبینرفته در مسیر را با کمک اطلاعاتی کلامی دراختیار گوگل بازسازی میکند. گوگل گفته است 99 درصد از تماسهای برقرارشده با دوئو مشکل ازدسترفتن بستهی داده را تجربه میکنند که دراینبین، 20 درصد از آنها 3 درصد از دادههای صوتی و 10 درصد دیگر حدود 8 درصد از دادههای خود را از دست میدهند.
بهنقل از گوگل، ازآنجاکه تماسهای دوئو از رمزنگاری سرتاسری بهره میبرند، همهی فرایند باید روی دستگاه انجام شود و WaveNetEQ مدل بسیار سریعی دارد که بهآسانی در گوشیهای هوشمند اجرا خواهد شد. علاوهبراین، خروجی بسیار طبیعی و زیبایی ارائه میکند که دیگر سیستمهای حالحاضر نمیتوانند با آن رقابت کنند. بنابه گفتهی گوگل، تکنولوژی پنهانسازی بستههای ازدسترفته در این اپلیکیشن بههیچعنوان تکراری یا غیرطبیعی شنیده نخواهد شد؛ زیرا این تکنولوژی ازطریق فناوری شبکهی عصبی مصنوعی کار میکند که پایگاه دادهای به بزرگی 100 گوینده در 48 زبان مختلف در خود جای داده است.
قابلیت WaveNetEQ درحالحاضر تنها در تماسهای دوئو در گوشی گوگل Pixel 4 دردسترس است و گوگل وعده داده بهزودی برای گوشیهای هوشمند دیگر نیز دردسترس قرار خواهد گرفت.
لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/118116/