زنی با عدم توانایی حرف زدن دوباره صدای خودش را شنید

در یک پروژه آزمایشی، سیستم هوش مصنوعی توانست با تحلیل باقی‌مانده‌های صوتی زنی که توانایی گفتار را از دست داده بود، صدای طبیعی او را بازسازی کند. این فناوری جدید، تحولی در زمینه ارتباطات افراد دارای ناتوانی گفتاری به شمار می‌رود.

کد خبر : 984182

اشتراک گذاری

در دنیایی که فناوری به سرعت در حال پیشرفت است، هوش مصنوعی نه‌تنها توانایی درک کلمات را دارد، بلکه در تلاش است انسان‌ها را بهتر بفهمد. توسعه‌دهندگان این حوزه گام‌هایی برداشته‌اند تا گفت‌و‌گو با ماشین‌ها برای همه حتی کسانی که به‌سختی صحبت می‌کنند یا اصلاً توانایی گفتار ندارند ممکن و دلپذیر باشد.

به‌عنوان مثال، برخی سیستم‌های هوش مصنوعی اکنون می‌توانند علاوه بر صدای کاربر، حالات چهره را نیز تحلیل کنند. این فناوری چندوجهی به سیستم‌ها اجازه می‌دهد پاسخ‌هایی دقیق‌تر و متناسب‌تر با وضعیت و حالت افراد ارائه دهند؛ پاسخی که نه‌فقط شنیدن، بلکه درک شدن را ممکن می‌سازد.

وقتی هوش مصنوعی صدای انسان را بازمی‌گرداند

به گزارش venturebeat، در یکی از پروژه‌ها، نمونه اولیه‌ای از فناوری بررسی شد که قادر بود از نفس‌های خفیف و ناله‌مانند زنی مبتلا به بیماری پیشرفته ALS، صدای کامل و احساسی او را بازسازی کند. این زن، با وجود از دست دادن توانایی حرف زدن، دوباره صدای خودش را شنید؛ صدایی با لحن، ریتم و احساسی آشنا. دیدن لبخند او، یادآوری مهمی بود. هوش مصنوعی فقط در مورد عملکرد و دقت نیست. آن‌چه اهمیت دارد، کرامت انسانی است.

برای بسیاری از افراد که از فناوری‌های کمکی استفاده می‌کنند، فقط شنیده شدن کافی نیست؛ آنها نیاز دارند احساس کنند که واقعاً درک شده‌اند. اینجاست که هوش مصنوعی مکالمه‌محورِ مجهز به درک احساسی می‌تواند تغییری واقعی ایجاد کند.

طراحی برای همه، نه فقط برای عده‌ای

امروزه طراحان و مهندسانی که روی نسل جدید دستیار‌های صوتی کار می‌کنند، تأکید دارند که دسترسی‌پذیری باید از ابتدا در طراحی سیستم‌ها لحاظ شود، نه اینکه در مرحله‌ای جداگانه به آن اضافه گردد.

برای تحقق این هدف، چند اقدام ضروری است:

جمع‌آوری داده‌های متنوع از کاربران مختلف با توانایی‌ها و سبک‌های گوناگون گفتار.

پشتیبانی از ورودی‌های غیرکلامی مانند حالت چهره یا حرکات سر.

بهره‌گیری از یادگیری فدرال برای حفظ حریم خصوصی در کنار ارتقای هوش سیستم‌ها.

پردازش سریع در دستگاه‌های محلی (edge computing) تا گفت‌و‌گو بدون تأخیر و طبیعی پیش برود.

فناوری فراگیر، یک فرصت است

پشتیبانی از کاربران دارای ناتوانی صرفاً یک مسئولیت اخلاقی نیست؛ این یک فرصت بزرگ اقتصادی نیز هست. طبق گزارش سازمان جهانی بهداشت، بیش از یک میلیارد نفر در سراسر جهان با نوعی از ناتوانی زندگی می‌کنند. هوش مصنوعیِ در دسترس می‌تواند به سالمندان، افراد چندزبانه یا حتی کسانی که به‌طور موقت آسیب دیده‌اند نیز کمک کند.

از سوی دیگر، ابزار‌های جدیدی در حال توسعه هستند که به کاربران امکان می‌دهند درک کنند که سیستم‌ها چگونه اطلاعات آنها را پردازش می‌کنند. این شفافیت، به‌ویژه برای کسانی که به این فناوری‌ها برای برقراری ارتباط وابسته‌اند، می‌تواند اعتمادآفرین باشد.

آینده‌ای که صدای همه را می‌شنود

سال‌ها بود که فناوری صوتی تنها برای کسانی که سریع، واضح و در محدوده‌ای مشخص صحبت می‌کردند، مفید بود. اما اکنون با توانمندی‌های هوش مصنوعی، می‌توان سیستم‌هایی ساخت که بهتر و انسانی‌تر بشنوند؛ فناوری‌ای که فقط پاسخ نمی‌دهد، بلکه با همدلی پاسخ می‌دهد.

اگر می‌خواهیم آینده‌ی مکالمه با هوش مصنوعی واقعاً هوشمند باشد، باید فراگیر نیز باشد. این یعنی از همان آغاز، هر صدا، در هر شرایطی، شنیده و درک شود.

هارشال شاه، متخصص فناوری صوت و پژوهشگر در زمینه تعامل انسان و ماشین، بر این باور است که هوش مصنوعی می‌تواند پلی میان بیان انسانی و درک ماشینی بسازد، به شرط آن‌که به صدای همه توجه شود.

انتهای پیام/