بیماران ALS از هوش مصنوعی برای حفظ صدای طبیعی خود استفاده می کنند. در اینجا نحوه پوشش یک خبرنگار آمده است


اسکرین شات داستان واشنگتن پست

تصویری از مقاله واشنگتن پست در آوریل 2023 که توسط گزارشگر معلولیت آماندا موریس در مورد کمک هوش مصنوعی به بیماران ALS برای حفظ صدای طبیعی خود نوشته شده بود. تصویر گرفته شده در 16 ژوئن 2023

آماندا موریس به‌عنوان گزارشگر ناتوانی در واشنگتن پست، از جمله موضوعات دیگر، از دست دادن شنوایی، کووید طولانی مدت و گسترش زبان اشاره جعلی در TikTok را پوشش داده است.

یکی از داستان های اخیر او نشان داد که چگونه برخی از بیماران مبتلا به اسکلروز جانبی آمیوتروفیک (ALS) به هوش مصنوعی روی می آورند تا صدای طبیعی خود را برای استفاده با فناوری کمکی با پیشرفت بیماری ذخیره کنند.

این یک خواندن متقاعد کننده است که شخصیت های عالی و عناصر تعاملی متعدد را ترکیب می کند. خوانندگان می توانند صدای طبیعی و هوش مصنوعی افراد مصاحبه را بشنوند، ویدئویی از زندگی روزمره یک بیمار ALS تماشا کنند و یاد بگیرند که چگونه این برنامه های هوش مصنوعی الگوهای گفتار را پردازش و تکرار می کنند.

موریس اخیراً در مورد نحوه گزارش این ماجرا با AHCJ صحبت کرده است.

(پاسخ ها برای اختصار و وضوح کمی ویرایش شده اند.)

چه چیزی به شما ایده ساخت این داستان را داد؟

آماندا موریس

آماندا موریس گزارشگر

من خیلی به هوش مصنوعی فکر می کردم و اینکه چگونه در فضاهای مراقبت های بهداشتی برجسته تر شده است. ما این را در بسیاری از دستگاه‌های پزشکی مختلف می‌بینیم که اکنون از هوش مصنوعی برای نظارت بر شرایطی مانند دیابت استفاده می‌کنند. یک روز داشتم در توییتر می چرخیدم و دیدم شخصی که دنبالش می کردم در مورد دریافت یک کپی جدید از صدایش پستی ارسال کرده بود. گفتم: “خب، این جالب است.” من متوجه نشده بودم که هوش مصنوعی چقدر تفاوت ایجاد کرده است در حوزه صداهای مصنوعی به عنوان یک جامعه، ما اغلب در مورد هوش مصنوعی و صداهای مصنوعی از نظر تقلبی عمیق فکر می کنیم، اما فکر نمی کنم کسی واقعاً از نظر پوشش خبری به جنبه مثبت آن فناوری صدا و اینکه چگونه می تواند به مردم کمک کند فکر کرده باشد.

چگونه بیمارانی را که پروفایل کردید پیدا کردید؟

این یک روند طولانی بود. من با چندین سازمان مختلف ALS و شعب محلی آنها تماس گرفتم و خواستم با مردم در تماس باشم. من با تیم گلیسون تماس گرفتم که بسیاری از خدمات بانکداری صوتی در ایالات متحده را تامین می کند. و با افرادی که در توییتر و سایرین در شبکه خودم می‌شناختم تماس گرفتم و از آنها پرسیدم که آیا کسی را می‌شناسند که از این سرویس استفاده کند یا قصد استفاده از آن را دارد یا خیر. فهرست نهایی من از افرادی که با آنها مصاحبه کردم حدود 20 نفر بود. می‌خواستم مطمئن شوم که با طیف وسیعی از افرادی که در تمام طول این فرآیند حضور داشتند مصاحبه کرده‌ام تا درک کنم که در هر مرحله چگونه بود. برخی هنوز صدای خود را از دست نداده بودند و برخی سال ها از صدای سنتز شده خود استفاده می کردند. چهار نفری که در داستان از آنها استفاده کردیم، مراحل مختلف این فرآیند و همچنین داستان های واقعا قانع کننده را نشان می دادند. جالب بود که ببینیم داشتن یک نسخه سنتز شده از صدای آنها چه معنایی دارد زیرا برای همه متفاوت است.

از آنجایی که برخی از افرادی که با آنها صحبت می کردید قبلاً صدای خود را از دست داده بودند، مصاحبه ها را چگونه انجام دادید؟

برای سه نفر از آنها، فهرستی از سؤالات را از قبل فرستادم تا به آنها وقت بدهم تا پاسخ هایشان را تایپ کنند. زمان زیادی طول کشید تا روت تایپ کند زیرا باید با چشمانش تایپ کند (با استفاده از فناوری کمکی). تایپ کردن برایان و رون نیز زمان بر بود، زیرا قدرت دست آنها مانند گذشته نیست. من یک اخطار داشتم که در طول مصاحبه، اگر بخواهم سؤالات شفاف سازی یا پیگیری بپرسم، می توانم. همچنین از آنها خواستم که مصاحبه را در کنار شخص دیگری انجام دهند که می تواند به سؤالات اساسی تری برای بررسی حقایق پاسخ دهد، مانند اینکه در چه ماهی اتفاقی رخ داده است. اگر از برایان و رون سؤالات شخصی می‌پرسیدم، می‌توانستند برای هر کس دیگری که با آنها در اتاق بود، پاسخ‌ها را زمزمه کنند و آن شخص می‌توانست آن را برای من تکرار کند.

از جنبه‌های چندرسانه‌ای که وارد کردید، مانند ویدیوی ران، و توضیح نحوه عملکرد صداهای هوش مصنوعی، بسیار لذت بردم. چگونه به این ایده رسیدید که آن‌ها را بگنجانید؟

برای رون (که در ویدیو مشخص شده است)، با یک خبرنگار ویدیویی به مکزیک رفتم زیرا احساس می کردم مهم است که ببینم روز به روز او چگونه است. ما دو روز کامل را با رون گذراندیم و او را تماشا می‌کردیم که روال عادی روزانه‌اش را طی می‌کرد، مثل اینکه پرستارش بیاید، دارو بگیرد، غذا بخورد، لباس بپوشد، با همسرش قدم بزند، تلویزیون تماشا کند، و غیره. این واقعا حالم را بهتر کرد. حس می کند که او چگونه از صدای خود استفاده می کند، بلکه چگونه می تواند این روند را طی کند.

من با تیمی از روزنامه‌نگاران و ویراستاران چندرسانه‌ای روی این داستان کار کردم و نظرمان را در مورد چه عناصری و نحوه گنجاندن آنها تغییر دادیم. روزنامه‌نگار ویدیویی که با من روی این داستان کار می‌کند، الکسا جولیانا آرد، به ما پیشنهاد کرد که افراد مستقیماً با دوربین صحبت کنند و خودشان صحبت کنند. من فقط آن ایده را دوست داشتم. در ابتدا، ما می‌خواستیم قبل از تشخیص بیماری ALS، ویدیوهایی از افراد پخش کنیم تا تفاوت صدای طبیعی و مصنوعی آنها را نشان دهیم، اما کیفیت و طول ویدیوهایی که همه به ما می‌دادند متفاوت بود و می‌خواستیم همه درمان‌های مشابهی داشته باشند.

چه چیزی در بیان این داستان برای شما مهم بود؟

مهمترین بخش بیشتر در مورد عنصر صوتی ضبط آن صداها بود. مدام به این فکر می کردم که صدای آنها برای هر فرد چه چیزی را نشان می دهد. رون یک شوخی است. او بسیار شیوا، بسیار پرحرف، بسیار صبور است. روت بیشتر فردی عمل گرا بود. من می‌خواستم کمی از شخصیت هر فرد را به تصویر بکشم، و به همین دلیل است که فکر می‌کنم عکس‌ها، ویدیوها و صداها با محدودیت‌های کلمه‌ای که داشتم، به همه کمک کردند. این چیزی بود که من بیشتر به آن اهمیت می‌دادم – مطمئن شوم افرادی که داستان را می‌خوانند، با هر فرد مرتبط هستند.

چه توصیه ای برای نویسندگان دیگری دارید که معمولاً فناوری اطلاعات یا فناوری سلامت را پوشش نمی دهند؟

من اخیرا یک قطعه برای دفترچه یادداشت باز (وب سایتی که به روزنامه نگاران علوم، محیط زیست و سلامت کمک می کند تا مهارت های خود را افزایش دهند) در مورد چگونه فناوری کمکی را پوشش دهیم. من فناوری را به عنوان یک ضرب و شتم پوشش نمی دهم، اما فناوری کمکی را به عنوان بخشی از ضربان ناتوانی پوشش می دهم. یک اشتباه رایج که بسیاری از افراد هنگام پوشش دادن فناوری کمکی به آن دچار می‌شوند این است که آن‌ها به‌طور کلی آن را بدون توجه به هر اتفاقی عالی می‌دانند و طوری رفتار می‌کنند که فناوری هر مشکلی را حل می‌کند. من فکر نمی‌کنم که خیلی وقت‌ها اینطور باشد – جزئی‌تر از آن است. من همچنین فکر می کنم افرادی که فناوری کمکی را پوشش می دهند همیشه با کاربران صحبت نمی کنند و همیشه کاربران فناوری را به عنوان کاربران فعال در نظر نمی گیرند. مردم تصور می کنند که کاربران آیفون بسیار منفعل هستند، اما کاربران این فناوری را بسیار شکل می دهند. ما آن را هک می کنیم. ما از آن برای مطابقت با نیازهای خود استفاده می کنیم، برای استفاده هایی فراتر از آنچه خالق می توانست تصور کند.

یک عنصر جالب هر داستان فناوری این است: چگونه توسط افراد مختلف به طور متفاوت استفاده می شود؟ چه مشکلاتی هنوز رفع نشده است؟ به چه مشکلاتی کمک می کند؟ پرسیدن این سؤالات از خود و بازجویی از فناوری منجر به داستان دقیق تر و دقیق تر می شود.