آیا هوش مصنوعی هیچ‌وقت می‌تواند با ما واقعاً حرف بزند؟

در زندگی بیشتر آدم‌هایی که آن‌قدر سن و سال دارند که دورانِ قبل از اینترنت را به یاد داشته باشند، یک دورۀ شگفت‌انگیز وجود دارد: روزهایی که «لذتِ چت‌کردن» را کشف کرده‌اند. چت‌کردن به جهات مختلف از مکالمۀ رو در رو خوشایندتر است. ما هنگام چت کردن، بامزه‌تر و هوشمندانه‌تر حرف می‌زنیم و به نسخۀ بهتری از خودمان تبدیل می‌شویم. در مقابل، با نسخۀ بهتری از دیگران هم تعامل می‌کنیم. آیا هوش مصنوعی‌هایی مثل چت جی‌پی‌تی که وعده می‌دهند با ما وارد گفتگو شوند هم چنین لذتی به ما خواهند بخشید؟

کدخبر: 3025899

آنا وینر، نیویورکرـــ ابتدای بهار بود که، به‌عنوان خبرنگار، با اتوبوس به مرکز ماسکون در مرکز شهر سانفرانسیکو رفتم، جایی که حدود ۳۰ هزار نفر برای گردهمایی سالیانۀ سازندگان بازی (G.D.C.) جمع شده بودند. چند ماه قبل‌تر به مرخصی زایمان رفته بودم و خوش‌حال بودم از اینکه به کار بازگشته‌ام، می‌توانم با دیگران ملاقات کنم و برای مدتی کوتاه بیرون از فضای خانه باشم. حضور در بین مردم احساسی خارق‌العاده و تا حدی سرگیجه‌آور داشت. دوست داشتم با رانندۀ اتوبوس اختلاط کنم یا پنهانی به حرف‌های غریبه‌ها گوش کنم. شنیدم مردی با اندوه به دیگری می‌گوید «گردهمایی باز شروع شده». وقتی پیاده شدیم و اتوبوس رفت، دیدم بدنه‌اش با تبلیغی بزرگ از ماهی گروپر تایوانی پوشانده شده. در تبلیغ این طور آمده بود: «طعمی ملایم و درعین‌حال متمایز؛ همین امشب گوشت کم‌چربی و مغذی گروپر را امتحان کنید».

در بخش نمایشگاهِ گردهمایی، اسکیت‌سوارانی با لباس‌های چسبان مشکی، که به سرتاسر آن‌ها حسگر نصب بود، حرکات نمایشی سطح‌پایینی را روی سطح شیب‌دار اجرا می‌کردند. آدم‌هایی که با کارت شناساییِ آویخته‌به‌گردن و عینک‌های واقعیت مجازی به چشم تلوتلو می‌خوردند. دیوارها پر بود از صفحه‌نمایش‌ها و نمایشگرهایی با وضوح تصویر و عملکرد بالا، طوری که نگاه‌کردن به صفحۀ تلفن‌همراه برایم آرامش‌بخش بود. همان هفته، اصحاب رسانه و کاربران فعال توییتر در حوزۀ فناوری به‌طور مداوم یا دربارۀ چت‌بات‌ها سخن می‌گفتند یا با آن‌ها حرف می‌زدند. اوپن‌ای.آی. به‌تازگی نسخۀ جدیدی از چت‌جی‌پی‌تی را منتشر کرده بود و این فناوری داشت همه را به هیجان می‌آورد. در این باره گمانه‌زنی می‌شد که آیا هوش مصنوعی ساختار اجتماعی را خراب می‌کند یا رفته رفته جای تمامی مشاغل و حتی صنایع را می‌گیرد.

صنعت بازی مدت‌هاست که بر انواع مختلف آنچه هوش مصنوعی نامیده ‌می‌شود تکیه کرده است، و در گردهمایی G.D.C. نیز در رابطه با مدل‌های زبانی بزرگ1 و هوش مصنوعی مولد در ساخت بازی دست‌کم دو سخنرانی ایراد شد. این دو سخنرانی به‌ویژه روی ساخت شخصیت‌های غیرقابل‌بازی یا همان N.P.Cها متمرکز بودند، شخصیت‌هایی نمایشی که صرفاً استفادۀ ابزاری داشته -اهالی روستا، موجودات جنگل، حریفان مبارزه، و مواردی از این دست- و دیالوگ‌هایی ازپیش‌نوشته‌شده، محدود و کاربردی به زبان می‌آورند که به آن‌ها «بارک» گفته می‌شود («سلام!»؛ «تا حالا شنیدی؟»؛ «مراقب باش!») N.P.Cها قرار است حس حضور آدم‌ها، شلوغی و چندبُعدی‌بودن را به بازی اضافه کنند، بدون اینکه جلب‌توجه چندانی بکنند. درعین‌حال، خارج از فضای بازی، می‌توان گفت عبارتِ N.P.C تبدیل به یک میم شده است. در سال ۲۰۱۸، مجلۀ تایمز این اصطلاح را «توهین پُرطرف‌دار و جدید هواداران ترامپ در فضای مجازی» عنوان کرد، پس از اینکه کاربران جناح راست شروع به استفاده از آن کردند تا نشان دهند رقبای سیاسی‌شان احمق‌هایی بی‌فکر بوده که توسط جریان سیاسی حاکم شست‌وشوی مغزی شده‌اند. این روزها، می‌توان از N.P.C برای توصیف فردی دیگر یا یک فرد عامی -سطحی، بدون فردیت، وابسته، بی‌اراده، و ناتوان- استفاده کرد.

وقتی ظرفیت‌ N.P.Cها را، که نشئت‌گرفته از مدل‌های زبانی بزرگ بود، در نظر گرفتم، جهان‌هایی درون‌زا از گفت‌وگو به ذهنم آمد، جایی که به هر شیء و کاراکتر ویژگی‌های شخصیتی بخشیده می‌شود. دیوهایی مهربان، دست‌فروش‌هایی پُرحرف و گیاهانی خوش‌سخن را تصور کردم. در واقعیت، این تصور معمولی‌تر است. N.P.Cها «می‌توانند با بازیکن، N.P.Cهای دیگر و خودشان صحبت کنند -اما می‌بایست این کار را بدون مکث، تکرار، یا انحراف از طرح روایی انجام دهند»؛ این خلاصۀ یکی از سخنرانی‌ها بود که توسط بن سوانسون، پژوهشگر یوبیسافت، ایراد شد. سخنرانی سوانسون، برنامۀ «نویسندۀ پشت پردۀ» یوبیسافت را ارائه کرد، نرم‌افزاری که طراحی شده بود تا از دشواری ساخت «درختواره‌ها»ی پُرشاخ‌وبرگِ دیالوگ بکاهد. در این درختواره‌ها، نوع مشخصی از مکالمه به‌دفعات تکرار می‌شود، و با توجه به چیزی که بازیکن بگوید، اندکی پس‌وپیش می‌شوند. «نویسندۀ پشت پرده» از یک مدل زبانی بزرگ بهره می‌گیرد تا بارک‌های مناسب را به N.P.Cها پیشنهاد دهد. این کار بر اساس معیارهای مختلفی صورت می‌گیرد که توسط انسان‌ها وضع شده‌ و خروجی مدل نیز توسط خود آن‌ها بررسی می‌شود.

بااین‌حال، به نظر می‌رسد «گفت‌وگو» با هوش مصنوعی در سال‌های پیشِ رو احتمالاً رواج بیشتری پیدا کند. مدل‌های زبانی بزرگ در حال اضافه‌شدن به موتورهای جست‌وجو و سایت‌های خریدوفروش آنلاین، نرم‌افزارهای پردازش کلمه و نرم‌افزارهای صفحه گسترده هستند. در مقام نظر، قابلیت‌های دستیارهای صوتی، مانند سیری در اپل یا الکسا در آمازون، می‌توانند پیچیده‌تر و لایه‌لایه‌تر شوند. مراکز تماسْ «دستیارها»ی صوتی معرفی می‌کنند؛ گفته می‌شود آمازون در حال ساخت یک چت‌بات است، و فست‌فود زنجیره‌ای وندیز مدتی است در پی ایجاد یک خدمت سواره2 تحت کنترل هوش مصنوعی است. ابتدای بهار، مدرسۀ آزمایشگاهی خان، مدرسه‌ای خصوصی و کوچک در پالو آلتو، یک بات آزمایشی آموزگار را به دانش‌آموزان خود معرفی کرد، و انجمن ملی اختلال خوردن سعی داشت، به‌جای بخش مشاورۀ تلفنیِ انسانی خود، از یک بات به نام تِسا استفاده کند (بعد از اینکه تسا به تماس‌گیرندگان مشورت غلط داد، انجمن این سرویس را تعلیق کرد).

چت‌بات‌ها هدف غایی مدل‌های زبانی بزرگ نیستند. مسلماً قابلیت‌های چشمگیر این فناوری بیش از آنکه معطوف به گفت‌وگو باشد، مرتبط به پردازش داده است -یافتن و تقلیدکردن الگوها، نشخوارکردن ورودی‌ها برای ساخت چیزی شبیه به چکیده- که متن گفت‌وگو صرفاً نمونه‌ای از آن است. باوجوداین، به نظر می‌رسد در آینده فرصت‌های بی‌شماری برای اختلاط با مخاطبینی خستگی‌ناپذیر در پی خواهد بود. بخشی از این گفت‌وگو به‌شکل نوشتاری خواهد بود، و بخشی نیز می‌تواند از طریق واسطه‌های کلامی انجام بگیرد که به دستورهای گفتاری، پرسش‌ها و سایر ورودی‌ها واکنش نشان می‌دهند. هر چیزی که به یک پایگاه داده متصل شود عملاً می‌تواند تبدیل به یک بات یا N.P.C شود، چه در فضای مجازی و چه در فضای حقیقی. انگار ما در حال ورود به دورانی هستیم که مشخصه‌اش چت بی‌پایان است -مفیدند و می‌شود به‌سرعت مرورشان کرد و عامدانه بی‌انتها طراحی شده‌اند.

چت‌کردن با مکالمه یا گفت‌وگو متفاوت است و جریان خاص خودش را دارد. چت می‌تواند متنافر باشد -افراد حاضر در آن سیلی از پیام‌های کوتاه را به‌سمت یکدیگر روانه ‌کنند- یا اینکه کاملاً ناهمگام باشد، مانند زمانی که افراد روی دکمۀ «بازگشت» زده و چت را به حالت تعلیق درمی‌آورند.3 انتظارات معمولاً پایین بوده، و فرصت برای شرکت در آن همواره فراهم است؛ یک فرد می‌تواند در قالب پیام‌های خصوصی، در نرم‌افزارهای دوست‌یابی، بازی‌های ویدئویی، نرم‌افزارهای پردازش کلمه و مانند این‌ها چت کند، چه برسد به نرم‌افزارهای اختصاصی این کار مانند واتساپ یا آی‌مسیج. چت قابلیت سازگاری با ویژگی‌ها، محدودیت‌ها و قواعد پلتفرم خود را دارد. چت‌کردن در اسلَک با چت‌کردن در تیندر تفاوت دارد. همواره چیزهای بیشتری برای گفتن و نیز جای دیگری برای آن وجود دارد. انگار سکوت -آرامش- چیزی شبیه به معجزه شده است.

در سال ۲۰۱۱، سردبیران نشریۀ اِن+۱ در مقاله‌ای با عنوان «نیروگذاری در چت» رساله‌ای عجیب و بامزه دربارۀ چت منتشر کردند. آن‌ها به‌طور خاص لذت‌های بی‌بدیل جی‌چت را، که آن زمان نرم‌افزاری محبوب به حساب می‌آمد، واکاوی ‌کردند. آن‌ها این طور نوشته بودند: «جی‌چت فلسفه را به اتاق خواب بازگردانده است، همان‌گونه که شب دیروقت خود را در وضعیت تمرکز بالا می‌یابیم. بسیاری از ما بهترین نسخۀ خودمان را در جی‌چت می‌بینیم. ازآنجاکه در سکوت نمی‌توانیم صحبت دوستانمان را قطع کنیم، درنتیجه به شنوندگانی بهتر و عمیق‌تر تبدیل می‌شویم، و نیز سخنوران یا نویسندگانی بهتر». طبق نوشتۀ آن‌ها، چت می‌تواند راحت، صمیمی، بی‌تکلف، روشنگر و آزاد باشد؛ همچنین جریانی نهفته از احساس نیز دارد. آن‌ها همچنین این‌گونه استدلال کرده بودند: «فوریت در چت باعث می‌شود پاسخ اهمیت پیدا کند، که به یادمان می‌آورد ما در نوشتن نه‌فقط خودمان، که روابطمان را نیز می‌سازیم و افشا می‌کنیم».

چیزی که چت‌بات‌ها ارائه می‌دهند درواقع چت نیست؛ شبیه‌ساز آن است. بعضی از نمونه‌های خودمانی‌تر مانند رپلیکا («هوش مصنوعی رفیقی که دل می‌سوزاند»)، یا سیدنی که متعلق به بینگ و نیمه‌بازنشسته است، قادرند ریتمی شبیه به واقعیت را بسازند. چت‌جی‌پی‌تی انسان‌گونگی را تشویق می‌کند، حتی با وجود «شخصیت» خشک و عمداً بی‌روحش؛ وقتی اشتباه می‌کند پوزش می‌طلبد، متن را به ضمیر اول شخص برمی‌گرداند و نشانگری دارد که نشان می‌دهد در حال تایپ‌کردن است -نقطه‌هایی در یک راستا، که به‌ترتیب و به‌طور مداوم بالا می‌روند، و تلفیقی از اندیشیدن و تردید را از جانب کامپیوتر نمایش می‌دهند (کوین مانگر، دانشور علوم سیاسی در دانشگاه ایالتی پنسیلوانیا، پیشنهاد داده که استفاده از ضمایر اول شخص کنترل شود، برای «کاستن از خطر فریب‌خوردن مردم توسط مدل‌های زبانی بزرگ، چه از نظر مالی و چه از نظر عاطفی»). بااین‌حال، سبک نوشتار چت‌جی‌پی‌تی همچنان به‌شکل تقریباً یکنواختی سرد، بی‌روح و مبهم است؛ اگرچه می‌تواند، با کمک‌گرفتن، گفته‌های خود را به‌صورت گونه‌های مختلف زبانی و در حالات گوناگون هیجانی بیان کند، اما کماکان به انسان حس گفت‌وگو با فرمول و عدد را می‌دهد. در مقایسه با فوریت چت‌های خودم با دوستانم در جی‌چت -دوستی در سال ۲۰۱۱ این‌طور نوشته بود: «وای خدای من، همین الان وب‌سایت امریکن اپَرِل از دسترس خارج شد»-، چت‌جی‌پی‌تی پردازش داده را به‌جای مکالمه ارائه می‌دهد، مزرعۀ سرورها4 با ضرباهنگ زبان گفتاری کار می‌کنند.

با استفاده از مدل‌های زبانی بزرگ برای مکالمه، سازندگان آن‌ها برای آموزش و بهبود نرم‌افزار، مخاطب‌هایی انسانی را به کار می‌گیرند. اما اضافه‌شدن رابط‌های مکالمه به مدل‌های زبانی بزرگی که با کاربران سروکار دارند باعث شده آن‌ها صمیمی شده و با عادات و فعالیت‌های موجود سازگار شوند. «چتْ» حسی را برمی‌انگیزاند که موتورهای جست‌وجو و پایگاه‌های داده از برانگیختنش عاجزند: حس یک رابطۀ انسانی. چت خویشتن یک فرد را به میان می‌کشد، که همین موجب بروز رفتارهای مشخصی می‌شود. ابتدای سال جاری، در مطلبی با عنوان «هنگام حرف‌زدن با این بات‌ها دقیقاً با چه کسی حرف می‌زنیم؟»5در سایت مدیوم، کالین فریزر، داده‌شناسِ شرکت متا، دربارۀ چت‌جی‌پی‌تی این‌گونه نوشت: «رابط چت‌گونه … کاربر را به‌سمت واردکردن داده‌های مطلوب هدایت می‌کند». طبق نوشتۀ او، زمانی‌که کاربران از مسیر مشخص‌شده خارج شوند، مدل زبانی بزرگ در معرض ارائۀ خروجی نامطلوب قرار می‌گیرد -جملات کامل یا ناقصی که فاش می‌کنند در پس‌زمینه یک «نویسندۀ مصنوعی و غیرانسانی» حضور دارد. او این طور ادامه داد: «مهم‌ترین دلیلی که اُپن‌ای‌آی نیاز دارد تا داده‌های ورودی شما را در چارچوب سبک مشخصی از مکالمه نگه دارد این است که آن‌ها امکان نظارت مؤثر بر خروجی مدل را داشته باشند. مدل فقط زمانی قابل‌پیش‌بینی عمل می‌کند که کاربر قابل‌پیش‌بینی باشد».

انسان‌ها با چت‌بات‌های امروزی عملاً صحبت نمی‌کنند؛ بلکه به آن «پرامپت» می‌دهند. اصطلاح پرامپت در اینجا یعنی برنامه را به‌طور سنجیده هل‌دادن و ترغیب‌کردن به‌سمت نتایج مشخص. اسناد اُپن‌ای‌آی بخشی دارد در رابطه با «بهترین شیوۀ مهندسی پرامپت» برای رابط برنامه‌نویسی کاربردی شرکت؛ این شیوه‌ها شامل استفاده‌نکردن از ساختار منفی (یعنی اینکه «به‌جای گفتن اینکه چه کار انجام نشود، باید گفت چه کار انجام شود»)، و ارائۀ جزئیات دربارۀ «بافت متن، نتیجه، طول متن، قالب، سبک»، و لحن پاسخ مطلوب می‌شوند. بعضی از شرکت‌های فعال در زمینۀ محصولات هوش مصنوعی «مهندسین پرامپت» را به خدمت گرفته‌اند، کسانی که پرامپت‌های مفید یا زنجیره‌هایی از پرامپت را توسعه داده و مستند می‌کنند. شرکت آنتروپیک که چت‌بات آن، کلود، به‌عنوان چت‌باتی «به‌دردبخور، صادق و بی‌ضرر» عرضه شده، یک آگهی استخدام برای «مهندس یا بایگان پرامپت» منتشر کرده و در آن این شغل را به «ترکیبی از برنامه‌نویسی، راهنمایی‌کردن و آموزش‌دادن» توصیف کرده است.

اگر پرامپت‌هایی مشخص داده‌هایی باکیفیت تولید کنند -محتوایی که قابل‌خواندن‌تر، کامل‌تر و گاهی دقیق‌تر باشد- پس طراحی پرامپت نوعی سواد به حساب می‌آید. ابتدای بهار، تایمز مطلبی آموزشی منتشر کرد با عنوان «به‌وسیلۀ این پرامپت‎‌های طلایی بهترین نتیجه را از چت‌جی‌پی‌تی بگیرید»6، و در آن توصیه کرد از عبارت «طوری رفتار کن که انگار» برای هدایت چت‌بات‌ها استفاده شود تا آن‌ها «متخصصین را تقلید کنند». کاربران نیز البته نقش بازی می‌کنند. آن‌ها نیز می‌بایست در تقلید مشارکت کنند -تظاهر به همکاری، چت‌کردن به شکلی که کامپیوتر بهتر متوجه شود، کنارگذاشتن هرگونه بدگمانی در رابطه با تخصص متنِ پیش‌بینانه. خروجی‌های باکیفیت پاداش ورودی‌های باکیفیت است؛ نرم افزار همانند آینه عمل می‌کند. چیزی که اتفاق می‌افتد دادوستد داده میان کاربر و بات است -اما همچنین این دخل‌وتصرفی دوطرفه است، مانند چرخ لنگر7یا اوروبروس8.

در گردهمایی سازندگان بازی، و در خلال زمان استراحت بین جلسات، به فروشگاه متریون در همان حوالی رفتم تا ناهار را در یک رستوران فست-کژوال9 ویتنامی بخورم. دَه سال پیش مرتباً به این رستوران می‌آمدم، زمانی‌که بیست‌وپنج‌ساله بودم و در بخش پشتیبانی یک استارتاپ در همان نزدیکی کار می‌کردم. آن زمان، وقتم صرف نوشتن ایمیل‌هایی می‌شد که محتوایشان این بود: «علاقه‌مندم تا وضعیت مشکلی را که برایتان پیش آمده برای خودم بازسازی کنم» و «به من اطلاع دهید اگر این راه‌حل جواب داد!». در آن سال‌ها، کتاب تونی هسیه، ارائۀ خوشبختی10، محبوبیت داشت، و دربارۀ چگونگی توزیع «شگفتی و شادی» صحبت‌های زیادی می‌شد. فکرکردن به آینده‌ای که این کار در آن کاملاً ماشینی انجام شود عجیب بود -آینده‌ای که مدل‌های زبانی بزرگ، به‌جای افراد تحصیل‌کرده، ناکامی و خطای انسانی را به چیزی مفید و زیبا تبدیل کنند.

رستوران تقریباً همان‌گونه بود که به خاطر داشتم، اما با نمایشگرهای بیشتر. کاسه‌ها در سراسر جهان بخش جدایی‌ناپذیری از آشپزی هستند، اما در فرهنگ سازمانی ناهارخوردن، «کاسه» همچنین بیانگر غذاهایی است که سفارش‌دهنده خود آن‌ها را می‌سازد -غذاهایی که به اجزای تشکیل‌دهنده‌شان تقلیل یافته‌اند. در رستوران، افرادی با کارت شناساییِ گردهمایی به گردنشان مقابل دو نمایشگر لمسی ایستاده بودند تا پایه، پروتئین، سس و مخلفات غذای خود را انتخاب کنند. پشت نمایشگرها ردیفی از کارکنان، مشتی نودل برنج را از تغارهایی سرد و فلزی به ظروفی تجزیه‌پذیر می‌ریختند. وقتی نوبت به من رسید، تعداد مشخصی از مواد تشکیل‌دهنده را تقریباً به‌شکل تصادفی انتخاب کردم و بلافاصله هم پشیمان شدم. هم‌زمان که کارکنان کاسۀ مرا آماده می‌کردند، نظرات مردم دربارۀ رستوران را در سایت یِلپ خواندم. یکی نوشته بود «با این قیمت، از این بهتر گیرتان نمی‌آید». دیگری نوشته بود «واقعاً کاسه را پر کرده بودند». فردی ادعا کرده بود «کاسۀ من لبالب پر بود!».

من همواره به یلپ علاقه‌مند بوده‌ام، نه به‌عنوان یک سرویس بلکه به‌عنوان گنجینه‌ای ادبی، که تمایلات و انتظارات برآورده‌نشدۀ فرهنگی‌اجتماعی را برای حدود بیست سال گردآوری کرده است -شرح وقایع جست‌وجوی یک نسل برای تجربه‌ای بهینه‌شده. این سایت، که در سال ۲۰۰۴ تأسیس شده، کامل‌ترین محصول نسخۀ ۲.۰ وب است، نسخه‌ای از وب که سبک جدیدی از محتوای ساخته‌شده توسط کاربران را ارائه کرد، محتوایی نظیر توییت‌، شِت‌پست11، کامنت، میم و نقد -گونه‌هایی از زبان نوشتار عمومی، با قواعد، اختصار و تکیه‌کلام خاص خود که در هر پلتفرم به یک شکل درمی‌آیند (برای مثال، یلپ این‌گونه است: «اگر می‌توانستم صفر ستاره می‌دادم»؛ «از میزان ستاره‌ها بسیار شگفت‌زده‌ام»؛ «درواقع ۳.۵ بود اما به‌خاطر نوع ارائه به‌سمت پایین گردش کردم»). می‌شود گفت دردناک است که مدل‌های زبانی بزرگ با محتوای وب ۲.۰ آموزش داده شده‌اند. باید گفت که، در مقام مقایسه، آن پلتفرم‌های عمومی و متنی‌ای که به آن‌ها جان می‌بخشید زیبا و بی‌پیرایه بودند.

نمی‌دانستم آیا چت‌بات‌ها و دیگر رابط‌های زبان طبیعی می‌توانند صورت‌های جدیدی از مکالمه، قالب‌های تازه‌ای از گفت‌وگو و محتوایی نو را ایجاد کنند یا نه. همان‌گونه که یلپ بر شیوۀ اندیشیدن کاربرانش دربارۀ تجربه‌های حقیقی مشخصی اثر گذاشت -مانند رفتن به مطب طب مفصلی، خدمات مشتریان در یک پمپ بنزین، و اندازه کاسۀ ناهار -مدل‌های زبانی بزرگ نیز ظرفیت اثرگذاشتن بر نحوۀ جست‌وجو و پردازش اطلاعات مردم را داشتند. تا به اینجا، صرف‌نظر از ساخت متنی پر از ایرادات واقعی، از چت‌بات‌ها به‌عنوان ابزاری برای جمع‌آوری اطلاعات استفاده می‌شده است. آن‌ها چگونه می‌توانند بر توقعات کاربران از دانش یا برداشت آن‌ها از تخصص و توانایی تأثیر بگذارند؟

با کاسۀ ناهارم در دست، یک صندلی در مرکز خریدی نزدیک به مرکز ماسکون پیدا کردم. مردم تکیه‌زده به ساختمان سیگار در دست داشتند، یا در گروه‌هایی کوچک سیگار الکتریکی می‌کشیدند. هوا خوشبو، آلوده و خاطره‌انگیز بود، و صورتم از تابش خورشید گرم شده بود. به خلالی از جیکاما گاز زدم؛ با خوش‌حالی و حس نوستالژی، خوراکی محبوب جوانی‌ام را می‌خوردم. ذهنم رفت به آن زمان که در بخش پشتیبانی کار می‌کردم، و اینکه چطور گاهی اوقات به اتاق سرور می‌رفتم تا با مشتریان تماس تصویری بگیرم، اینکه چگونه بعضی وقت‌ها شگفت‌زده می‌شدند از اینکه فردی را می‌بینند که برایش ایمیل می‌فرستند، و اینکه چطور لحن بیان تغییر می‌کند. مکالمۀ کاری -حرف‌ردوبدل‌کردن با کسی مانند یک بات- می‌تواند پُربازده باشد، و با توجه به موضوع و طبع شما، شاید حتی بهتر. اما همچنان حس تکبر‌آمیز، تحقیر‌آمیز، فریب‌کارانه و عامیانه‌ای دارد -شبیه به رفتاری که با یک N.P.C می‌شود. من ناهار پروستی خود را خوردم. حق با نظردهندگانِ یلپ بود؛ کاسۀ بزرگی بود.

بعد از اینکه به مرکز ماسکون بازگشتم و بار دیگر در بخش نمایشگاه چرخی زدم، با پله‌برقی به لابی رفتم، در گوشه‌وکنار دوری زده و پله‌ها را پایین رفتم. در آنجا که به نظر می‌رسید زیرزمین باشد، دو «اتاق شیردهی» دیدم. اتاق‌ها سازه‌ای بدون تکیه‌گاه داشتند و توسط شرکتی به نام ماماوا ساخته شده بودند، و ظاهری داشتند شبیه به مینی کاروان. به‌عنوان خوشامدگویی، پشت در نوشته شده بود «مامان‌ها سلام! استراحت کنید. این حق شماست». روی طاقچۀ کنار یک آینه، گل مصنوعی کوچکی بود. خودم را در آینه نگاه کردم؛ پیراهن یقه اسکی، کوله‌پشتی، کارت شناسائی همایش و چشمانی خسته را دیدم. پایین آینه عکس‌برگردانی بود که می‌گفت: «خوشگل شدی مامان!». زیادی خودمانی بود، و کمی تحقیرآمیز. کلمات به نظر خیلی سطحی بودند.

زبان می‌تواند یک دنیا را در خود بگنجاند، و سرگذشت، ارزش‌ها یا آسیب‌های کسی که از آن استفاده می‌کند را نمایان کند. همچنین می‌تواند گیج‌کننده، غیرقابل‌اعتماد و گمراه‌کننده باشد. پرچانگی، با اینکه ذاتاً موجب صمیمیت است، درعین‌حال سرپوشی است برای وعده‌های دروغین، ابتذال، پوچی، بگومگو، و موضوعی که درباره‌اش صحبت می‌شود (در سال ۲۰۲۲، فروش ماهی گروپر تایوانی در چین، بزرگ‌ترین بازار آن، ممنوع شد، و سبب شد تولیدکنندگان آن سخت محتاج مشتریانی جدید باشند). در این وضعیت، چت شبیه‌سازی‌شده واقعیت آنچه لازم است تا مدل‌های زبانی بزرگ ساخته، تربیت، به‌روزرسانی و نگهداری شوند را تحت‌الشعاع قرار می‌دهد، مسئله‌ای که، دست‌کم تاکنون، هزینه و منابع زیادی را به خود اختصاص داده است. تبدیل‌کردن رایانش به چیزی انسانی‌تر و صمیمی‌تر کاری عظیم است؛ در پسِ هر چت‌بات یک یا چند مزرعۀ سرور قرار دارد. پرامپت‌نویسی مدل زبانی بزرگ برای بازیابی و هماهنگی داده‌ها مستلزم به‌کارانداختن شبکه‌ای وسیع است. چت‌بات‌ها، علی‌رغم قابلیت شخصی‌سازی آشکارشان، محصولاتی برای تولید انبوه هستند.

تمامی این زیرساخت‌ یک فانتزی را تقویت می‌کند. تکنولوژیست‌ها برای مدتی طولانی آرزو داشتند با برنامه‌ها رابطه‌ای انسانی داشته باشند. اخیراً سم آلتمن، مدیرعامل اُپن‌ای‌آی، در مصاحبه با وال استریت ژورنال از خاطرات کودکی‌اش گفته است، زمانی که به کامپیوتر مکینتاش خودش خیره شده و «ناگهان ’دریافته‘ که روزی کامپیوتر فکرکردن را یاد خواهد گرفت» (استفادۀ وال استریت ژورنال از کلمۀ «دریافتن» بیشتر به واقعی‌بودن این مسئله اشاره دارد تا حدسی‌بودن آن؛ هنوز مشخص نیست که مدل‌های زبانی بزرگ یا فناوری‌های متعاقب آن‌ها توانایی «فکرکردن» را به شکلی مشخص و هدفمند داشته باشند). هفتۀ گذشته، سرمایه‌گذار حوزۀ کارآفرینی، مارک آندریسن، مقاله‌ای منتشر کرد و در آن دنیایی را به تصویر کشید که در آن بات‌هایی همدل، آگاه و مشوق، «بهره‌وری را در افراد به حداکثر رسانده»، و در کنار هنرمندان، دانشمندان، دولتمردان و کودکانْ مشغول به کار هستند. او این‌طور نوشته که «هر کودکْ معلمی با هوش مصنوعی خواهد داشت که بی‌نهایت صبور، بی‌نهایت مهربان، بی‌نهایت دانا و بی‌نهایت خیرخواه است. این معلم در هر گام از رشد کودک کنار او خواهد بود، و او را در شکوفاکردنِ حداکثریِ استعدادهایش با نسخۀ ماشینی عشقی بی‌پایان همراهی می‌کند».

وقتی تنها در خانه نشستم و منتظر پاسخ چت‌جی‌پی‌تی بودم، فکر کردم که این فناوری، در پیشرفته‌ترین حالت، چقدر می‌تواند محبت ساختگی و هوش در خود داشته باشد -آیا هرگز قابل‌اعتماد خواهد بود یا می‌تواند برای مخاطب فضایی خلق کند؟ شاید آینده واقعاً دانش و عشق بی‌نهایت یا دست‌کم «نسخۀ ماشینی» آن‌ها را در خود داشته که توسط شرکت‌های انحصاری و شرکت‌های فناوری با سرمایه‌گذاری خطرپذیر ساخته شده، بازاریابی شده و به فروش رفته‌اند. در همین حین، نزدیک به لبۀ صفحۀ نمایش، اعلان‌ها چشمک زده و از صفحه خارج شدند؛ موبایلم لرزید، که نشان می‌داد صندوق ورودی ایمیلم پُر شده از سرخط اخبار، پشتیبانی کار، خبرهای شخصی، مطایبه، اظهار همدردی و شایعه. در آینده‌ای نزدیک، به نظر بی‌نهایت چت خواهیم داشت، نه با دوستان و نه حتی غریبه‌ها، بلکه با قفسه‌های سرور در آلتونا و اشبرن -دنیایی از رابط‌های متنوع که منتظر نوشتن پرامپت بوده و حاضرند همان چیزهایی را بگویند که کاربران می‌خواهند بشنوند.

پاورقی

1
مدل زبانی بزرگ (large language model، یا به‌اختصار L.L.M) یک مدل زبانی متشکل از یک شبکۀ عصبی با پارامترهای زیادی است که بر روی مقادیر زیادی متن بدون برچسب با استفاده از یادگیری خودنظارتی یا یادگیری نیمه‌نظارتی آموزش داده شده است [مترجم].
2
خدمت سواره یا بدون پیاده‌شدن یا خرید پنجره‌ای نوعی خدمت در کسب‌وکارهای گوناگون است که به مشتریان اجازه می‌دهد بدون تَرک خودرو محصولات موردنیاز خود را از پنجرۀ فروشگاه خریداری کنند [مترجم].
3
مقصود نویسنده حالتی است که کاربران به‌شکل رگباری به یکدیگر پیام می‌فرستند یا، با ترک صفحۀ چت و پاسخ‌ندادن به طرف مقابل، چت را معلق رها می‌کنند [مترجم].
4
کارسازگان یا مزرعهٔ سرور (server farm) مجموعه‌ای از سرورهای رایانه‌ای است که معمولاً برای اهداف تجاری مورد استفاده قرار می‌گیرند. این اهداف با استفاده از رایانه‌هایی با توان معمولی قابل دستیابی نیستند [مترجم].
5
Who are we talking to when we talk to these bots?
6
Get the Best from ChatGPT with These Golden Prompts
7
چرخ لنگر یا چرخ طیار یک وسیلهٔ مکانیکی گردان سنگین است که برای ذخیره‌سازی انرژی دورانی به کار می‌رود [مترجم].
8
اوروبروس یا دُنب‌خوار نمادی باستانی از مار یا اژدهایی است که دُمش را می‌خورد [مترجم].
9
فست کژوال نوعی رستوران است که نخست در ایالات‌متحدۀ آمریکا بنیان نهاده شد. این نوع رستوران ارائه‌دهندۀ سرویس کامل سر میز نیست، اما متعهد به ارائۀ خوراک (غذا) با بالاترین کیفیت، تهیه‌شده از محصولات تازه به‌صورت روزانه و در حضور مشتری می‌باشد [مترجم].
10
Delivering Happiness
11
شت‌پستینگ به پست‌ها و محتواهای پرخاشگونه، گواژه‌ای و ترول در رسانه‌های اجتماعی و تالار گفت‌وگو در اینترنت گفته می‌شود [مترجم].