آیا هوش مصنوعی هیچوقت میتواند با ما واقعاً حرف بزند؟
در زندگی بیشتر آدمهایی که آنقدر سن و سال دارند که دورانِ قبل از اینترنت را به یاد داشته باشند، یک دورۀ شگفتانگیز وجود دارد: روزهایی که «لذتِ چتکردن» را کشف کردهاند. چتکردن به جهات مختلف از مکالمۀ رو در رو خوشایندتر است. ما هنگام چت کردن، بامزهتر و هوشمندانهتر حرف میزنیم و به نسخۀ بهتری از خودمان تبدیل میشویم. در مقابل، با نسخۀ بهتری از دیگران هم تعامل میکنیم. آیا هوش مصنوعیهایی مثل چت جیپیتی که وعده میدهند با ما وارد گفتگو شوند هم چنین لذتی به ما خواهند بخشید؟
آنا وینر، نیویورکرـــ ابتدای بهار بود که، بهعنوان خبرنگار، با اتوبوس به مرکز ماسکون در مرکز شهر سانفرانسیکو رفتم، جایی که حدود ۳۰ هزار نفر برای گردهمایی سالیانۀ سازندگان بازی (G.D.C.) جمع شده بودند. چند ماه قبلتر به مرخصی زایمان رفته بودم و خوشحال بودم از اینکه به کار بازگشتهام، میتوانم با دیگران ملاقات کنم و برای مدتی کوتاه بیرون از فضای خانه باشم. حضور در بین مردم احساسی خارقالعاده و تا حدی سرگیجهآور داشت. دوست داشتم با رانندۀ اتوبوس اختلاط کنم یا پنهانی به حرفهای غریبهها گوش کنم. شنیدم مردی با اندوه به دیگری میگوید «گردهمایی باز شروع شده». وقتی پیاده شدیم و اتوبوس رفت، دیدم بدنهاش با تبلیغی بزرگ از ماهی گروپر تایوانی پوشانده شده. در تبلیغ این طور آمده بود: «طعمی ملایم و درعینحال متمایز؛ همین امشب گوشت کمچربی و مغذی گروپر را امتحان کنید».
در بخش نمایشگاهِ گردهمایی، اسکیتسوارانی با لباسهای چسبان مشکی، که به سرتاسر آنها حسگر نصب بود، حرکات نمایشی سطحپایینی را روی سطح شیبدار اجرا میکردند. آدمهایی که با کارت شناساییِ آویختهبهگردن و عینکهای واقعیت مجازی به چشم تلوتلو میخوردند. دیوارها پر بود از صفحهنمایشها و نمایشگرهایی با وضوح تصویر و عملکرد بالا، طوری که نگاهکردن به صفحۀ تلفنهمراه برایم آرامشبخش بود. همان هفته، اصحاب رسانه و کاربران فعال توییتر در حوزۀ فناوری بهطور مداوم یا دربارۀ چتباتها سخن میگفتند یا با آنها حرف میزدند. اوپنای.آی. بهتازگی نسخۀ جدیدی از چتجیپیتی را منتشر کرده بود و این فناوری داشت همه را به هیجان میآورد. در این باره گمانهزنی میشد که آیا هوش مصنوعی ساختار اجتماعی را خراب میکند یا رفته رفته جای تمامی مشاغل و حتی صنایع را میگیرد.
صنعت بازی مدتهاست که بر انواع مختلف آنچه هوش مصنوعی نامیده میشود تکیه کرده است، و در گردهمایی G.D.C. نیز در رابطه با مدلهای زبانی بزرگ1 و هوش مصنوعی مولد در ساخت بازی دستکم دو سخنرانی ایراد شد. این دو سخنرانی بهویژه روی ساخت شخصیتهای غیرقابلبازی یا همان N.P.Cها متمرکز بودند، شخصیتهایی نمایشی که صرفاً استفادۀ ابزاری داشته -اهالی روستا، موجودات جنگل، حریفان مبارزه، و مواردی از این دست- و دیالوگهایی ازپیشنوشتهشده، محدود و کاربردی به زبان میآورند که به آنها «بارک» گفته میشود («سلام!»؛ «تا حالا شنیدی؟»؛ «مراقب باش!») N.P.Cها قرار است حس حضور آدمها، شلوغی و چندبُعدیبودن را به بازی اضافه کنند، بدون اینکه جلبتوجه چندانی بکنند. درعینحال، خارج از فضای بازی، میتوان گفت عبارتِ N.P.C تبدیل به یک میم شده است. در سال ۲۰۱۸، مجلۀ تایمز این اصطلاح را «توهین پُرطرفدار و جدید هواداران ترامپ در فضای مجازی» عنوان کرد، پس از اینکه کاربران جناح راست شروع به استفاده از آن کردند تا نشان دهند رقبای سیاسیشان احمقهایی بیفکر بوده که توسط جریان سیاسی حاکم شستوشوی مغزی شدهاند. این روزها، میتوان از N.P.C برای توصیف فردی دیگر یا یک فرد عامی -سطحی، بدون فردیت، وابسته، بیاراده، و ناتوان- استفاده کرد.
وقتی ظرفیت N.P.Cها را، که نشئتگرفته از مدلهای زبانی بزرگ بود، در نظر گرفتم، جهانهایی درونزا از گفتوگو به ذهنم آمد، جایی که به هر شیء و کاراکتر ویژگیهای شخصیتی بخشیده میشود. دیوهایی مهربان، دستفروشهایی پُرحرف و گیاهانی خوشسخن را تصور کردم. در واقعیت، این تصور معمولیتر است. N.P.Cها «میتوانند با بازیکن، N.P.Cهای دیگر و خودشان صحبت کنند -اما میبایست این کار را بدون مکث، تکرار، یا انحراف از طرح روایی انجام دهند»؛ این خلاصۀ یکی از سخنرانیها بود که توسط بن سوانسون، پژوهشگر یوبیسافت، ایراد شد. سخنرانی سوانسون، برنامۀ «نویسندۀ پشت پردۀ» یوبیسافت را ارائه کرد، نرمافزاری که طراحی شده بود تا از دشواری ساخت «درختوارهها»ی پُرشاخوبرگِ دیالوگ بکاهد. در این درختوارهها، نوع مشخصی از مکالمه بهدفعات تکرار میشود، و با توجه به چیزی که بازیکن بگوید، اندکی پسوپیش میشوند. «نویسندۀ پشت پرده» از یک مدل زبانی بزرگ بهره میگیرد تا بارکهای مناسب را به N.P.Cها پیشنهاد دهد. این کار بر اساس معیارهای مختلفی صورت میگیرد که توسط انسانها وضع شده و خروجی مدل نیز توسط خود آنها بررسی میشود.
بااینحال، به نظر میرسد «گفتوگو» با هوش مصنوعی در سالهای پیشِ رو احتمالاً رواج بیشتری پیدا کند. مدلهای زبانی بزرگ در حال اضافهشدن به موتورهای جستوجو و سایتهای خریدوفروش آنلاین، نرمافزارهای پردازش کلمه و نرمافزارهای صفحه گسترده هستند. در مقام نظر، قابلیتهای دستیارهای صوتی، مانند سیری در اپل یا الکسا در آمازون، میتوانند پیچیدهتر و لایهلایهتر شوند. مراکز تماسْ «دستیارها»ی صوتی معرفی میکنند؛ گفته میشود آمازون در حال ساخت یک چتبات است، و فستفود زنجیرهای وندیز مدتی است در پی ایجاد یک خدمت سواره2 تحت کنترل هوش مصنوعی است. ابتدای بهار، مدرسۀ آزمایشگاهی خان، مدرسهای خصوصی و کوچک در پالو آلتو، یک بات آزمایشی آموزگار را به دانشآموزان خود معرفی کرد، و انجمن ملی اختلال خوردن سعی داشت، بهجای بخش مشاورۀ تلفنیِ انسانی خود، از یک بات به نام تِسا استفاده کند (بعد از اینکه تسا به تماسگیرندگان مشورت غلط داد، انجمن این سرویس را تعلیق کرد).
چتباتها هدف غایی مدلهای زبانی بزرگ نیستند. مسلماً قابلیتهای چشمگیر این فناوری بیش از آنکه معطوف به گفتوگو باشد، مرتبط به پردازش داده است -یافتن و تقلیدکردن الگوها، نشخوارکردن ورودیها برای ساخت چیزی شبیه به چکیده- که متن گفتوگو صرفاً نمونهای از آن است. باوجوداین، به نظر میرسد در آینده فرصتهای بیشماری برای اختلاط با مخاطبینی خستگیناپذیر در پی خواهد بود. بخشی از این گفتوگو بهشکل نوشتاری خواهد بود، و بخشی نیز میتواند از طریق واسطههای کلامی انجام بگیرد که به دستورهای گفتاری، پرسشها و سایر ورودیها واکنش نشان میدهند. هر چیزی که به یک پایگاه داده متصل شود عملاً میتواند تبدیل به یک بات یا N.P.C شود، چه در فضای مجازی و چه در فضای حقیقی. انگار ما در حال ورود به دورانی هستیم که مشخصهاش چت بیپایان است -مفیدند و میشود بهسرعت مرورشان کرد و عامدانه بیانتها طراحی شدهاند.
چتکردن با مکالمه یا گفتوگو متفاوت است و جریان خاص خودش را دارد. چت میتواند متنافر باشد -افراد حاضر در آن سیلی از پیامهای کوتاه را بهسمت یکدیگر روانه کنند- یا اینکه کاملاً ناهمگام باشد، مانند زمانی که افراد روی دکمۀ «بازگشت» زده و چت را به حالت تعلیق درمیآورند.3 انتظارات معمولاً پایین بوده، و فرصت برای شرکت در آن همواره فراهم است؛ یک فرد میتواند در قالب پیامهای خصوصی، در نرمافزارهای دوستیابی، بازیهای ویدئویی، نرمافزارهای پردازش کلمه و مانند اینها چت کند، چه برسد به نرمافزارهای اختصاصی این کار مانند واتساپ یا آیمسیج. چت قابلیت سازگاری با ویژگیها، محدودیتها و قواعد پلتفرم خود را دارد. چتکردن در اسلَک با چتکردن در تیندر تفاوت دارد. همواره چیزهای بیشتری برای گفتن و نیز جای دیگری برای آن وجود دارد. انگار سکوت -آرامش- چیزی شبیه به معجزه شده است.
در سال ۲۰۱۱، سردبیران نشریۀ اِن+۱ در مقالهای با عنوان «نیروگذاری در چت» رسالهای عجیب و بامزه دربارۀ چت منتشر کردند. آنها بهطور خاص لذتهای بیبدیل جیچت را، که آن زمان نرمافزاری محبوب به حساب میآمد، واکاوی کردند. آنها این طور نوشته بودند: «جیچت فلسفه را به اتاق خواب بازگردانده است، همانگونه که شب دیروقت خود را در وضعیت تمرکز بالا مییابیم. بسیاری از ما بهترین نسخۀ خودمان را در جیچت میبینیم. ازآنجاکه در سکوت نمیتوانیم صحبت دوستانمان را قطع کنیم، درنتیجه به شنوندگانی بهتر و عمیقتر تبدیل میشویم، و نیز سخنوران یا نویسندگانی بهتر». طبق نوشتۀ آنها، چت میتواند راحت، صمیمی، بیتکلف، روشنگر و آزاد باشد؛ همچنین جریانی نهفته از احساس نیز دارد. آنها همچنین اینگونه استدلال کرده بودند: «فوریت در چت باعث میشود پاسخ اهمیت پیدا کند، که به یادمان میآورد ما در نوشتن نهفقط خودمان، که روابطمان را نیز میسازیم و افشا میکنیم».
چیزی که چتباتها ارائه میدهند درواقع چت نیست؛ شبیهساز آن است. بعضی از نمونههای خودمانیتر مانند رپلیکا («هوش مصنوعی رفیقی که دل میسوزاند»)، یا سیدنی که متعلق به بینگ و نیمهبازنشسته است، قادرند ریتمی شبیه به واقعیت را بسازند. چتجیپیتی انسانگونگی را تشویق میکند، حتی با وجود «شخصیت» خشک و عمداً بیروحش؛ وقتی اشتباه میکند پوزش میطلبد، متن را به ضمیر اول شخص برمیگرداند و نشانگری دارد که نشان میدهد در حال تایپکردن است -نقطههایی در یک راستا، که بهترتیب و بهطور مداوم بالا میروند، و تلفیقی از اندیشیدن و تردید را از جانب کامپیوتر نمایش میدهند (کوین مانگر، دانشور علوم سیاسی در دانشگاه ایالتی پنسیلوانیا، پیشنهاد داده که استفاده از ضمایر اول شخص کنترل شود، برای «کاستن از خطر فریبخوردن مردم توسط مدلهای زبانی بزرگ، چه از نظر مالی و چه از نظر عاطفی»). بااینحال، سبک نوشتار چتجیپیتی همچنان بهشکل تقریباً یکنواختی سرد، بیروح و مبهم است؛ اگرچه میتواند، با کمکگرفتن، گفتههای خود را بهصورت گونههای مختلف زبانی و در حالات گوناگون هیجانی بیان کند، اما کماکان به انسان حس گفتوگو با فرمول و عدد را میدهد. در مقایسه با فوریت چتهای خودم با دوستانم در جیچت -دوستی در سال ۲۰۱۱ اینطور نوشته بود: «وای خدای من، همین الان وبسایت امریکن اپَرِل از دسترس خارج شد»-، چتجیپیتی پردازش داده را بهجای مکالمه ارائه میدهد، مزرعۀ سرورها4 با ضرباهنگ زبان گفتاری کار میکنند.
با استفاده از مدلهای زبانی بزرگ برای مکالمه، سازندگان آنها برای آموزش و بهبود نرمافزار، مخاطبهایی انسانی را به کار میگیرند. اما اضافهشدن رابطهای مکالمه به مدلهای زبانی بزرگی که با کاربران سروکار دارند باعث شده آنها صمیمی شده و با عادات و فعالیتهای موجود سازگار شوند. «چتْ» حسی را برمیانگیزاند که موتورهای جستوجو و پایگاههای داده از برانگیختنش عاجزند: حس یک رابطۀ انسانی. چت خویشتن یک فرد را به میان میکشد، که همین موجب بروز رفتارهای مشخصی میشود. ابتدای سال جاری، در مطلبی با عنوان «هنگام حرفزدن با این باتها دقیقاً با چه کسی حرف میزنیم؟»5در سایت مدیوم، کالین فریزر، دادهشناسِ شرکت متا، دربارۀ چتجیپیتی اینگونه نوشت: «رابط چتگونه … کاربر را بهسمت واردکردن دادههای مطلوب هدایت میکند». طبق نوشتۀ او، زمانیکه کاربران از مسیر مشخصشده خارج شوند، مدل زبانی بزرگ در معرض ارائۀ خروجی نامطلوب قرار میگیرد -جملات کامل یا ناقصی که فاش میکنند در پسزمینه یک «نویسندۀ مصنوعی و غیرانسانی» حضور دارد. او این طور ادامه داد: «مهمترین دلیلی که اُپنایآی نیاز دارد تا دادههای ورودی شما را در چارچوب سبک مشخصی از مکالمه نگه دارد این است که آنها امکان نظارت مؤثر بر خروجی مدل را داشته باشند. مدل فقط زمانی قابلپیشبینی عمل میکند که کاربر قابلپیشبینی باشد».
انسانها با چتباتهای امروزی عملاً صحبت نمیکنند؛ بلکه به آن «پرامپت» میدهند. اصطلاح پرامپت در اینجا یعنی برنامه را بهطور سنجیده هلدادن و ترغیبکردن بهسمت نتایج مشخص. اسناد اُپنایآی بخشی دارد در رابطه با «بهترین شیوۀ مهندسی پرامپت» برای رابط برنامهنویسی کاربردی شرکت؛ این شیوهها شامل استفادهنکردن از ساختار منفی (یعنی اینکه «بهجای گفتن اینکه چه کار انجام نشود، باید گفت چه کار انجام شود»)، و ارائۀ جزئیات دربارۀ «بافت متن، نتیجه، طول متن، قالب، سبک»، و لحن پاسخ مطلوب میشوند. بعضی از شرکتهای فعال در زمینۀ محصولات هوش مصنوعی «مهندسین پرامپت» را به خدمت گرفتهاند، کسانی که پرامپتهای مفید یا زنجیرههایی از پرامپت را توسعه داده و مستند میکنند. شرکت آنتروپیک که چتبات آن، کلود، بهعنوان چتباتی «بهدردبخور، صادق و بیضرر» عرضه شده، یک آگهی استخدام برای «مهندس یا بایگان پرامپت» منتشر کرده و در آن این شغل را به «ترکیبی از برنامهنویسی، راهنماییکردن و آموزشدادن» توصیف کرده است.
اگر پرامپتهایی مشخص دادههایی باکیفیت تولید کنند -محتوایی که قابلخواندنتر، کاملتر و گاهی دقیقتر باشد- پس طراحی پرامپت نوعی سواد به حساب میآید. ابتدای بهار، تایمز مطلبی آموزشی منتشر کرد با عنوان «بهوسیلۀ این پرامپتهای طلایی بهترین نتیجه را از چتجیپیتی بگیرید»6، و در آن توصیه کرد از عبارت «طوری رفتار کن که انگار» برای هدایت چتباتها استفاده شود تا آنها «متخصصین را تقلید کنند». کاربران نیز البته نقش بازی میکنند. آنها نیز میبایست در تقلید مشارکت کنند -تظاهر به همکاری، چتکردن به شکلی که کامپیوتر بهتر متوجه شود، کنارگذاشتن هرگونه بدگمانی در رابطه با تخصص متنِ پیشبینانه. خروجیهای باکیفیت پاداش ورودیهای باکیفیت است؛ نرم افزار همانند آینه عمل میکند. چیزی که اتفاق میافتد دادوستد داده میان کاربر و بات است -اما همچنین این دخلوتصرفی دوطرفه است، مانند چرخ لنگر7یا اوروبروس8.
در گردهمایی سازندگان بازی، و در خلال زمان استراحت بین جلسات، به فروشگاه متریون در همان حوالی رفتم تا ناهار را در یک رستوران فست-کژوال9 ویتنامی بخورم. دَه سال پیش مرتباً به این رستوران میآمدم، زمانیکه بیستوپنجساله بودم و در بخش پشتیبانی یک استارتاپ در همان نزدیکی کار میکردم. آن زمان، وقتم صرف نوشتن ایمیلهایی میشد که محتوایشان این بود: «علاقهمندم تا وضعیت مشکلی را که برایتان پیش آمده برای خودم بازسازی کنم» و «به من اطلاع دهید اگر این راهحل جواب داد!». در آن سالها، کتاب تونی هسیه، ارائۀ خوشبختی10، محبوبیت داشت، و دربارۀ چگونگی توزیع «شگفتی و شادی» صحبتهای زیادی میشد. فکرکردن به آیندهای که این کار در آن کاملاً ماشینی انجام شود عجیب بود -آیندهای که مدلهای زبانی بزرگ، بهجای افراد تحصیلکرده، ناکامی و خطای انسانی را به چیزی مفید و زیبا تبدیل کنند.
رستوران تقریباً همانگونه بود که به خاطر داشتم، اما با نمایشگرهای بیشتر. کاسهها در سراسر جهان بخش جداییناپذیری از آشپزی هستند، اما در فرهنگ سازمانی ناهارخوردن، «کاسه» همچنین بیانگر غذاهایی است که سفارشدهنده خود آنها را میسازد -غذاهایی که به اجزای تشکیلدهندهشان تقلیل یافتهاند. در رستوران، افرادی با کارت شناساییِ گردهمایی به گردنشان مقابل دو نمایشگر لمسی ایستاده بودند تا پایه، پروتئین، سس و مخلفات غذای خود را انتخاب کنند. پشت نمایشگرها ردیفی از کارکنان، مشتی نودل برنج را از تغارهایی سرد و فلزی به ظروفی تجزیهپذیر میریختند. وقتی نوبت به من رسید، تعداد مشخصی از مواد تشکیلدهنده را تقریباً بهشکل تصادفی انتخاب کردم و بلافاصله هم پشیمان شدم. همزمان که کارکنان کاسۀ مرا آماده میکردند، نظرات مردم دربارۀ رستوران را در سایت یِلپ خواندم. یکی نوشته بود «با این قیمت، از این بهتر گیرتان نمیآید». دیگری نوشته بود «واقعاً کاسه را پر کرده بودند». فردی ادعا کرده بود «کاسۀ من لبالب پر بود!».
من همواره به یلپ علاقهمند بودهام، نه بهعنوان یک سرویس بلکه بهعنوان گنجینهای ادبی، که تمایلات و انتظارات برآوردهنشدۀ فرهنگیاجتماعی را برای حدود بیست سال گردآوری کرده است -شرح وقایع جستوجوی یک نسل برای تجربهای بهینهشده. این سایت، که در سال ۲۰۰۴ تأسیس شده، کاملترین محصول نسخۀ ۲.۰ وب است، نسخهای از وب که سبک جدیدی از محتوای ساختهشده توسط کاربران را ارائه کرد، محتوایی نظیر توییت، شِتپست11، کامنت، میم و نقد -گونههایی از زبان نوشتار عمومی، با قواعد، اختصار و تکیهکلام خاص خود که در هر پلتفرم به یک شکل درمیآیند (برای مثال، یلپ اینگونه است: «اگر میتوانستم صفر ستاره میدادم»؛ «از میزان ستارهها بسیار شگفتزدهام»؛ «درواقع ۳.۵ بود اما بهخاطر نوع ارائه بهسمت پایین گردش کردم»). میشود گفت دردناک است که مدلهای زبانی بزرگ با محتوای وب ۲.۰ آموزش داده شدهاند. باید گفت که، در مقام مقایسه، آن پلتفرمهای عمومی و متنیای که به آنها جان میبخشید زیبا و بیپیرایه بودند.
نمیدانستم آیا چتباتها و دیگر رابطهای زبان طبیعی میتوانند صورتهای جدیدی از مکالمه، قالبهای تازهای از گفتوگو و محتوایی نو را ایجاد کنند یا نه. همانگونه که یلپ بر شیوۀ اندیشیدن کاربرانش دربارۀ تجربههای حقیقی مشخصی اثر گذاشت -مانند رفتن به مطب طب مفصلی، خدمات مشتریان در یک پمپ بنزین، و اندازه کاسۀ ناهار -مدلهای زبانی بزرگ نیز ظرفیت اثرگذاشتن بر نحوۀ جستوجو و پردازش اطلاعات مردم را داشتند. تا به اینجا، صرفنظر از ساخت متنی پر از ایرادات واقعی، از چتباتها بهعنوان ابزاری برای جمعآوری اطلاعات استفاده میشده است. آنها چگونه میتوانند بر توقعات کاربران از دانش یا برداشت آنها از تخصص و توانایی تأثیر بگذارند؟
با کاسۀ ناهارم در دست، یک صندلی در مرکز خریدی نزدیک به مرکز ماسکون پیدا کردم. مردم تکیهزده به ساختمان سیگار در دست داشتند، یا در گروههایی کوچک سیگار الکتریکی میکشیدند. هوا خوشبو، آلوده و خاطرهانگیز بود، و صورتم از تابش خورشید گرم شده بود. به خلالی از جیکاما گاز زدم؛ با خوشحالی و حس نوستالژی، خوراکی محبوب جوانیام را میخوردم. ذهنم رفت به آن زمان که در بخش پشتیبانی کار میکردم، و اینکه چطور گاهی اوقات به اتاق سرور میرفتم تا با مشتریان تماس تصویری بگیرم، اینکه چگونه بعضی وقتها شگفتزده میشدند از اینکه فردی را میبینند که برایش ایمیل میفرستند، و اینکه چطور لحن بیان تغییر میکند. مکالمۀ کاری -حرفردوبدلکردن با کسی مانند یک بات- میتواند پُربازده باشد، و با توجه به موضوع و طبع شما، شاید حتی بهتر. اما همچنان حس تکبرآمیز، تحقیرآمیز، فریبکارانه و عامیانهای دارد -شبیه به رفتاری که با یک N.P.C میشود. من ناهار پروستی خود را خوردم. حق با نظردهندگانِ یلپ بود؛ کاسۀ بزرگی بود.
بعد از اینکه به مرکز ماسکون بازگشتم و بار دیگر در بخش نمایشگاه چرخی زدم، با پلهبرقی به لابی رفتم، در گوشهوکنار دوری زده و پلهها را پایین رفتم. در آنجا که به نظر میرسید زیرزمین باشد، دو «اتاق شیردهی» دیدم. اتاقها سازهای بدون تکیهگاه داشتند و توسط شرکتی به نام ماماوا ساخته شده بودند، و ظاهری داشتند شبیه به مینی کاروان. بهعنوان خوشامدگویی، پشت در نوشته شده بود «مامانها سلام! استراحت کنید. این حق شماست». روی طاقچۀ کنار یک آینه، گل مصنوعی کوچکی بود. خودم را در آینه نگاه کردم؛ پیراهن یقه اسکی، کولهپشتی، کارت شناسائی همایش و چشمانی خسته را دیدم. پایین آینه عکسبرگردانی بود که میگفت: «خوشگل شدی مامان!». زیادی خودمانی بود، و کمی تحقیرآمیز. کلمات به نظر خیلی سطحی بودند.
زبان میتواند یک دنیا را در خود بگنجاند، و سرگذشت، ارزشها یا آسیبهای کسی که از آن استفاده میکند را نمایان کند. همچنین میتواند گیجکننده، غیرقابلاعتماد و گمراهکننده باشد. پرچانگی، با اینکه ذاتاً موجب صمیمیت است، درعینحال سرپوشی است برای وعدههای دروغین، ابتذال، پوچی، بگومگو، و موضوعی که دربارهاش صحبت میشود (در سال ۲۰۲۲، فروش ماهی گروپر تایوانی در چین، بزرگترین بازار آن، ممنوع شد، و سبب شد تولیدکنندگان آن سخت محتاج مشتریانی جدید باشند). در این وضعیت، چت شبیهسازیشده واقعیت آنچه لازم است تا مدلهای زبانی بزرگ ساخته، تربیت، بهروزرسانی و نگهداری شوند را تحتالشعاع قرار میدهد، مسئلهای که، دستکم تاکنون، هزینه و منابع زیادی را به خود اختصاص داده است. تبدیلکردن رایانش به چیزی انسانیتر و صمیمیتر کاری عظیم است؛ در پسِ هر چتبات یک یا چند مزرعۀ سرور قرار دارد. پرامپتنویسی مدل زبانی بزرگ برای بازیابی و هماهنگی دادهها مستلزم بهکارانداختن شبکهای وسیع است. چتباتها، علیرغم قابلیت شخصیسازی آشکارشان، محصولاتی برای تولید انبوه هستند.
تمامی این زیرساخت یک فانتزی را تقویت میکند. تکنولوژیستها برای مدتی طولانی آرزو داشتند با برنامهها رابطهای انسانی داشته باشند. اخیراً سم آلتمن، مدیرعامل اُپنایآی، در مصاحبه با وال استریت ژورنال از خاطرات کودکیاش گفته است، زمانی که به کامپیوتر مکینتاش خودش خیره شده و «ناگهان ’دریافته‘ که روزی کامپیوتر فکرکردن را یاد خواهد گرفت» (استفادۀ وال استریت ژورنال از کلمۀ «دریافتن» بیشتر به واقعیبودن این مسئله اشاره دارد تا حدسیبودن آن؛ هنوز مشخص نیست که مدلهای زبانی بزرگ یا فناوریهای متعاقب آنها توانایی «فکرکردن» را به شکلی مشخص و هدفمند داشته باشند). هفتۀ گذشته، سرمایهگذار حوزۀ کارآفرینی، مارک آندریسن، مقالهای منتشر کرد و در آن دنیایی را به تصویر کشید که در آن باتهایی همدل، آگاه و مشوق، «بهرهوری را در افراد به حداکثر رسانده»، و در کنار هنرمندان، دانشمندان، دولتمردان و کودکانْ مشغول به کار هستند. او اینطور نوشته که «هر کودکْ معلمی با هوش مصنوعی خواهد داشت که بینهایت صبور، بینهایت مهربان، بینهایت دانا و بینهایت خیرخواه است. این معلم در هر گام از رشد کودک کنار او خواهد بود، و او را در شکوفاکردنِ حداکثریِ استعدادهایش با نسخۀ ماشینی عشقی بیپایان همراهی میکند».
وقتی تنها در خانه نشستم و منتظر پاسخ چتجیپیتی بودم، فکر کردم که این فناوری، در پیشرفتهترین حالت، چقدر میتواند محبت ساختگی و هوش در خود داشته باشد -آیا هرگز قابلاعتماد خواهد بود یا میتواند برای مخاطب فضایی خلق کند؟ شاید آینده واقعاً دانش و عشق بینهایت یا دستکم «نسخۀ ماشینی» آنها را در خود داشته که توسط شرکتهای انحصاری و شرکتهای فناوری با سرمایهگذاری خطرپذیر ساخته شده، بازاریابی شده و به فروش رفتهاند. در همین حین، نزدیک به لبۀ صفحۀ نمایش، اعلانها چشمک زده و از صفحه خارج شدند؛ موبایلم لرزید، که نشان میداد صندوق ورودی ایمیلم پُر شده از سرخط اخبار، پشتیبانی کار، خبرهای شخصی، مطایبه، اظهار همدردی و شایعه. در آیندهای نزدیک، به نظر بینهایت چت خواهیم داشت، نه با دوستان و نه حتی غریبهها، بلکه با قفسههای سرور در آلتونا و اشبرن -دنیایی از رابطهای متنوع که منتظر نوشتن پرامپت بوده و حاضرند همان چیزهایی را بگویند که کاربران میخواهند بشنوند.
پاورقی
- 1
مدل زبانی بزرگ (large language model، یا بهاختصار L.L.M) یک مدل زبانی متشکل از یک شبکۀ عصبی با پارامترهای زیادی است که بر روی مقادیر زیادی متن بدون برچسب با استفاده از یادگیری خودنظارتی یا یادگیری نیمهنظارتی آموزش داده شده است [مترجم].
- 2
خدمت سواره یا بدون پیادهشدن یا خرید پنجرهای نوعی خدمت در کسبوکارهای گوناگون است که به مشتریان اجازه میدهد بدون تَرک خودرو محصولات موردنیاز خود را از پنجرۀ فروشگاه خریداری کنند [مترجم].
- 3
مقصود نویسنده حالتی است که کاربران بهشکل رگباری به یکدیگر پیام میفرستند یا، با ترک صفحۀ چت و پاسخندادن به طرف مقابل، چت را معلق رها میکنند [مترجم].
- 4
کارسازگان یا مزرعهٔ سرور (server farm) مجموعهای از سرورهای رایانهای است که معمولاً برای اهداف تجاری مورد استفاده قرار میگیرند. این اهداف با استفاده از رایانههایی با توان معمولی قابل دستیابی نیستند [مترجم].
- 5
Who are we talking to when we talk to these bots?
- 6
Get the Best from ChatGPT with These Golden Prompts
- 7
چرخ لنگر یا چرخ طیار یک وسیلهٔ مکانیکی گردان سنگین است که برای ذخیرهسازی انرژی دورانی به کار میرود [مترجم].
- 8
اوروبروس یا دُنبخوار نمادی باستانی از مار یا اژدهایی است که دُمش را میخورد [مترجم].
- 9
فست کژوال نوعی رستوران است که نخست در ایالاتمتحدۀ آمریکا بنیان نهاده شد. این نوع رستوران ارائهدهندۀ سرویس کامل سر میز نیست، اما متعهد به ارائۀ خوراک (غذا) با بالاترین کیفیت، تهیهشده از محصولات تازه بهصورت روزانه و در حضور مشتری میباشد [مترجم].
- 10
Delivering Happiness
- 11
شتپستینگ به پستها و محتواهای پرخاشگونه، گواژهای و ترول در رسانههای اجتماعی و تالار گفتوگو در اینترنت گفته میشود [مترجم].