هوش مصنوعی متن ۵ هزار ساله را رمزگشایی کرد
یک تکنولوژی جدید حالا در خوانش زبانهای قدیمی به کمک باستانشناسان آمده و الواح خط میخی را به زبان انگلیسی ترجمه میکند.
خط میخی یکی از اولین سیستمهای نوشتاری در تاریخ بشریت است و باستانشناسان بر این باورند که استفاده از خط میخی به ۳۴۰۰ سال قبل از میلاد مسیح یعنی حدود ۵۴۰۰ سال پیش برمیگردد. این خط برای مدتی طولانی یعنی بیش از ۳۰۰۰ سال نیز دوام داشته و مورد استفاده بوده است.
یک تکنولوژی جدید حالا در خوانش زبانهای قدیمی به کمک باستانشناسان آمده و الواح خط میخی را به زبان انگلیسی ترجمه میکند.
خط میخی یکی از اولین سیستمهای نوشتاری در تاریخ بشریت است و باستانشناسان بر این باورند که استفاده از خط میخی به ۳۴۰۰ سال قبل از میلاد مسیح یعنی حدود ۵۴۰۰ سال پیش برمیگردد. این خط برای مدتی طولانی یعنی بیش از ۳۰۰۰ سال نیز دوام داشته و مورد استفاده بوده.
در طول سالها محققان هزاران متن نوشته شده به خط میخی را در زبانهای سومری و آکدی یافتهاند و حالا شبکهای را آموزش دادهاند که میتواند بی دردسر و راحت، این متون را به زبان انگلیسی برگرداند.
زبان قدیمی و رمزآلود
زبان آکدی یکی از اولین زبانهای سامی شناخته شده است. خانواده زبانهای سامی شامل زبانهای مدرنی مثل عربی و عبری نیز میشود.
این زبان در بینالنهرین باستان، معمولا در امپراطوری آکدی که در منطقهای که امروزه بخشی از عراق و شمال شرقی سوریه را تشکیل میدهد، مورد استفاده قرار میگرفت. نام امپراطوری آکدی از نام شهر باستانی آکد که یکی از مراکز مهم تمدن آکدی است، گرفته شده.
از زبان آکدی در طیف وسیعی از اهداف، از نوشتن اسناد اداری و حقوقی گرفته تا متون ادبی و علمی مورد استفاده قرار میگرفت. این زبان با بهرهگیری از خط میخی برروی لوحهای گلی نوشته میشد و رمزگشایی این لوحها در قرن نوزدهم، دریچه جدیدی را به روی باستانشناسان گشود و بینش ارزشمندی را در رابطه با تاریخ، فرهنگ و دستاوردهای علمی آن زمان در اختیار محققان قرار داد.
از سوی دیگر، زبان سومری، یکی از قدیمیترین زبانهای شناخته شده در دنیاست و به عنوان یک زبان منزوی شناخته میشود؛ یعنی هیچ زبان خویشاوند شناخته شدهای ندارد.
این زبان در سومر باستان، بخشی در منطقه جنوبی عراق امروزی مورد استفاده قرار میگرفت و سومریها یکی از اولین تمدنهای جهان بودند که در حدود سال ۴۵۰۰ سال قبل از میلاد مسیح به وجود آمده و جامعه آنها تا حدود سال ۲۰۰۰ قبل از میلاد مسیح در اوج شکوفایی بود.
هر دوی این زبانها، همراه با چندین زبان دیگر، از سیستم نوشتاری خط میخی بهره میبردند، ولی در طول سالها و قرنها، ترجمه خط میخی چالش بسیار بزرگی برای محققان به شمار میرفت.
کتیبه بیستون، سرآغاز ماجرای رمزگشایی
رمزگشایی خط میخی به شکل کامل بیش از ۲۰۰سال و در بین سالهای ۱۸۰۲ تا ۲۰۲۲ به طول انجامید. ماجرای این رمزگشایی از کتیبه بیستون آغاز شد که در ایران کشف شده و به دوران پادشاهی داریوش اول در سال ۵۵۰ قبل از میلاد مسیح برمیگردد.
یک کتیبه چند زبانه که شامل سه نوع خط، یعنی خط فارسی باستان، ایلامی و خط میخی اکدی بود. در ابتدا خط فارسی باستان رمزگشایی شد و سرنخهایی برای رمزگشایی دو خط دیگر به دست آمد.
محققان تدریجا بر روی رمزگشایی و فهم خط میخی تلاش کردند و بعد از زحمات فراوان، به درک خوبی از خط میخی رسیدند. البته این برای محققان کافی نبود و آنها میخواستند تا ترجمه خط میخی را کاملا در دسترس قرار دهند؛ در نتیجه به سراغ هوش مصنوعی رفتند.
رویارویی خط میخی و هوش مصنوعی
در سالهای اخیر ترجمه زبانها مسیری طولانی را طی کرده و هوش مصنوعی سرعت زیادی به این روند بخشیده است. ترجمههای هوش مصنوعی با دستاوردهای چشمگیرشان به نقطه عطف بزرگی نزدیک شدهاند و دریک بررسی اخیر شای گوردین و همکارانش از دانشگاه اریل، یک مدل هوش مصنوعی را پرورش دادهاند که میتواند به صورت اتوماتیک متون نوشته شده به زبان آکدی و با خط میخی را به زبان انگلیسی ترجمه کند.
در حال حاضر این گزینه تنها برای زبان آکدی در دسترس است (و برای زبانهای دیگری که نوشتارشان به خط میخی بود قابل استفاده نیست)، ولی همین هم پیشرفت چشمگیر و قابل توجهی به شمار میرود.
این در حقیقت ادامه مطالعه قبلی گوردین و همکارانش است که در آن به چگونگی استفاده از هوش مصنوعی برای ترجمه خط میخی پرداخته بودند. این بار آنها دو نسخه از این مدل را آموزش دادند. نسخه اول زبان آکدی را از خط میخی به خط لاین (نویسه گردانی) ترجمه میکند و نسخه دوم از نمایشهای یونیکد نشانههای خط میخی ترجمه میشود.
نسخه اول نتایج بهتری را در بررسیها به دست آورد و نمره ۳۷.۴۷ را در رنکینگ بهترین ارزیابی دوزبانه ۴ (BLEU ۴) کسب کرد.
نمره BLEU، معیاری است که برای ارزیابی کیفیت ترجمههای تولید شده توسط ماشینها مورد استفاده قرار میگیرد و به اندازهگیری این شاخص میپردازد که ترجمه ماشینی یک متن چقدر با مجموعهای از ترجمههای مرجع انجام شده توسط انسانها مطابقت دارد.
امتیاز از صفر تا یک (یا صفر تا ۱۰۰) متغیر است و هر چقدر نمره بالاتر باشد، نشان دهنده ترجمه بهتر است. حتی بهترین مترجمهای انسانی باتجربه هم نمره ۱۰۰ را دریافت نمیکنند و برای زبانی مثل خط میخی، نمره ۳۷ آنقدر خوب است که یک ترجمه مناسب تلقی شود.
در اکثر موارد، ترجمههای انجام شده، به عنوان اولین ترجمه از متن بسیار مفید خواهند بود و محققان بر این باورند که هوشمصنوعی میتواند توسط محققان یا دانشجویانی که میخواهند با جزئیات بیشتری درباره این زبانها مطالعه کنند، مورد استفاده قرار بگیرد.
به علاوه، با فراگیرتر شدن این فناوری، تصور استفاده از آن در کلاسهای درس، موزهها و حتی تجربیات تاریخی تعاملی دور از ذهن نخواهد بود و این، این امکان را برایمان فراهم میکند تا به شکل بیسابقهای با گذشتهها درگیر شویم.
این یک نگاه اجمالی و البته وسوسه انگیز از پتانسیلی است که در تقاطع تاریخ و فناوری نهفته است و ترکیبی است که میتواند درک ما از اینکه که هستیم و از کجا آمدهایم را دوباره تعریف کند.