به گزارش پایگاه خبری تحلیلی اندیشه قرن؛
مطالعهای علمی که در مجله Proceedings of the National Academy of Sciences (PNAS) منتشر شده نشان میدهد برخی از مدلهای زبانی پیشرفته هوش مصنوعی موفق شدهاند برای نخستینبار در تاریخ، تست تورینگ را پشت سر بگذارند و در مکالمات کوتاه از انسانها غیرقابل تشخیص شوند
هوش مصنوعی و عبور از یک معیار ۷۶ ساله
یک مطالعه جدید نشان میدهد یکی از مهمترین معیارهای سنجش هوش ماشینها که بیش از ۷ دهه مورد استفاده قرار گرفته بود، توسط هوش مصنوعی شکسته شده است.
بر اساس این تحقیق منتشرشده در مجله علمی Proceedings of the National Academy of Sciences (PNAS)، مدلهای زبانی بزرگ (LLMs) اکنون میتوانند در شرایط خاص، از نظر انسانی غیرقابل تشخیص باشند.
محققان دانشگاه کالیفرنیا سندیگو (UCSD)، کامرون جونز و بنجامین برگن، در این مطالعه نوشتند:
«نتایج نشان میدهد سیستمهای هوش مصنوعی فعلی میتوانند در تعاملات کوتاه بهطور مؤثر انسانها را تقلید کنند، و این موضوع همچنین پرسشهایی درباره کارایی تست تورینگ بهعنوان معیار هوش ایجاد میکند.»
تست تورینگ چیست؟
تست تورینگ که به «بازی تقلید» نیز معروف است، نخستینبار در سال ۱۹۵۰ توسط ریاضیدان بریتانیایی آلن تورینگ معرفی شد.
در این آزمون، اگر یک ماشین بتواند در مکالمه متنی بهگونهای رفتار کند که از انسان قابل تشخیص نباشد، گفته میشود که «هوشمند» است.
امروزه نمونهای از این مفهوم در سیستمهای امنیتی اینترنت مانند CAPTCHA دیده میشود؛ جایی که کاربران باید تصاویر یا متنهایی را تشخیص دهند تا ثابت شود انسان هستند.
نحوه انجام آزمایش جدید
در این مطالعه، چهار مدل هوش مصنوعی مورد بررسی قرار گرفتند:
- GPT-4.5 از OpenAI
- GPT-4o از OpenAI
- LLaMa 3.1-405B از Meta
- ELIZA (یکی از اولین چتباتهای تاریخ)
در مجموع ۲۸۴ شرکتکننده در آزمایش حضور داشتند. از این تعداد:
- ۱۵۸ نفر آنلاین بودند
- ۱۲۶ نفر از دانشجویان دانشگاه UCSD انتخاب شدند
هر دور آزمایش شامل یک گفتوگوی ۵ دقیقهای متنی بود که در آن یک «بازپرس» باید تشخیص میداد کدام پاسخ متعلق به انسان و کدام متعلق به هوش مصنوعی است.
در پایان، هر شرکتکننده ۸ دور آزمایش را انجام داد.
نتایج شگفتانگیز: GPT-4.5 انسانها را فریب داد
نتایج نشان داد:
- GPT-4.5 در ۷۳٪ موارد بهعنوان انسان انتخاب شد
- LLaMa در ۵۶٪ موارد موفق بود
- GPT-4o تنها ۲۱٪ موفقیت داشت
- ELIZA نیز ۲۳٪ موفق بود
این نتایج نشان میدهد مدلهای جدید هوش مصنوعی در مکالمات کوتاه میتوانند بهطور قابل توجهی شبیه انسان رفتار کنند.
مفهوم «انسانهای جعلی»
محققان هشدار دادهاند که عبور هوش مصنوعی از تست تورینگ میتواند پیامدهای اجتماعی و اقتصادی گستردهای داشته باشد.
از جمله خطرات احتمالی:
- ایجاد «انسانهای جعلی» در فضای آنلاین
- کاهش اعتماد در ارتباطات اینترنتی
- تأثیرگذاری بر افکار عمومی از طریق هویتهای مصنوعی
- جایگزینی برخی مشاغل انسانی
- کاهش تعاملات واقعی اجتماعی
به گفته پژوهشگران، این فناوری میتواند ارزش تعامل انسانی واقعی را تضعیف کند.
آیا تست تورینگ هنوز معتبر است؟
محققان تأکید میکنند که موفقیت هوش مصنوعی در این آزمون، لزوماً به معنای «هوش انسانی» نیست.
آنها میپرسند:
آیا تست تورینگ هنوز معیار مناسبی برای سنجش هوش است؟
زیرا مدلهای جدید نه لزوماً «میفهمند»، بلکه «تقلید بسیار دقیق از انسان» انجام میدهند.
پیامدهای اجتماعی و آینده هوش مصنوعی
این تحقیق نشان میدهد که مرز میان انسان و ماشین در تعاملات کوتاه در حال محو شدن است.
با این حال، پژوهشگران تأکید میکنند:
- این نتایج بیشتر مربوط به مکالمات کوتاه است
- هنوز درک عمیق و بلندمدت انسانی جایگزین نشده است
- انسانها همچنان توانایی تشخیص و تمایز خود را دارند
عبور هوش مصنوعی از تست تورینگ یک نقطه عطف تاریخی محسوب میشود. این دستاورد نشان میدهد که مدلهای زبانی پیشرفته میتوانند در تعاملات کوتاه بهگونهای رفتار کنند که از انسان قابل تشخیص نباشند.
با این حال، این پیشرفت در کنار مزایا، نگرانیهای جدی درباره اعتماد، امنیت آنلاین و آینده تعاملات انسانی ایجاد کرده است.
پایان/*
.