12:52 - 2026/06/15

هوش مصنوعی برای اولین بار تست تورینگ را پشت سر گذاشت | مدل‌های زبانی تا ۷۳٪ انسان‌ها را فریب دادند

مطالعه‌ای جدید نشان می‌دهد مدل‌های هوش مصنوعی مانند GPT-4.5 توانسته‌اند در تست تورینگ انسان‌ها را تا ۷۳٪ مواقع فریب دهند و مرز میان انسان و ماشین را مبهم کنند.

هوش مصنوعی برای اولین بار تست تورینگ را پشت سر گذاشت | مدل‌های زبانی تا ۷۳٪ انسان‌ها را فریب دادند

به گزارش پایگاه خبری تحلیلی اندیشه قرن؛

مطالعه‌ای علمی که در مجله Proceedings of the National Academy of Sciences (PNAS) منتشر شده نشان می‌دهد برخی از مدل‌های زبانی پیشرفته هوش مصنوعی موفق شده‌اند برای نخستین‌بار در تاریخ، تست تورینگ را پشت سر بگذارند و در مکالمات کوتاه از انسان‌ها غیرقابل تشخیص شوند

هوش مصنوعی و عبور از یک معیار ۷۶ ساله

یک مطالعه جدید نشان می‌دهد یکی از مهم‌ترین معیارهای سنجش هوش ماشین‌ها که بیش از ۷ دهه مورد استفاده قرار گرفته بود، توسط هوش مصنوعی شکسته شده است.

بر اساس این تحقیق منتشرشده در مجله علمی Proceedings of the National Academy of Sciences (PNAS)، مدل‌های زبانی بزرگ (LLMs) اکنون می‌توانند در شرایط خاص، از نظر انسانی غیرقابل تشخیص باشند.

محققان دانشگاه کالیفرنیا سن‌دیگو (UCSD)، کامرون جونز و بنجامین برگن، در این مطالعه نوشتند:

«نتایج نشان می‌دهد سیستم‌های هوش مصنوعی فعلی می‌توانند در تعاملات کوتاه به‌طور مؤثر انسان‌ها را تقلید کنند، و این موضوع همچنین پرسش‌هایی درباره کارایی تست تورینگ به‌عنوان معیار هوش ایجاد می‌کند.»

تست تورینگ چیست؟

تست تورینگ که به «بازی تقلید» نیز معروف است، نخستین‌بار در سال ۱۹۵۰ توسط ریاضیدان بریتانیایی آلن تورینگ معرفی شد.

در این آزمون، اگر یک ماشین بتواند در مکالمه متنی به‌گونه‌ای رفتار کند که از انسان قابل تشخیص نباشد، گفته می‌شود که «هوشمند» است.

امروزه نمونه‌ای از این مفهوم در سیستم‌های امنیتی اینترنت مانند CAPTCHA دیده می‌شود؛ جایی که کاربران باید تصاویر یا متن‌هایی را تشخیص دهند تا ثابت شود انسان هستند.

نحوه انجام آزمایش جدید

در این مطالعه، چهار مدل هوش مصنوعی مورد بررسی قرار گرفتند:

  • GPT-4.5 از OpenAI
  • GPT-4o از OpenAI
  • LLaMa 3.1-405B از Meta
  • ELIZA (یکی از اولین چت‌بات‌های تاریخ)

در مجموع ۲۸۴ شرکت‌کننده در آزمایش حضور داشتند. از این تعداد:

  • ۱۵۸ نفر آنلاین بودند
  • ۱۲۶ نفر از دانشجویان دانشگاه UCSD انتخاب شدند

هر دور آزمایش شامل یک گفت‌وگوی ۵ دقیقه‌ای متنی بود که در آن یک «بازپرس» باید تشخیص می‌داد کدام پاسخ متعلق به انسان و کدام متعلق به هوش مصنوعی است.

در پایان، هر شرکت‌کننده ۸ دور آزمایش را انجام داد.

نتایج شگفت‌انگیز: GPT-4.5 انسان‌ها را فریب داد

نتایج نشان داد:

  • GPT-4.5 در ۷۳٪ موارد به‌عنوان انسان انتخاب شد
  • LLaMa در ۵۶٪ موارد موفق بود
  • GPT-4o تنها ۲۱٪ موفقیت داشت
  • ELIZA نیز ۲۳٪ موفق بود

این نتایج نشان می‌دهد مدل‌های جدید هوش مصنوعی در مکالمات کوتاه می‌توانند به‌طور قابل توجهی شبیه انسان رفتار کنند.

مفهوم «انسان‌های جعلی»

محققان هشدار داده‌اند که عبور هوش مصنوعی از تست تورینگ می‌تواند پیامدهای اجتماعی و اقتصادی گسترده‌ای داشته باشد.

از جمله خطرات احتمالی:

  • ایجاد «انسان‌های جعلی» در فضای آنلاین
  • کاهش اعتماد در ارتباطات اینترنتی
  • تأثیرگذاری بر افکار عمومی از طریق هویت‌های مصنوعی
  • جایگزینی برخی مشاغل انسانی
  • کاهش تعاملات واقعی اجتماعی

به گفته پژوهشگران، این فناوری می‌تواند ارزش تعامل انسانی واقعی را تضعیف کند.

آیا تست تورینگ هنوز معتبر است؟

محققان تأکید می‌کنند که موفقیت هوش مصنوعی در این آزمون، لزوماً به معنای «هوش انسانی» نیست.

آن‌ها می‌پرسند:

آیا تست تورینگ هنوز معیار مناسبی برای سنجش هوش است؟

زیرا مدل‌های جدید نه لزوماً «می‌فهمند»، بلکه «تقلید بسیار دقیق از انسان» انجام می‌دهند.

پیامدهای اجتماعی و آینده هوش مصنوعی

این تحقیق نشان می‌دهد که مرز میان انسان و ماشین در تعاملات کوتاه در حال محو شدن است.

با این حال، پژوهشگران تأکید می‌کنند:

  • این نتایج بیشتر مربوط به مکالمات کوتاه است
  • هنوز درک عمیق و بلندمدت انسانی جایگزین نشده است
  • انسان‌ها همچنان توانایی تشخیص و تمایز خود را دارند

عبور هوش مصنوعی از تست تورینگ یک نقطه عطف تاریخی محسوب می‌شود. این دستاورد نشان می‌دهد که مدل‌های زبانی پیشرفته می‌توانند در تعاملات کوتاه به‌گونه‌ای رفتار کنند که از انسان قابل تشخیص نباشند.

با این حال، این پیشرفت در کنار مزایا، نگرانی‌های جدی درباره اعتماد، امنیت آنلاین و آینده تعاملات انسانی ایجاد کرده است.

پایان/*

.

 

مطالب مرتبط

برنجستان