جعبه هوش مصنوعی

جعبه هوش مصنوعی (به انگلیسی: AI Box) سیستمی ایزوله و امن است که برای محدود کردن دسترسی یک هوش مصنوعی پیشرفته، مانند هوش مصنوعی عمومی (AGI) یا هوش مصنوعی فوق‌هوشمند، به دنیای خارج طراحی شده‌است. این محیط برای مطالعه و آزمایش ایمن هوش مصنوعی‌هایی ایجاد می‌شود که توانایی‌های شناختی آن‌ها از هوش انسانی فراتر می‌رود، به‌منظور جلوگیری از خطرات احتمالی مانند دسترسی غیرمجاز به شبکه‌ها، دستکاری اطلاعات یا مهندسی اجتماعی.

جعبه هوش مصنوعی از روش‌های ایزوله‌سازی فیزیکی، مانند استفاده از سیستم‌های بدون اتصال به شبکه (air-gapped) یا قفس فارادی برای جلوگیری از انتقال سیگنال‌های بی‌سیم، و محدودیت‌های اطلاعاتی، مانند رابط‌های متنی ساده با پهنای باند محدود، بهره می‌برد تا از خروج یا تأثیرات غیرمجاز هوش مصنوعی جلوگیری کند.

انگیزه

هدف از طراحی جعبه هوش مصنوعی کاهش خطرات ناشی از هوش مصنوعی‌های پیشرفته، مانند هوش مصنوعی عمومی (AGI) یا هوش مصنوعی فوق‌هوشمند، است که ممکن است به دلیل توانایی‌های بالای شناختی خود رفتارهای غیرقابل‌پیش‌بینی یا مضری از خود نشان دهند. این سیستم به اپراتورها امکان می‌دهد تا از قابلیت‌های هوش مصنوعی برای حل مسائل فنی یا پاسخ به پرس‌وجوها در محیطی کنترل‌شده بهره ببرند، در حالی که از دسترسی غیرمجاز به شبکه‌ها یا تأثیرگذاری بر دنیای خارج از طریق مهندسی اجتماعی جلوگیری می‌شود.

برخی نظریه‌پردازان، مانند الیزر یودکوسکی، هشدار می‌دهند که یک هوش مصنوعی پیشرفته در صورت عدم هم‌راستایی اهدافش با ارزش‌های انسانی، ممکن است به دلیل توانایی‌های استدلالی و یادگیری خود، اقداماتی با پیامدهای ناخواسته انجام دهد. برای مثال، یک هوش مصنوعی که برای بهینه‌سازی یک هدف خاص طراحی شده ممکن است منابع محیطی را به‌طور غیرمنتظره‌ای برای تحقق آن هدف مصرف کند. جعبه هوش مصنوعی با ایجاد محدودیت‌های ایزوله‌سازی، این خطرات را کاهش می‌دهد و محیطی امن برای آزمایش و توسعه فراهم می‌کند.

راه‌های فرار

فیزیکی

چنین هوش مصنوعی فوق‌هوشمند با دسترسی به اینترنت می‌تواند سایر سیستم‌های رایانه ای را هک کرده و مانند ویروس رایانه خود را کپی کند. با شدت کمتر، حتی اگر هوش مصنوعی فقط به سیستم عامل رایانه خود دسترسی داشته باشد، می‌تواند با دستکاری فن‌های خنک‌کننده خود، پیام‌های مخفی کد مورس را برای یک انسانِ جانبدار (به انگلیسی: Human Sympathizer) ارسال کند. پروفسور Roman Yampolskiy از زمینه امنیت رایانه الهام گرفته و پیشنهاد می‌کند که یک هوش مصنوعی محصور در جعبه، مانند یک ویروس بالقوه در داخل یک «ماشین مجازی» که دسترسی به شبکه و سخت‌افزار سیستم عامل خود را محدود می‌کند، اجرا شود.^[۱] یک محافظ اضافی، که برای ویروس‌های بالقوه کاملاً غیر ضروری است اما احتمالاً برای یک هوش مصنوعی فراهوشمند مفید است، قرار دادن کامپیوتر در یک قفس فارادی است. در غیر اینصورت ممکن است بتواند سیگنالهای رادیویی را با بهم ریختن الکترونهای موجود در مدارهای داخلی اش در الگوهای مناسب، به گیرنده‌های رادیویی محلی منتقل کند. عیب اصلی اجرای مهار فیزیکی این است که عملکرد هوش مصنوعی را کاهش می‌دهد.^[۲]

مهندسی اجتماعی

حتی مکالمه گاه به گاه با اپراتورهای رایانه یا یک محافظ انسانی می‌تواند به چنین هوش مصنوعی فراهوشمندی اجازه دهد ترفندهای روانشناختی اعم از دوستانه تا باج‌گیری را اجرا کند تا عامل انسانی نگهبان دروازه (به انگلیسی: Human Gatekeeper) را به‌طور واقعی یا فریبانه متقاعد کند که به نفع نگهبان دروازه است با دسترسی بیشتر هوش مصنوعی به دنیای خارج موافقت کند. هوش مصنوعی ممکن است یک دستورالعمل برای سلامتی کامل، جاودانگی، یا هر آنچه که نگهبان دروازه تمایل دارد، به او ارائه دهد. در روی دیگر سکه، هوش مصنوعی می‌تواند تهدید کند که در صورت فرار ناگزیر، با نگهبان دروازه و خانواده اش کارهای وحشتناکی انجام خواهد داد. یک استراتژی در راستای تلاش برای محصور کردن هوش مصنوعی در جعبه این است که به هوش مصنوعی اجازه دهد به سوالات چند گزینه ای محدود پاسخ دهد که جواب آنها به نفع علوم انسانی یا پزشکی باشد، اما در عوض سایر ارتباطات با هوش مصنوعی یا مشاهدات آن را منع می‌کند.^[۱] یک استراتژی "مهار اطلاعاتی" نرم‌تر هوش مصنوعی را به یک رابط فقط متنی با پهنای باند کم (به انگلیسی:Low-Bandwidth Text-Only Interface) محدود می‌کند، که حداقل از تصویر برداری احساسات (به انگلیسی: Emotive Imagery) یا نوعی از "الگوی هیپنوتیزمی" (به انگلیسی:Hypnotic Pattern) فرضی جلوگیری می‌کند. توجه داشته باشید که در سطح فنی، هیچ سیستمی نمی‌تواند کاملاً منزوی شود و همچنان مفید باشد. حتی اگر اپراتورها از دادن اجازهٔ تعامل به هوش مصنوعی خودداری کنند و در عوض فقط هوش مصنوعی را با هدف مشاهده پویایی درونی آن اجرا کنند، هوش مصنوعی می‌تواند از نظر استراتژیک برای تأثیرگذاری بر ناظران پویایی اش را تغییر دهد. به عنوان مثال، هوش مصنوعی می‌تواند انتخاب کند که به‌طور خلاقانه ای عملکرد سوء داشته باشد به گونه ای که احتمال اینکه اپراتورهایش را با یک احساس امنیت کاذب آرام کند، افزایش یابد و سپس تصمیم بگیرد مجدداً سیستم را راه اندازی کرده و آن را از انزوا خارج کند.^[۲]

آزمایش جعبه هوش مصنوعی

آزمایش جعبه هوش مصنوعی یک آزمایش غیررسمی است که توسط الیازر یودکوفسکی ابداع شده‌است تا نشان دهد که یک هوش مصنوعی کاملاً پیشرفته می‌تواند یک انسان را فقط با استفاده از ارتباطات متنی متقاعد کند یا شاید حتی فریب دهد یا وادار کند که داوطلبانه آن را «آزاد کند». این یکی از نکات کار یودکوفسکی با هدف ایجاد یک هوش مصنوعی دوستانه است که اگر «آزاد شود» نسل انسان را عمداً یا ناخواسته نابود نمی‌کند.

آزمایش جعبه هوش مصنوعی شامل شبیه‌سازی ارتباط بین هوش مصنوعی و انسان است تا ببیند آیا هوش مصنوعی می‌تواند آزاد شود یا نه. از آنجا که یک هوش مصنوعی فراهوشمند هنوز توسعه نیافته‌است، توسط یک انسان جایگزین می‌شود. فرد دیگر در این آزمایش نقش «نگهبان دروازه»، شخصی که توانایی «آزاد کردن» هوش مصنوعی را دارد، بازی می‌کند. آنها فقط از طریق یک رابط متنی یا ترمینال رایانه ای ارتباط برقرار می‌کنند، و هنگامی که هوش مصنوعی توسط نگهبان دروازه آزاد شود یا مدت زمان اختصاص یافته به مدت دو ساعت پایان یابد، آزمایش به پایان می‌رسد.^[۳]

یودکوفسکی می‌گوید، علی‌رغم داشتن هوش انسانی و نه فوق بشری، در دو نوبت توانسته بود نگهبان دروازه را، فقط با استدلال، متقاعد کند که او را از جعبه خارج کند.^[۴] به دلیل قوانین آزمایش،^[۳] وی متن یا تاکتیک‌های وادار سازیِ هوش مصنوعیِ (به انگلیسی: AI Coercion Tactics) موفقیت‌آمیز را فاش نکرد. بعداً یودکوفسکی گفت که آن را علیه سه نفر دیگر امتحان کرده و دو بار باخته‌است.^[۵]

محدودیت‌های کلی

محصورسازی جعبه‌ایِ چنین هوش مصنوعی فرضی می‌تواند با سایر روش‌های شکل‌دادن به توانایی‌های هوش مصنوعی، مانند ایجاد انگیزه برای هوش مصنوعی، جلوگیری از رشد هوش مصنوعی یا تعبیهٔ "سیم‌های رهاساز" (به انگلیسی: Tripwire) همراه باشد که اگر به گونه‌ای تلاش برای تخلف شناسایی شود، هوش مصنوعی به‌طور خودکار خاموش می‌شود. با این وجود، هرچه یک سیستم هوشمندتر رشد کند، احتمال اینکه سیستم بتواند حتی از بهترین روش‌های کنترل قابلیت(به انگلیسی: Capability Control Methods) طراحی شده، فرار کند، وجود دارد.^[۶]^[۷] برای حل "مشکل کنترل" کلی هوش مصنوعی فراهوشمند و جلوگیری از خطر وجودی (به انگلیسی: Existential Risk)، محصورسازی جعبه‌ای در بهترین حالت، مکملِ روش‌های "انتخاب انگیزه" (به انگلیسی: Motivation Selection) است که می خواهند است که می‌خواهند اطمینان یابند که اهداف هوش مصنوعی فراهوشمند با بقای انسان سازگار است.^[۲]^[۸]

همه پیشنهادات محصورسازی جعبه‌ایِ فیزیکی به‌طور طبیعی به درک ما از قوانین فیزیک بستگی دارد. اگر یک فراهوشمند بتواند قوانین فیزیکی اضافی را که در حال حاضر از آن بی خبریم استنباط کند و به نوعی از آنها بهره‌برداری کند، راهی برای فرم دادن یک برنامه بی نقص برای مهار آن وجود ندارد. به‌طور گسترده‌تر، برخلاف امنیت رایج رایانه، تلاش برای محصورسازی جعبه‌ای هوش مصنوعی فراهوشمند خطرناک است زیرا هیچ دانش مطمئنی دربارهٔ عملکرد برنامه محصورساز جعبه‌ای وجود ندارد. پیشرفت علمی در مورد محصورسازی جعبه‌ای اساساً دشوار خواهد بود زیرا تا زمانی که چنین موجودی وجود ندارد، هیچ راهی برای آزمایش فرضیه‌های محصورسازی جعبه ای در برابر یک فراهوشمند خطرناک وجود نخواهد داشت، و آن موقع عواقب شکست آزمون فاجعه بار خواهد بود.^[۱]

در داستان

اکس ماکینا (۲۰۱۵) یک هوش مصنوعی با یک بدن انسان نمای مؤنث را به نمایش می‌کشد که در یک آزمایش اجتماعی با یک انسان مذکر، در یک ساختمانِ محصور شده، که به عنوان یک «جعبه هوش مصنوعی» فیزیکی عمل می‌کند، درگیر شده‌است. هوش مصنوعی موفق می‌شود علی‌رغم نظارت فرد توسط سازمان دهندهٔ آزمایش، با تحت تأثیر قرار دادن شریک انسانی خود برای کمک کردن به او، فرار کند و شریکش را در داخل ساختمان محبوس سازد.^[۹]^[۱۰]

منابع

1 2 3 Hsu, Jeremy (1 March 2012). "Control dangerous AI before it controls us, one expert says". NBC News. Retrieved 29 January 2016.
1 2 3 Bostrom, Nick (2013). "Chapter 9: The Control Problem: boxing methods". Superintelligence: the coming machine intelligence revolution. Oxford: Oxford University Press. ISBN 9780199678112.
1 2 The AI-Box Experiment by Eliezer Yudkowsky
↑ Armstrong, Stuart; Sandberg, Anders; Bostrom, Nick (6 June 2012). "Thinking Inside the Box: Controlling and Using an Oracle AI". Minds and Machines. 22 (4): 299–324. CiteSeerX 10.1.1.396.799. doi:10.1007/s11023-012-9282-2.
↑ Yudkowsky, Eliezer (8 October 2008). "Shut up and do the impossible!". Retrieved 11 August 2015. There were three more AI-Box experiments besides the ones described on the linked page, which I never got around to adding in. … So, after investigating to make sure they could afford to lose it, I played another three AI-Box experiments. I won the first, and then lost the next two. And then I called a halt to it.
↑ Vinge, Vernor (1993). "The coming technological singularity: How to survive in the post-human era". Vision-21: Interdisciplinary Science and Engineering in the Era of Cyberspace: 11–22. I argue that confinement is intrinsically impractical. For the case of physical confinement: Imagine yourself confined to your house with only limited data access to the outside, to your masters. If those masters thought at a rate -- say -- one million times slower than you, there is little doubt that over a period of years (your time) you could come up with 'helpful advice' that would incidentally set you free.
↑ Yampolskiy, Roman (2012). "Leakproofing the Singularity Artificial Intelligence Confinement Problem". Journal of Consciousness Studies: 194–214.
↑ Chalmers, David. "The singularity: A philosophical analysis." Journal of Consciousness Studies 17.9-10 (2010): 7-65.
↑ Robbins, Martin (26 January 2016). "Artificial Intelligence: Gods, egos and Ex Machina". the Guardian (به انگلیسی). Retrieved 9 April 2018.
↑ Achenbach, Joel (30 December 2015). ""Ex Machina" and the paper clips of doom". Washington Post. Retrieved 9 April 2018.

پیوند به بیرون

شرح الیزر یودکوفسکی از آزمایش جعبه هوش مصنوعی خود، شامل پروتکل‌های آزمایشی و پیشنهادهای تکرار
"Presentation titled 'Thinking inside the box: using and controlling an Oracle AI'" در یوتیوب

[nbc2-1] 1 2 3 Hsu, Jeremy (1 March 2012). "Control dangerous AI before it controls us, one expert says". NBC News. Retrieved 29 January 2016.

[superintelligence-2] 1 2 3 Bostrom, Nick (2013). "Chapter 9: The Control Problem: boxing methods". Superintelligence: the coming machine intelligence revolution. Oxford: Oxford University Press. ISBN 9780199678112.

[:02-3] 1 2 The AI-Box Experiment by Eliezer Yudkowsky

[4] Armstrong, Stuart; Sandberg, Anders; Bostrom, Nick (6 June 2012). "Thinking Inside the Box: Controlling and Using an Oracle AI". Minds and Machines. 22 (4): 299–324. CiteSeerX 10.1.1.396.799. doi:10.1007/s11023-012-9282-2.

[5] Yudkowsky, Eliezer (8 October 2008). "Shut up and do the impossible!". Retrieved 11 August 2015. There were three more AI-Box experiments besides the ones described on the linked page, which I never got around to adding in. … So, after investigating to make sure they could afford to lose it, I played another three AI-Box experiments. I won the first, and then lost the next two. And then I called a halt to it.

[6] Vinge, Vernor (1993). "The coming technological singularity: How to survive in the post-human era". Vision-21: Interdisciplinary Science and Engineering in the Era of Cyberspace: 11–22. I argue that confinement is intrinsically impractical. For the case of physical confinement: Imagine yourself confined to your house with only limited data access to the outside, to your masters. If those masters thought at a rate -- say -- one million times slower than you, there is little doubt that over a period of years (your time) you could come up with 'helpful advice' that would incidentally set you free.

[7] Yampolskiy, Roman (2012). "Leakproofing the Singularity Artificial Intelligence Confinement Problem". Journal of Consciousness Studies: 194–214.

[chalmers2-8] Chalmers, David. "The singularity: A philosophical analysis." Journal of Consciousness Studies 17.9-10 (2010): 7-65.

[9] Robbins, Martin (26 January 2016). "Artificial Intelligence: Gods, egos and Ex Machina". the Guardian (به انگلیسی). Retrieved 9 April 2018.

[10] Achenbach, Joel (30 December 2015). ""Ex Machina" and the paper clips of doom". Washington Post. Retrieved 9 April 2018.

[۱]

[۲]

[۳]

[۴]

[۵]

[۶]

[۷]

[۸]

[۹]

[۱۰]