خبرنامه هوش‌مصنوعی دومان

توسعه ربات‌های انسان‌نما

🗓️ تاریخ انتشار: ۲۷ آوریل ۲۰۲۵ ✍️ نویسنده: Pouya Esmaeili

ربات‌های انسان‌نما (Humanoid Robots)، ربات‌های دو پا (bipedal) با آناتومی و سایز مشابه انسان‌ هستند. با ترند شدن هوش‌مصنوعی در چند سال اخیر، توسعه چنین ربات‌هایی نیز بیشتر از گذشته پیگیری شده و شاهد معرفی نمونه‌های بسیاری از این ربات‌ها هستیم. در این مقاله وضعیت فعلی و روش‌های توسعه این دسته از ربات‌ها را بررسی خواهیم. قابل ذکر است که بسیاری از مفاهیم ارائه شده در این مقاله محدود به ربات‌های انسان‌نما نبوده و به صورت کلی در حوزه رباتیک مورد استفاده قرار می‌گیرند.

ربات‌های انسان‌نما به دلیل داشتن آناتومی مشابه بشر برای محیط‌های مخصوص انسان نظیر انبار، خط تولید کارخانه، دفتر کار، بیمارستان و حتی منزل مناسب بوده و می‌توانند در کنار انسان فعالیت کنند. بنابراین انتظار می‌رود طی سال‌های پیش‌رو در کارخانه و حتی منزل برای انجام کارهای تکراری، طاقت‌فرسا و خطرناک موردبهره‌برداری قرار بگیرند. این موضوع می‌تواند مشکل کمبود نیروی کار در کشورهایی که با ریسک پیری جمعیت روبه‌رو هستند را رفع کند. ربات‌های انسان‌نما می‌توانند در سفرهای فضایی در محیط‌های خطرناک کار انسان را انجام داده یا در منزل از سالمندان مراقبت کنند. یکی از رایج‌ترین روش‌های توسعه ربات، آموزش آن در محیط سیمولاتور (شبیه‌ساز) و انتقال آن به جسم فیزیکی است که در ادامه معرفی می‌شود.

ربات NEO در حال جارو کشیدن خانه

ربات NEO در حال جارو کشیدن خانه

آموزش ربات در سیمولاتور

در این روش، ابتدا نرم‌افزار ربات در محیط سیمولاتور با استفاده از تکنیک یادگیری تقویتی (Reinforcement learning) آموزش داده شده و سپس در قالب جسم فیزیکی به محیط واقعی منتقل می‌شود (Sim-to-Real Transfer). محیط سیمولاتور باید بتواند فیزیک دنیای واقعی را به خوبی و با جزئیات شبیه‌سازی کرده تا ربات آماده فعالیت در محیط واقعی باشد. به عنوان مثال در محیط‌ سیمولاتور ربات در عبور از ناهمواری‌ها و برخورد با موانع مختلف آموزش داده می‌شود تا برای شرایط گوناگون در محیط واقعی آماده شود. این تکنیک نیاز به دیتاست را کمتر، آموزش را سریع‌تر و در نتیجه هزینه را کاهش می‌دهد. Isaac Lab یکی از این شبیه‌سازهاست که مخصوص آموزش ربات توسط NVIDIA توسعه داده شده است (برای آشنایی با این سیمولاتور اینجا را مشاهده کنید).

همان‌طور که گفته شد پس از آموزش، مدل به بدن فیزیکی ربات منتقل می‌شود، این فرآیند Sim-to-Real Transfer یا Sim2Real Transfer نامیده می‌شود که با چالش‌های مختلفی همراه است. به عنوان مثال ممکن است محیط واقعی جزئیاتی را داشته باشد که ربات در محیط شبیه‌سازی شده برای آن آموزش ندیده و یا نویز روی سنسورهای ربات تاثیر گذاشته و دقت آن را مختل کند. این چالش همان مشکل قدیمی Underfitting/Overfitting در یادگیری ماشین است. روش‌های مختلف Generalization برای حل چالش Sim2Real Transfer توسعه داده شده است. به عنوان نمونه می‌توانید اینجا و اینجا را بخوانید.

یادگیری تقویتی در رباتیک

در روش یادگیری تقویتی یا به طور خلاصه RL، ربات براساس اکشن (Action) خود در محیط پاداش (Reward) یا تنبیه (Penalty) دریافت می‌کند. این اکشن برای ربات‌های انسان‌نما می‌تواند راه‌رفتن در محیط‌های مختلف، رد کردن موانع و یا برداشتن اشیا باشد. در پروسه یادگیری ربات تلاش می‌کند که پاداش را حداکثر و تنبیه را حداقل کند. در انتها یادگیری تقویتی به ربات کمک می‌کند رفتار بهینه را در میان پیچیدگی تسک‌ها و تنوع بسیار بالای محیط یاد بگیرد، به همین جهت یکی از روش‌های آموزش موثر در رباتیک است.

دیاگرام یادگیری تقویتی

دیاگرام یادگیری تقویتی

هوش‌مصنوعی مولد در رباتیک

هوش‌مصنوعی مولد (Generative AI) یکی از ابزارهایی است که توسعه رباتیک را در سال‌های اخیر سرعت بخشیده. معرفی مدل‌های زبانی Multimodal یا مدل‌های VLM که توانایی تجزیه و تحلیل انواع فرمت دیتا نظیر متن و تصویر را دارند، ارتباط انسان با ربات و ارتباط ربات با محیط را تسهیل کرده است. با استفاده از مدل‌های زبانی درک دستورهای پیچیده زبان انسان برای ربات ساده‌تر است. دیگر نیازی به تعریف چارچوب مشخص برای دستور دادن به ربات نیست. در نظر بگیرید یک تسک مشخص توسط انسان‌های مختلف می‌تواند با ادبیات مختلفی بیان شود. از طرفی دیگر محدودیت زبان (انگلیسی، فرانسوی، فارسی و …) نیز وجود نخواهد داشت. ربات نیز با کمک همین مدل‌های زبانی پاسخ مناسب کاربر را تولید کرده و با کمک Text-To-Speech (TTS) آن را به صوت تبدیل می‌کند. مدل‌های VLM نیز امکان تجزیه و تحلیل محیط پیرامون ربات را فراهم می‌سازند. به عنوان نمونه اگر کاربر دستور جابه‌جا کردن لیوان را به ربات بدهد، مدل VLM می‌تواند با دریافت این دستور تصاویر محیط پیرامونی را بررسی کرده تا مکان لیوان را پیدا کند.

هوش‌مصنوعی مولد فقط محدود به تشخیص متن و تصویر نیست، بلکه ربات می‌تواند از قابلیت‌های مدل‌های Reasoning در موقعیت‌هایی که نیاز به استنتاج دارد بهره بگیرد. هوش‌مصنوعی مولد برای تولید دیتاست آموزشی نیز مورد استفاده قرار می‌گیرد. به عنوان نمونه در سرویس NVIDIA GR00T-Gen می‌توان دیتاست مورد نیاز برای ناوبری، حرکت و دستکاری اشیا را تولید کرد تا در محیط سیمولاتور با استفاده از آن ربات را آموزش داد.

ساختار فیزیکی ربات

شاید بتوان گفت مهم‌ترین اجزای سازنده فیزیک یک ربات سنسورها (Sensor) و اکچویتورها (Actuators) هستند. سنسورهای Proprioceptive وضعیت داخلی ربات را اندازه‌گرفته و به نوعی می‌توان گفت یک آگاهی در مورد جسم ربات برای آن ایجاد می‌کنند. این آگاهی با اندازه‌گیری اطلاعاتی نظیر موقعیت، جهت و حرکت فراهم می‌شود. سنسورهای Exteroceptive درباره پیرامون ربات و اشیای اطراف آن اطلاعات جمع‌آوری می‌کنند. این اطلاعات برای تعامل با محیط مورد نیاز است. اکچویتورها موتورهایی هستند که برای به حرکت درآوردن ربات و قسمت‌های مختلف آن به کار می‌روند و به صورت کلی به دوسته موتورهای الکتریکی و هیدرولیکی تقسیم می‌شوند. تعداد حرکت‌های مستقلی که یک اکچویتورها فراهم می‌کند Degree of Freedom یا به طور خلاصه DoF نامیده می‌شود.

مارکت ربات‌های انسان‌نما

طبق گزارش گلدمن ساکس در سال ۲۰۲۴، ربات‌های انسان‌نما در چند سال اخیر بسیار مورد توجه سرمایه‌گذاران قرار گرفته‌اند و پیش‌بینی می‌شود، مارکت ربات‌های انسان‌نما تا سال ۲۰۳۵ به ۳۸ میلیارد دلار برسد. یکی از دلایل اصلی این رشد، توسعه Gen AI است که در بخش جداگانه‌ای به آن پرداختم. کاهش هزینه ساخت ربات یکی دیگر از نکاتی است که در این گزارش به آن اشاره شده است. طبق این گزارش هزینه یک ربات‌ انسان‌نما به طور متوسط بین ۳۰ الی ۱۵۰ هزار دلار تمام می‌شود که نسبت به سال قبل کمتر شده است. این کاهش هزینه ربات‌‌های انسان‌نما را برای بسیاری در دسترس می‌کند. در حال حاضر رقابت برای کسب سهم از بازار جهانی عمدتاً بین آمریکا و چین در جریان است و تلاش‌هایی در بقیه کشورها دست اقدام است. گزارش مفصلی درباره مارکت رباتیک توسط Citibank نیز موجود است که می‌توانید آن را از اینجا بخوانید. در ادامه تعدادی از مهم‌ترین ربات‌های انسان‌نمای موجود در بازار را معرفی می‌کنم.

Robot Image