آیا رباتها میتوانند بدون اتصال به اینترنت کارهای پیچیدهای مثل تا کردن لباس یا باز کردن زیپ کیف انجام دهند؟ گوگل دیپمایند با معرفی مدل جدید Gemini Robotics On-Device، گامی بزرگ در جهت خودکارسازی رباتها برداشته است. این مدل که در تاریخ 24 ژوئن 2025 معرفی شد، امکان اجرای وظایف پیچیده را بهصورت محلی و بدون نیاز به اتصال ابری فراهم میکند و میتواند تحولی در صنایع و کسبوکارها ایجاد کند.
Gemini Robotics On-Device چیست؟
طبق گزارش TechCrunch، گوگل دیپمایند مدل زبانی جدیدی به نام Gemini Robotics On-Device را معرفی کرده که قادر است وظایف رباتیک را بهصورت محلی و بدون نیاز به اتصال اینترنتی انجام دهد. این مدل، که بر پایه مدل قبلی Gemini Robotics (معرفیشده در مارس 2025) ساخته شده، میتواند حرکات ربات را کنترل کند و با استفاده از دستورات زبانی طبیعی (Natural Language Prompts) تنظیم و شخصیسازی شود. در دمویی که گوگل ارائه کرده، رباتهایی با این مدل وظایفی مانند باز کردن زیپ کیف و تا کردن لباس را با موفقیت انجام دادهاند. این مدل ابتدا برای رباتهای ALOHA طراحی شده بود، اما بعداً برای رباتهای دوبازوی Franka FR3 و ربات انساننمای Apollo از شرکت Apptronik نیز سازگار شد.
ویژگیهای کلیدی مدل جدید
Gemini Robotics On-Device با بهرهگیری از فناوری VLA (Vision-Language-Action)، تواناییهای دیداری، زبانی و عملیاتی را ترکیب میکند تا رباتها بتوانند در محیطهای بدون اتصال اینترنت کار کنند. این مدل به دلیل اجرای محلی، تأخیر کمتری دارد و برای کاربردهای حساس به زمان، مانند خطوط تولید صنعتی یا محیطهای پزشکی که حریم خصوصی اهمیت دارد، ایدهآل است. گوگل ادعا میکند که این مدل در بنچمارکهای عمومی، عملکردی نزدیک به مدل ابری Gemini Robotics دارد و از سایر مدلهای محلی مشابه پیشی گرفته است، هرچند نام این مدلها مشخص نشده است.
گوگل همچنین کیت توسعه نرمافزاری (SDK) Gemini Robotics را منتشر کرده که به توسعهدهندگان امکان میدهد با 50 تا 100 نمایش (Demonstration) وظایف جدیدی را به رباتها آموزش دهند. این فرآیند با استفاده از شبیهساز فیزیکی MuJoCo انجام میشود و انعطافپذیری بالایی برای سازگاری با محیطها و وظایف جدید فراهم میکند.
رقابت در حوزه رباتیک هوش مصنوعی
گوگل تنها بازیگر این میدان نیست. شرکتهایی مانند Nvidia، که پلتفرمی برای ساخت مدلهای پایه برای رباتهای انساننما توسعه میدهد، و Hugging Face، که مدلهای متنباز و دادههای رباتیک را ارائه میکند، در حال رقابت هستند. همچنین استارتاپ کرهای RLWRLD با حمایت Mirae Asset در حال کار بر روی مدلهای پایه برای رباتهاست. با این حال، توانایی Gemini Robotics On-Device در اجرای محلی و کاهش وابستگی به اینترنت، آن را به گزینهای جذاب برای محیطهای صنعتی و حساس تبدیل کرده است.
ایمنی و چالشها
یکی از نگرانیهای اصلی در استفاده از هوش مصنوعی در رباتها، ایمنی است. گوگل تأکید کرده که این مدل از رویکرد چندلایهای برای ایمنی استفاده میکند، بهویژه در نسخه ابری که قابلیت استدلال درباره ایمنی وظایف را دارد. با این حال، توسعهدهندگان مدل محلی باید خودشان لایههای ایمنی را پیادهسازی کنند. گوگل توصیه میکند که از API Gemini Live و کنترلرهای سطح پایین برای بررسیهای ایمنی استفاده شود.
نتیجهگیری
مدل Gemini Robotics On-Device گوگل، با قابلیت اجرای محلی و انعطافپذیری بالا، میتواند آینده رباتیک را متحول کند و به کسبوکارها کمک کند تا فرآیندهای خود را هوشمندتر و کارآمدتر کنند. نظر شما درباره این نوآوری چیست؟ در کامنتها با ما به اشتراک بگذارید!
دیدگاه شما