Preloader Icon

گوگل مدل جدید Gemini را برای ربات‌ها رونمایی کرد!

0 دیدگاه
07 تیر 1404

آیا ربات‌ها می‌توانند بدون اتصال به اینترنت کارهای پیچیده‌ای مثل تا کردن لباس یا باز کردن زیپ کیف انجام دهند؟ گوگل دیپ‌مایند با معرفی مدل جدید Gemini Robotics On-Device، گامی بزرگ در جهت خودکارسازی ربات‌ها برداشته است. این مدل که در تاریخ 24 ژوئن 2025 معرفی شد، امکان اجرای وظایف پیچیده را به‌صورت محلی و بدون نیاز به اتصال ابری فراهم می‌کند و می‌تواند تحولی در صنایع و کسب‌وکارها ایجاد کند.

 Gemini Robotics On-Device چیست؟  

طبق گزارش TechCrunch، گوگل دیپ‌مایند مدل زبانی جدیدی به نام Gemini Robotics On-Device را معرفی کرده که قادر است وظایف رباتیک را به‌صورت محلی و بدون نیاز به اتصال اینترنتی انجام دهد. این مدل، که بر پایه مدل قبلی Gemini Robotics (معرفی‌شده در مارس 2025) ساخته شده، می‌تواند حرکات ربات را کنترل کند و با استفاده از دستورات زبانی طبیعی (Natural Language Prompts) تنظیم و شخصی‌سازی شود. در دمویی که گوگل ارائه کرده، ربات‌هایی با این مدل وظایفی مانند باز کردن زیپ کیف و تا کردن لباس را با موفقیت انجام داده‌اند. این مدل ابتدا برای ربات‌های ALOHA طراحی شده بود، اما بعداً برای ربات‌های دوبازوی Franka FR3 و ربات انسان‌نمای Apollo از شرکت Apptronik نیز سازگار شد.

 ویژگی‌های کلیدی مدل جدید  

Gemini Robotics On-Device با بهره‌گیری از فناوری VLA (Vision-Language-Action)، توانایی‌های دیداری، زبانی و عملیاتی را ترکیب می‌کند تا ربات‌ها بتوانند در محیط‌های بدون اتصال اینترنت کار کنند. این مدل به دلیل اجرای محلی، تأخیر کمتری دارد و برای کاربردهای حساس به زمان، مانند خطوط تولید صنعتی یا محیط‌های پزشکی که حریم خصوصی اهمیت دارد، ایده‌آل است. گوگل ادعا می‌کند که این مدل در بنچمارک‌های عمومی، عملکردی نزدیک به مدل ابری Gemini Robotics دارد و از سایر مدل‌های محلی مشابه پیشی گرفته است، هرچند نام این مدل‌ها مشخص نشده است.

گوگل همچنین کیت توسعه نرم‌افزاری (SDK) Gemini Robotics را منتشر کرده که به توسعه‌دهندگان امکان می‌دهد با 50 تا 100 نمایش (Demonstration) وظایف جدیدی را به ربات‌ها آموزش دهند. این فرآیند با استفاده از شبیه‌ساز فیزیکی MuJoCo انجام می‌شود و انعطاف‌پذیری بالایی برای سازگاری با محیط‌ها و وظایف جدید فراهم می‌کند.

 رقابت در حوزه رباتیک هوش مصنوعی  

گوگل تنها بازیگر این میدان نیست. شرکت‌هایی مانند Nvidia، که پلتفرمی برای ساخت مدل‌های پایه برای ربات‌های انسان‌نما توسعه می‌دهد، و Hugging Face، که مدل‌های متن‌باز و داده‌های رباتیک را ارائه می‌کند، در حال رقابت هستند. همچنین استارتاپ کره‌ای RLWRLD با حمایت Mirae Asset در حال کار بر روی مدل‌های پایه برای ربات‌هاست. با این حال، توانایی Gemini Robotics On-Device در اجرای محلی و کاهش وابستگی به اینترنت، آن را به گزینه‌ای جذاب برای محیط‌های صنعتی و حساس تبدیل کرده است.

ایمنی و چالش‌ها  

یکی از نگرانی‌های اصلی در استفاده از هوش مصنوعی در ربات‌ها، ایمنی است. گوگل تأکید کرده که این مدل از رویکرد چندلایه‌ای برای ایمنی استفاده می‌کند، به‌ویژه در نسخه ابری که قابلیت استدلال درباره ایمنی وظایف را دارد. با این حال، توسعه‌دهندگان مدل محلی باید خودشان لایه‌های ایمنی را پیاده‌سازی کنند. گوگل توصیه می‌کند که از API Gemini Live و کنترلرهای سطح پایین برای بررسی‌های ایمنی استفاده شود.

نتیجه‌گیری 

مدل Gemini Robotics On-Device گوگل، با قابلیت اجرای محلی و انعطاف‌پذیری بالا، می‌تواند آینده رباتیک را متحول کند و به کسب‌وکارها کمک کند تا فرآیندهای خود را هوشمندتر و کارآمدتر کنند. نظر شما درباره این نوآوری چیست؟ در کامنت‌ها با ما به اشتراک بگذارید!

دسته بندی‌ها:

دیدگاه شما

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *