گوگل روز چهارشنبه اعلام کرد که چتبات جمینای حالا از ابزارهای پیشرفته خلق و ویرایش تصویر پشتیبانی میکند. این بهروزرسانی به کاربران امکان میدهد تصاویر تولیدشده توسط هوش مصنوعی یا تصاویر آپلودشده از گوشی و کامپیوتر را تغییر دهند، از جمله تغییر پسزمینه، جایگزینی اشیا یا افزودن عناصر جدید. این قابلیت، که بهتدریج از امروز عرضه میشود، در هفتههای آینده به بیش از ۴۵ زبان و اکثر کشورها گسترش خواهد یافت. این ارتقا، که ابتدا در پلتفرم AI Studio گوگل آزمایش شده بود، با ویژگیهای ویرایش چندمرحلهای خود، پاسخی غنیتر و متنیتر به درخواستهای کاربران ارائه میدهد.
ویژگیهای کلیدی ابزارهای جدید جمینای
ویرایش چندمرحلهای برای تصاویر
ابزارهای جدید جمینای از یک فرآیند ویرایش چندمرحلهای استفاده میکنند که به گفته گوگل، پاسخهایی «غنیتر و متنیتر» با ترکیب متن و تصویر ارائه میدهد. کاربران میتوانند تغییراتی مانند تغییر پسزمینه، جایگزینی اشیا یا افزودن عناصر را اعمال کنند. برای مثال، میتوانید عکسی شخصی آپلود کنید و از جمینای بخواهید رنگ موهای شما را تغییر دهد یا داستانی درباره اژدها بنویسد و تصاویر مرتبط تولید کند.
پشتیبانی از تصاویر آپلودشده و تولیدشده
برخلاف ابزارهای مستقل تولید تصویر، جمینای امکان ویرایش تصاویر تولیدشده توسط هوش مصنوعی و تصاویر آپلودشده را در یک پلتفرم یکپارچه فراهم میکند. این ویژگی با استفاده از مدلهای پیشرفته گوگل، نتایجی دقیقتر و مرتبطتر با درخواستهای کاربران ارائه میدهد. این قابلیت مشابه ابزارهای اخیر ChatGPT است، اما با تمرکز بر ادغام متن و تصویر متمایز است.
واترمارک برای کاهش نگرانیهای دیپفیک
با توجه به نگرانیهای مربوط به دیپفیک، گوگل اعلام کرده که تمام تصاویر تولیدشده یا ویرایششده توسط جمینای دارای واترمارک نامرئی خواهند بود. همچنین، این شرکت در حال آزمایش واترمارکهای قابلمشاهده برای همه تصاویر تولیدشده است تا شفافیت را افزایش دهد. این اقدام پس از جنجالهای مربوط به حذف واترمارک در نسخه آزمایشی AI Studio در ماه مارس انجام شده است.
زمینه و اهمیت این بهروزرسانی
رقابت در بازار هوش مصنوعی
این بهروزرسانی بخشی از تلاش گوگل برای رقابت با چتباتهایی مانند ChatGPT و مدلهای دیگر مانند Claude از Anthropic است. جمینای با ۳۵۰ میلیون کاربر فعال ماهانه تا مارس ۲۰۲۵، همچنان پشت سر ChatGPT با حدود ۶۰۰ میلیون کاربر قرار دارد، اما رشد سریعی را تجربه کرده است. ابزارهای جدید خلق تصویر، جمینای را به گزینهای جذابتر برای کاربران خلاق تبدیل میکند.
گسترش دسترسی جهانی
گوگل اعلام کرده که این قابلیتها بهزودی در اکثر کشورها و با پشتیبانی از بیش از ۴۵ زبان در دسترس خواهد بود. این گسترش، همراه با ادغام جمینای در محصولاتی مانند Google Photos و YouTube، نشاندهنده تعهد گوگل به یکپارچهسازی هوش مصنوعی در اکوسیستم خود است.
چالشها و نگرانیها
مسائل اخلاقی و دیپفیک
اگرچه ابزارهای جدید جمینای امکانات خلاقانهای ارائه میدهند، اما خطر سوءاستفاده برای تولید دیپفیک همچنان وجود دارد. گوگل با استفاده از واترمارکها و سیاستهای سختگیرانهتر سعی در کاهش این خطرات دارد، اما همچنان نیاز به نظارت و تنظیمات دقیقتر در این حوزه احساس میشود.
عرضه تدریجی و محدودیتهای اولیه
این قابلیت بهصورت تدریجی عرضه میشود و ممکن است در ابتدا برای همه کاربران در دسترس نباشد. همچنین، مدلهای آزمایشی مانند Gemini 2.0 Pro Experimental، که برخی از این ویژگیها را پشتیبانی میکنند، ممکن است رفتارهای غیرمنتظرهای داشته باشند و با برخی امکانات اپلیکیشن جمینای سازگار نباشند.
چرا این بهروزرسانی مهم است؟
ابزارهای جدید خلق و ویرایش تصویر جمینای، تجربه کاربری را از یک چتبات ساده به یک پلتفرم خلاقانه و چندمنظوره ارتقا میدهند. این بهروزرسانی نهتنها برای کاربرانی که به دنبال تولید محتوای بصری هستند جذاب است، بلکه با ادغام در اکوسیستم گوگل، کاربردهای گستردهتری در زمینههایی مانند آموزش، سرگرمی و بازاریابی دارد. تعهد گوگل به شفافیت با واترمارکها نیز گامی مثبت برای کاهش نگرانیهای اخلاقی است.
نتیجهگیری
بهروزرسانی ابزارهای خلق تصویر جمینای توسط گوگل، این چتبات را به رقیبی قدرتمندتر در بازار هوش مصنوعی تبدیل کرده است. با قابلیتهای ویرایش چندمرحلهای، پشتیبانی از تصاویر آپلودشده و تولیدشده، و تمرکز بر شفافیت، جمینای آماده است تا تجربهای خلاقانه و کاربرمحور ارائه دهد. برای اطلاعات بیشتر، میتوانید به وبلاگ رسمی گوگل یا وبسایت جمینای مراجعه کنید.
دیدگاه شما