Preloader Icon

Odyssey: مدل هوش مصنوعی برای خلق جهان‌های سه‌بعدی تعاملی

0 دیدگاه
21 خرداد 1404

آیا می‌توان جهانی تعاملی و سه‌بعدی را تنها با چند کلیک در مرورگر خلق کرد؟ استارتاپ Odyssey، با مدل جدید هوش مصنوعی خود، امکان استریم ویدیوهای تعاملی سه‌بعدی را فراهم کرده که کاربران می‌توانند مانند یک بازی ویدیویی در آن‌ها کاوش کنند. این فناوری می‌تواند برای کسب‌وکارهای در حوزه‌هایی مانند سرگرمی، آموزش و تبلیغات، فرصتی بی‌نظیر برای خلق محتوای خلاقانه و تعاملی باشد.

Odyssey و مدل هوش مصنوعی جدید آن

استارتاپ Odyssey، که توسط اولیور کامرون و جف هاوک، پیشگامان فناوری خودران، تأسیس شده، در هفته گذشته مدل هوش مصنوعی جدیدی را معرفی کرد که قادر است ویدیوهای تعاملی سه‌بعدی را با نرخ 30 فریم بر ثانیه استریم کند. این مدل، که در حال حاضر به‌صورت دموی اولیه در وب در دسترس است، به کاربران امکان می‌دهد با کنترل‌های ساده در محیط‌های ویدیویی کاوش کنند، مشابه تجربه‌ای که در بازی‌های ویدیویی سه‌بعدی دیده می‌شود.

به گفته Odyssey در پست وبلاگی خود، این مدل با پیش‌بینی حالت بعدی جهان بر اساس وضعیت کنونی، اقدامات کاربر و تاریخچه داده‌ها کار می‌کند. این فناوری که با استفاده از یک «جهان‌مدل» (world model) جدید توسعه یافته، می‌تواند پیکسل‌هایی واقعی تولید کند، ثبات فضایی را حفظ کند و ویدیوهایی منسجم به مدت پنج دقیقه یا بیشتر استریم کند. این قابلیت برای کسب‌وکارهایی که به دنبال تولید محتوای تعاملی برای آموزش یا بازاریابی هستند، می‌تواند راه‌حلی نوآورانه باشد.

ویژگی‌ها و عملکرد فعلی

دموی اولیه Odyssey، که روی خوشه‌های GPUهای Nvidia H100 اجرا می‌شود، هر 40 میلی‌ثانیه یک فریم ویدیویی تولید می‌کند. کاربران می‌توانند با استفاده از کنترل‌های ساده، مانند حرکت رو به جلو یا چرخش، در محیط‌های مجازی مانند مناظر طبیعی کاوش کنند. با این حال، Odyssey اذعان کرده که این دمو هنوز در مراحل اولیه است و با مشکلاتی مانند تصاویر مبهم، اعوجاج و ناپایداری در چیدمان محیط‌ها مواجه است. برای مثال، حرکت طولانی در یک جهت ممکن است باعث تغییر ناگهانی محیط شود.

با وجود این محدودیت‌ها، Odyssey قول داده که به‌سرعت مدل خود را بهبود دهد. این شرکت در حال تحقیق روی نمایش‌های غنی‌تر از جهان است که دینامیک‌ها را با دقت بیشتری ثبت می‌کنند و ثبات زمانی و حالت پایدار را افزایش می‌دهند. این پیشرفت‌ها می‌توانند برای توسعه‌دهندگانی که به دنبال ایجاد اپلیکیشن‌های واقعیت مجازی یا افزوده هستند، جذاب باشد.

کاربردهای بالقوه برای کسب‌وکارها

مدل هوش مصنوعی Odyssey پتانسیل بالایی برای کاربرد در صنایع مختلف دارد، به‌ویژه برای کسب‌وکارهایی که به دنبال راه‌حل‌های خلاقانه هستند:

  • سرگرمی: استودیوهای بازی‌سازی می‌توانند از این فناوری برای خلق محیط‌های تعاملی بدون نیاز به رندرینگ سنگین استفاده کنند.
  • آموزش: مؤسسات آموزشی می‌توانند محیط‌های مجازی برای شبیه‌سازی‌های آموزشی، مانند کاوش در سایت‌های تاریخی یا آزمایشگاه‌های علمی، ایجاد کنند.
  • تبلیغات: برندها می‌توانند تبلیغات تعاملی تولید کنند که مشتریان بتوانند در آن‌ها محصولات را در محیط‌های سه‌بعدی تجربه کنند.
  • گردشگری: آژانس‌های مسافرتی می‌توانند تورهای مجازی از مقاصد گردشگری ارائه دهند که کاربران بتوانند در آن‌ها کاوش کنند.

برای مثال، شرکتی در حوزه آموزش می‌تواند از Odyssey برای ایجاد کلاس‌های مجازی تعاملی استفاده کند که دانش‌آموزان بتوانند در محیط‌های سه‌بعدی مانند موزه‌ها یا سایت‌های باستانی حرکت کنند.

رویکرد منحصربه‌فرد Odyssey

برخلاف بسیاری از آزمایشگاه‌های هوش مصنوعی که از داده‌های عمومی برای آموزش مدل‌های خود استفاده می‌کنند، Odyssey یک سیستم دوربین 360 درجه با طراحی کوله‌پشتی توسعه داده تا مناظر واقعی را ضبط کند. این رویکرد به مدل اجازه می‌دهد کیفیت بالاتری نسبت به مدل‌های آموزش‌دیده با داده‌های عمومی داشته باشد. این مزیت می‌تواند برای کسب‌وکارهایی که به دنبال تولید محتوای بصری با کیفیت بالا برای بازارهای محلی یا جهانی هستند، کلیدی باشد.

علاوه بر این، Odyssey در دسامبر گذشته اعلام کرد که در حال توسعه نرم‌افزاری است که به خلاقان اجازه می‌دهد صحنه‌های تولیدشده توسط مدل‌هایش را در ابزارهایی مانند Unreal Engine، Blender و Adobe After Effects بارگذاری و ویرایش کنند. این قابلیت برای استودیوهای انیمیشن یا بازی‌سازی می‌تواند فرآیند تولید را ساده‌تر و ارزان‌تر کند.

رقابت در بازار جهان‌مدل‌ها

جهان‌مدل‌ها (world models) به یکی از داغ‌ترین حوزه‌های هوش مصنوعی تبدیل شده‌اند. شرکت‌هایی مانند Google DeepMind، World Labs (تأسیس‌شده توسط فی‌فی لی)، مایکروسافت و Decart در این زمینه فعال هستند. این فناوری پتانسیل دارد تا رسانه‌های تعاملی مانند بازی‌ها و فیلم‌ها را متحول کند و شبیه‌سازی‌هایی برای کاربردهایی مانند آموزش ربات‌ها ایجاد نماید. با این حال، Odyssey با تمرکز بر استریم ویدیوهای تعاملی و استفاده از داده‌های واقعی، رویکردی متفاوت ارائه می‌دهد.

برای استارتاپ‌هایی که در حوزه واقعیت افزوده یا مجازی فعالیت می‌کنند، این رقابت فرصتی است تا با فناوری‌هایی مانند Odyssey، اپلیکیشن‌های نوآورانه‌ای برای بازارهای محلی یا جهانی بسازند.

نگرانی‌های صنعت خلاق

در حالی که Odyssey قول همکاری با متخصصان خلاق را داده، فناوری‌های هوش مصنوعی در صنعت سرگرمی با انتقاداتی مواجه شده‌اند. گزارش اخیر Wired نشان داد که استودیوهایی مانند Activision Blizzard از هوش مصنوعی برای کاهش هزینه‌ها و تعدیل نیروها استفاده می‌کنند. همچنین، مطالعه‌ای در سال 2024 توسط Animation Guild تخمین زد که هوش مصنوعی ممکن است تا سال 2026 بیش از 100,000 شغل در صنعت فیلم، تلویزیون و انیمیشن آمریکا را مختل کند.

این نگرانی‌ها برای صنایع خلاق نیز صدق می‌کند، جایی که استودیوهای کوچک ممکن است با رقابت فناوری‌های هوش مصنوعی مواجه شوند. با این حال، Odyssey با تأکید بر همکاری با خلاقان و ارائه ابزارهای ویرایش، می‌تواند به‌عنوان یک تقویت‌کننده خلاقیت عمل کند تا جایگزین آن.

سرمایه‌گذاری و چشم‌انداز آینده

Odyssey تاکنون 27 میلیون دلار از سرمایه‌گذارانی مانند EQT Ventures، GV (بازوی سرمایه‌گذاری گوگل) و Air Street Capital جذب کرده است. حضور اد کتمول، یکی از بنیان‌گذاران پیکسار و رئیس سابق استودیو انیمیشن والت دیزنی، در هیئت مدیره این شرکت، نشان‌دهنده پتانسیل بالای آن در صنعت خلاق است.

این شرکت در حال گسترش قابلیت‌های مدل خود است، از جمله افزودن اقدامات باز (open actions) مانند تعامل با اشیای مجازی و بهبود ثبات زمانی. این پیشرفت‌ها می‌توانند Odyssey را به یک پلتفرم پیشرو در تولید محتوای تعاملی تبدیل کنند، که برای کسب‌وکارهای مختلف فرصتی برای ورود به بازارهای جهانی خواهد بود.

چالش‌ها و محدودیت‌ها

دموی فعلی Odyssey هنوز ناپایدار است و با مشکلاتی مانند تصاویر مبهم و تغییرات ناگهانی در محیط‌ها مواجه است. هزینه اجرای مدل (1 تا 2 دلار به ازای هر ساعت کاربر) نیز ممکن است برای استارتاپ‌های با بودجه محدود چالش‌برانگیز باشد. علاوه بر این، نیاز به خوشه‌های GPUهای Nvidia H100 برای استریم ویدیو، دسترسی به این فناوری را برای بازارهایی با زیرساخت محدود دشوار می‌کند.

با این حال، تعهد Odyssey به بهبود مدل و همکاری با خلاقان می‌تواند این چالش‌ها را در آینده کاهش دهد. عرضه نسخه‌های بهینه‌شده‌تر و کاهش هزینه‌ها می‌تواند این فناوری را برای توسعه‌دهندگان قابل دسترس‌تر کند.

نتیجه‌گیری

Odyssey با مدل هوش مصنوعی خود، آینده رسانه‌های تعاملی را با جهان‌های سه‌بعدی استریم‌شده بازتعریف می‌کند. اگر صاحب کسب‌وکار یا توسعه‌دهنده‌ای هستید که به دنبال ابزارهای نوآورانه برای تولید محتوای تعاملی هستید، نظرتون درباره Odyssey چیه؟ تو کامنت‌ها بگید!

منابع:

دسته بندی‌ها:

دیدگاه شما

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *