شرکت جتبرینز، شناختهشده برای ابزارهای توسعه نرمافزار مانند IntelliJ IDEA و PyCharm، روز چهارشنبه مدل هوش مصنوعی منبعباز Mellum را معرفی کرد. این مدل که ابتدا سال گذشته برای مجموعههای توسعه نرمافزار جتبرینز عرضه شده بود، حالا در پلتفرم توسعه هوش مصنوعی Hugging Face بهصورت عمومی در دسترس است. Mellum با ۴ میلیارد پارامتر و آموزش روی بیش از ۴ تریلیون توکن، برای تکمیل کد (code completion) طراحی شده و گزینهای ایدهآل برای توسعهدهندگان، ابزارهای حرفهای و کاربردهای آموزشی است.
ویژگیهای کلیدی مدل Mellum
طراحی تخصصی برای تکمیل کد
ملوم (Mellum) یک مدل متمرکز (focal model) است که بهجای کاربردهای عمومی، برای تکمیل کد بهینه شده است. این مدل با پیشبینی و پیشنهاد کد بر اساس زمینه موجود، سرعت و دقت کدنویسی را در محیطهای توسعه یکپارچه (IDE) مانند IntelliJ IDEA افزایش میدهد. جتبرینز میگوید این مدل در مقایسه با مدلهای بزرگتر، مانند CodeLlama، عملکردی رقابتی با سرعت و کارایی بالاتر ارائه میدهد.
آموزش روی دادههای عظیم و چندزبانه
ملوم (Mellum) روی مجموعه دادهای شامل بیش از ۴ تریلیون توکن، معادل حدود ۱۲۰ میلیارد خط کد، آموزش دیده است. این دادهها از منابع مجاز مانند GitHub و Wikipedia جمعآوری شدهاند. این مدل از زبانهای برنامهنویسی متعددی مانند Java، Python، Kotlin، Go، PHP و غیره پشتیبانی میکند و برای تکمیل کد چندزبانه بهینه شده است.
منبعباز و مناسب برای تحقیقات
با انتشار Mellum تحت مجوز Apache 2.0 در Hugging Face، جتبرینز امکان دسترسی پژوهشگران، اساتید و تیمهای پیشرفته به این مدل را فراهم کرده است. این مدل برای آزمایشهای تنظیم دقیق (fine-tuning) و تحقیقات در زمینه هوش مصنوعی کدنویسی مناسب است، هرچند نیاز به تنظیمات اضافی برای استفاده در محیطهای تولیدی دارد.
چالشها و محدودیتهای Mellum
انعکاس بایاسها و مسائل امنیتی
جتبرینز هشدار داده که Mellum ممکن است بایاسهای موجود در کدهای عمومی را منعکس کند، مانند شباهت سبک کدها به مخازن منبعباز. همچنین، پیشنهادات کد این مدل ممکن است شامل آسیبپذیریهای امنیتی باشد. طبق نظرسنجی Synk در سال ۲۰۲۳، بیش از نیمی از سازمانها با مشکلات امنیتی در کدهای تولیدشده توسط هوش مصنوعی مواجه شدهاند. توسعهدهندگان باید کدهای تولیدشده را با دقت بررسی کنند.
نیاز به تنظیم دقیق
ملوم (Mellum) بهصورت پیشفرض یک مدل پایه است و برای استفاده بهینه، نیاز به تنظیم دقیق برای زبانها یا پروژههای خاص دارد. جتبرینز نسخههای تنظیمشدهای برای زبانهایی مانند Python ارائه کرده، اما این نسخهها بیشتر برای ارزیابی و تحقیقات مناسب هستند تا استفاده مستقیم در تولید.
تأثیر Mellum بر اکوسیستم توسعه نرمافزار
همکاری و نوآوری در جامعه منبعباز
جتبرینز با منبعباز کردن Mellum، به دنبال تقویت همکاری در جامعه توسعهدهندگان است. این شرکت معتقد است که پروژههای منبعباز مانند Linux و Git پیشرفتهای بزرگی در فناوری ایجاد کردهاند و Mellum میتواند همین نقش را در هوش مصنوعی کدنویسی ایفا کند. جتبرینز امیدوار است این مدل جرقهای برای آزمایشها، مشارکتها و نوآوریهای جدید باشد.
برنامههای آینده جتبرینز
جتبرینز اعلام کرده که Mellum تنها آغاز راه است و قصد دارد خانوادهای از مدلهای متمرکز را برای وظایف مختلف کدنویسی، مانند پیشبینی تغییرات کد (diff prediction)، توسعه دهد. این رویکرد تخصصی، در مقایسه با مدلهای عمومی، هزینههای عملیاتی و اثرات زیستمحیطی کمتری دارد و برای تیمهای کوچکتر قابل دسترستر است.
چرا Mellum مهم است؟
ملوم (Mellum) با تمرکز بر تکمیل کد، کارایی توسعهدهندگان را افزایش میدهد و با رویکرد منبعباز، به پژوهشگران و تیمهای کوچک امکان میدهد تا در حوزه هوش مصنوعی کدنویسی نوآوری کنند. این مدل نهتنها ابزاری برای حرفهایها، بلکه منبعی برای آموزش و آزمایش در دانشگاهها و استارتاپهاست. با ادغام در ابزارهای جتبرینز، Mellum تجربه کدنویسی را بهبود میبخشد و استاندارد جدیدی در هوش مصنوعی تخصصی تعریف میکند.
نتیجهگیری
رونمایی از Mellum توسط جتبرینز گامی مهم در جهت دسترسیپذیر کردن هوش مصنوعی کدنویسی است. این مدل منبعباز با ۴ میلیارد پارامتر، سرعت، کارایی و انعطافپذیری را برای توسعهدهندگان و پژوهشگران به ارمغان میآورد. اگرچه نیاز به تنظیم دقیق و بررسیهای امنیتی دارد، Mellum پتانسیل ایجاد تحولی در ابزارهای توسعه و تحقیقات هوش مصنوعی را دارد. برای اطلاعات بیشتر، میتوانید به وبسایت جتبرینز یا Hugging Face مراجعه کنید.
دیدگاه شما