تغییر متد training در مدل‌های آتلیه

یکی از ویژگی‌های پلتفرم هوش مصنوعی آتلیه، این است که به جای آن که از متدهای قدیمی مانند Face Swap برای گذاشتن چهره شما روی مدل ساخته‌شده توسط AI استفاده کند، مدل مورد استفاده در پلتفرم مانی یا همان مانی‌آرت را به قولی تمرین داده و یا train می‌کند.

تمرین دادن مدل، در ابتدا توسط متدی به نام LoRA یا Low Rank Adaption انجام می‌شد، اما از تاریخ ۵ دی‌ماه ۱۴۰۳ این متد به LoKR یا Low Rank Kronecker Product تغییر داده شده است.

در این پست، توضیح داده خواهد شد که چرا این متد، متد بهتری نسبت به LoRA است و چرا شما نیز بهتر است استفاده از این متد را در نظر بگیرید.

چرا ابتدا از LoRA در آتلیه استفاده شد؟

متد LoRA یا Low Rank Adaption یکی از مرسوم‌ترین روش‌های بهینه‌سازی یا Finetune کردن مدل‌های هوش مصنوعی است. این روش، مانند زمانی است که شما به جای از نو نوشتن جزوه یک درس، روی کاغذهای یادداشت، نکات مربوط به فصل‌های مربوطه را نوشته و آن را به جزوه خود، منگنه کنید.

در واقع، در بهینه‌سازی به روش LoRA ما قرار نیست تا کل مدل را دستخوش تغییر نماییم بلکه فقط بخش مورد نظر خود را تغییر می‌دهیم یا به آن اضافه می‌کنیم. همین امر باعث شده است که تولید LoRA عملیاتی آسان، کم‌هزینه و سریع باشد و بسیاری از توسعه‌دهندگان و علاقمندان به هوش مصنوعی، این روش را به روش‌های دیگر بهینه‌سازی ترجیح دهند.

گذشته از این موضوع، برای اجرای LoRA نیز نیاز نیست تا مدل‌های پایه (مانند Stable Diffusion یا FLUX) را از ابتدا اجرا کنیم. کافیست این مدل‌ها، در گوشه‌ای از اینترنت اجرا شوند و مجموعه‌ای که مدل را مستقر کرده است، امکان استفاده از LoRA را فراهم آورد.

از همین رو، انتخاب اول ما این شد که به ازای هر دیتاستی که کاربران آپلود می‌نمایند، یک LoRA ساخته شود. سپس این LoRA از طریق یک API و از طریق وبسایت Fal AI به مدل پایه متصل گردد.

و چرا باید از LoRA خداحافظی کنیم؟

در حالی که ما موفق شدیم زمان تمرین‌دادن یا همان training مدل را به شدت کاهش دهیم و بهینه‌ترین شکل LoRA را تولید کنیم، با توجه به بازخوردهای کاربران، تصمیممان این شد که از LoRA خداحافظی نماییم.

اما در همین حال، نیاز به جایگزین درستی برای LoRA داشتیم. به همین خاطر، LoKR برگزیده شد که در ادامه آن را مفصلا توضیح خواهیم داد.

چرا LoKR؟

برای این که درک کنیم چرا LoKR گزینه مناسب‌تری برای پلتفرم ما بود، باید تفاوت آن را با LoRA درک کنیم.

اگر به همان مثال جزوه‌نویسی بازگردیم، وقتی از LoRA استفاده می‌کنیم انگار فقط روی تکه‌ای کاغذ نکات جدید را نوشته و در جزوه خود قرار داده‌ایم. اما استفاده از LoKR اینگونه نیست.

علیرغم این که LoKR نیز در واقع چنین شکلی را دارد، اما بیشتر شبیه زمانی است که ما صفحات خاصی از جزوه را بنا به خواست و صلاحدید آموزگاران و اساتید خود، دستخوش تغییر کنیم و روی بعضی جملات لاک غلط‌گیر گرفته و آن جمله‌بندی را عوض کنیم.

از طرفی اگر بنا به اضافه کردن یادداشتی به جزوه باشد، آن کاغذ یادداشت مورد بحث، در واقع رفرنس‌ها و نمودارها و اشکالی است که باید به جزوه اضافه شوند.

مزیت LoKR نسبت به LoRA برای آتلیه چه بود؟

مزیتی که در این سبک شاهدیم، این است که جزییات صورت، جنس پوست و مو و…، به درستی از کاربر دریافت شده و به مدل‌های پایه داده می‌شود.

این در حالی است که با روش LoRA مشکلات متعددی پیش می‌آمد و گاه نتیجه می‌توانست فرسنگ‌ها دورتر از آنچه باشد که کاربران، میخواهند.

به همین خاطر تصمیم گرفتیم که به LoKR مهاجرت کنم. گرچه روش‌های دیگر هم در دست آزمایش داریم اما در حال حاضر مدل‌هایی که از تاریخ پنجم د‌ی‌ماه ۱۴۰۳ به بعد ساخته شوند – تا زمانی که متد جدیدی لحاظ نگردد – به جای LoRA از متد LoKR استفاده خواهند کرد.

جمع‌بندی

در حال حاضر، با توجه به مهاجرت به روش LoKR در تولید عکس‌های رئالیستی، قرار است که پلتفرم آتلیه عملکرد بهتری از خود نشان دهد. در واقع از آنجایی که ورودی‌های شما همگی رئالیستی هستند، چنین برداشتی خواهد شد.

همچنین باید گفت که روش ساخت مدل همچنان مانند سابق است و تقاوتی نکرده و با رعایت نکات مهم پرامپت‌نویسی، می‌توانید بهترین تصاویر ممکن را تولید کنید.

همچنین اگر در پروسه استفاده از این ابزار به مشکلی برخوردید، ما همیشه از طریق فرم تماس پذیرای نظراتتان هستیم.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *