یکی از ویژگیهای پلتفرم هوش مصنوعی آتلیه، این است که به جای آن که از متدهای قدیمی مانند Face Swap برای گذاشتن چهره شما روی مدل ساختهشده توسط AI استفاده کند، مدل مورد استفاده در پلتفرم مانی یا همان مانیآرت را به قولی تمرین داده و یا train میکند.
تمرین دادن مدل، در ابتدا توسط متدی به نام LoRA یا Low Rank Adaption انجام میشد، اما از تاریخ ۵ دیماه ۱۴۰۳ این متد به LoKR یا Low Rank Kronecker Product تغییر داده شده است.
در این پست، توضیح داده خواهد شد که چرا این متد، متد بهتری نسبت به LoRA است و چرا شما نیز بهتر است استفاده از این متد را در نظر بگیرید.
چرا ابتدا از LoRA در آتلیه استفاده شد؟
متد LoRA یا Low Rank Adaption یکی از مرسومترین روشهای بهینهسازی یا Finetune کردن مدلهای هوش مصنوعی است. این روش، مانند زمانی است که شما به جای از نو نوشتن جزوه یک درس، روی کاغذهای یادداشت، نکات مربوط به فصلهای مربوطه را نوشته و آن را به جزوه خود، منگنه کنید.
در واقع، در بهینهسازی به روش LoRA ما قرار نیست تا کل مدل را دستخوش تغییر نماییم بلکه فقط بخش مورد نظر خود را تغییر میدهیم یا به آن اضافه میکنیم. همین امر باعث شده است که تولید LoRA عملیاتی آسان، کمهزینه و سریع باشد و بسیاری از توسعهدهندگان و علاقمندان به هوش مصنوعی، این روش را به روشهای دیگر بهینهسازی ترجیح دهند.
گذشته از این موضوع، برای اجرای LoRA نیز نیاز نیست تا مدلهای پایه (مانند Stable Diffusion یا FLUX) را از ابتدا اجرا کنیم. کافیست این مدلها، در گوشهای از اینترنت اجرا شوند و مجموعهای که مدل را مستقر کرده است، امکان استفاده از LoRA را فراهم آورد.
از همین رو، انتخاب اول ما این شد که به ازای هر دیتاستی که کاربران آپلود مینمایند، یک LoRA ساخته شود. سپس این LoRA از طریق یک API و از طریق وبسایت Fal AI به مدل پایه متصل گردد.
و چرا باید از LoRA خداحافظی کنیم؟
در حالی که ما موفق شدیم زمان تمریندادن یا همان training مدل را به شدت کاهش دهیم و بهینهترین شکل LoRA را تولید کنیم، با توجه به بازخوردهای کاربران، تصمیممان این شد که از LoRA خداحافظی نماییم.
اما در همین حال، نیاز به جایگزین درستی برای LoRA داشتیم. به همین خاطر، LoKR برگزیده شد که در ادامه آن را مفصلا توضیح خواهیم داد.
چرا LoKR؟
برای این که درک کنیم چرا LoKR گزینه مناسبتری برای پلتفرم ما بود، باید تفاوت آن را با LoRA درک کنیم.
اگر به همان مثال جزوهنویسی بازگردیم، وقتی از LoRA استفاده میکنیم انگار فقط روی تکهای کاغذ نکات جدید را نوشته و در جزوه خود قرار دادهایم. اما استفاده از LoKR اینگونه نیست.
علیرغم این که LoKR نیز در واقع چنین شکلی را دارد، اما بیشتر شبیه زمانی است که ما صفحات خاصی از جزوه را بنا به خواست و صلاحدید آموزگاران و اساتید خود، دستخوش تغییر کنیم و روی بعضی جملات لاک غلطگیر گرفته و آن جملهبندی را عوض کنیم.
از طرفی اگر بنا به اضافه کردن یادداشتی به جزوه باشد، آن کاغذ یادداشت مورد بحث، در واقع رفرنسها و نمودارها و اشکالی است که باید به جزوه اضافه شوند.
مزیت LoKR نسبت به LoRA برای آتلیه چه بود؟
مزیتی که در این سبک شاهدیم، این است که جزییات صورت، جنس پوست و مو و…، به درستی از کاربر دریافت شده و به مدلهای پایه داده میشود.
این در حالی است که با روش LoRA مشکلات متعددی پیش میآمد و گاه نتیجه میتوانست فرسنگها دورتر از آنچه باشد که کاربران، میخواهند.
به همین خاطر تصمیم گرفتیم که به LoKR مهاجرت کنم. گرچه روشهای دیگر هم در دست آزمایش داریم اما در حال حاضر مدلهایی که از تاریخ پنجم دیماه ۱۴۰۳ به بعد ساخته شوند – تا زمانی که متد جدیدی لحاظ نگردد – به جای LoRA از متد LoKR استفاده خواهند کرد.
جمعبندی
در حال حاضر، با توجه به مهاجرت به روش LoKR در تولید عکسهای رئالیستی، قرار است که پلتفرم آتلیه عملکرد بهتری از خود نشان دهد. در واقع از آنجایی که ورودیهای شما همگی رئالیستی هستند، چنین برداشتی خواهد شد.
همچنین باید گفت که روش ساخت مدل همچنان مانند سابق است و تقاوتی نکرده و با رعایت نکات مهم پرامپتنویسی، میتوانید بهترین تصاویر ممکن را تولید کنید.
همچنین اگر در پروسه استفاده از این ابزار به مشکلی برخوردید، ما همیشه از طریق فرم تماس پذیرای نظراتتان هستیم.