معرفی Flux: رقیب قدرتمند Midjourney در تبدیل متن به تصویر
Black Forest Labs از هوش مصنوعی جدیدی به نام Flux رونمایی کرده است که با 12 میلیارد پارامتر، به عنوان بزرگترین مدل متنباز تبدیل متن به تصویر تاکنون شناخته میشود. Flux قادر است تصاویری تولید کند که از نظر کیفیت با Midjourney رقابت میکنند و حتی ممکن است بتواند هر مدل دیگری، چه متنباز و چه متنبسته را شکست دهد.
Flux در سه نسخه عرضه میشود: Flux Dev که نسخه متنباز و مناسب برای توسعهدهندگان است؛ Flux Schnell که تا 10 برابر عملکرد سریعتری دارد و تحت مجوز Apache 2 منتشر شده؛ و Flux Pro که نسخه متنبسته است و از طریق API در دسترس قرار میگیرد.
یکی از تفاوتهای کلیدی Flux با Midjourney در متنباز بودن آن است که امکان اجرای آن روی سیستمهای نسبتاً قوی را فراهم میکند. دو نسخه Flux Dev و Flux Schnell اکنون برای دانلود در Hugging Face در دسترس هستند.
سازندگان Flux ادعا میکنند که این مدل در تستهای بنچمارک در تولید تصویر از مدلهایی مانند Dall-E 3 (HD)، Midjourney v6.0 و SD3 Ultra در زمینههای کیفیت بصری، وفاداری به پرامپت، تایپوگرافی و تنوع خروجی بهتر عمل میکند. هرچند که همچنان برخی مشکلات مانند اشتباهات در طراحی اجزای بدن در آن مشاهده میشود.
برای استفاده از مدل متنباز Flux روی سیستم خود، نیاز به پردازشگر گرافیکی قدرتمند با حداقل 24 گیگابایت VRAM دارید. در غیر این صورت، میتوانید از پلتفرمهای آنلاین مانند NightCafe و Based Labs برای تولید تصاویر با Flux استفاده کنید.
بهطورکلی، نسخه پرو Flux میتواند به عنوان رقیبی جدی برای Midjourney و سایر مدلهای پولی مطرح شود. با این حال، افرادی که پردازشگرهای گرافیکی متوسطی دارند، ممکن است بهتر باشد که از مدلهای سبکتر مانند SD3 یا نسخههای سبکتر SDXL استفاده کنند.
نظر شما