معرفی Flux: رقیب قدرتمند Midjourney در تبدیل متن به تصویر
موضوع : تکنولوژی | هوش مصنوعی

معرفی Flux: رقیب قدرتمند Midjourney در تبدیل متن به تصویر

Black Forest Labs از هوش مصنوعی جدیدی به نام Flux رونمایی کرده است که با 12 میلیارد پارامتر، به عنوان بزرگ‌ترین مدل متن‌باز تبدیل متن به تصویر تاکنون شناخته می‌شود. Flux قادر است تصاویری تولید کند که از نظر کیفیت با Midjourney رقابت می‌کنند و حتی ممکن است بتواند هر مدل دیگری، چه متن‌باز و چه متن‌بسته را شکست دهد.

Flux در سه نسخه عرضه می‌شود: Flux Dev که نسخه متن‌باز و مناسب برای توسعه‌دهندگان است؛ Flux Schnell که تا 10 برابر عملکرد سریع‌تری دارد و تحت مجوز Apache 2 منتشر شده؛ و Flux Pro که نسخه متن‌بسته است و از طریق API در دسترس قرار می‌گیرد.

یکی از تفاوت‌های کلیدی Flux با Midjourney در متن‌باز بودن آن است که امکان اجرای آن روی سیستم‌های نسبتاً قوی را فراهم می‌کند. دو نسخه Flux Dev و Flux Schnell اکنون برای دانلود در Hugging Face در دسترس هستند.

سازندگان Flux ادعا می‌کنند که این مدل در تست‌های بنچمارک در تولید تصویر از مدل‌هایی مانند Dall-E 3 (HD)، Midjourney v6.0 و SD3 Ultra در زمینه‌های کیفیت بصری، وفاداری به پرامپت، تایپوگرافی و تنوع خروجی بهتر عمل می‌کند. هرچند که همچنان برخی مشکلات مانند اشتباهات در طراحی اجزای بدن در آن مشاهده می‌شود.

برای استفاده از مدل متن‌باز Flux روی سیستم خود، نیاز به پردازشگر گرافیکی قدرتمند با حداقل 24 گیگابایت VRAM دارید. در غیر این صورت، می‌توانید از پلتفرم‌های آنلاین مانند NightCafe و Based Labs برای تولید تصاویر با Flux استفاده کنید.

به‌طورکلی، نسخه پرو Flux می‌تواند به عنوان رقیبی جدی برای Midjourney و سایر مدل‌های پولی مطرح شود. با این حال، افرادی که پردازشگرهای گرافیکی متوسطی دارند، ممکن است بهتر باشد که از مدل‌های سبک‌تر مانند SD3 یا نسخه‌های سبک‌تر SDXL استفاده کنند.

نظر شما