3 دقیقه
سرعت رشد هوش مصنوعی در طی چند وقت اخیر، بسیاری را شگفت زده کرده است. دیگر این رباتها منحصر به گفتگوی ساده متنی نیستند و عملیات خیلی پیشرفتهتری را انجام میدهند که شاید یک انسان برای خلق آنها نیاز به ساعتها و حتی روزها زمان داشته باشد.
یکی از بخشهای بسیار جذاب در کار هوش مصنوعی، خلق تصاویر گرافیکی است، کارهایی که با نگاه اول میتوان آنها را مسحور کننده دانست. در این بخش، یک ربات هوشمند به نام میدجرنی توانست نقش پیشتاز را بازی کند اما پس از آن نمونههای زیاد دیگری به بازار آمدند که هر کدام تخصص ویژه خودشان را داشتند.
میدجرنی میتوانست با استفاده از وصف شما، تصویری را تحویلتان بدهد که از از تصورتان هم زیباتر بود! با استقبال گسترده از این بات، Open AI به عنوان سازنده چت جیپیتی هم خیلی سریع دست به کار شد و Dall E را به بازار عرضه کرد. البته تا نسخه دوم، این بات توانایی رقابت با میدجرنی را نداشت ولی ورود به نسل سوم، همه چیز را تغییر داد!
در جدیدترین ورژن یعنی Dall E-3، توانایی خلق تصاویر به بالاترین سطح ارتقا یافته و حتی میتواند میدجرنی را نیز در بعضی قسمتها پشت سر بگذارد! در واقع مقایسه این دو ربات هوشمند، شبیه به مقایسه بنز و بیامو شده است، هر دو با کیفیت و توانمند اما دارای محصولاتی متفاوت!
مقایسه Midjourmey و Dall E-3
برای آنکه کیفیت این دو در خلق تصاویر را بتوانید با یکدیگر بهتر مقایسه کنید، چند تصویر را برایتان قرار میدهیم. در ابتدا، عنوان تصویر درخواست شده و سپس توصیف هر کدام را میگذاریم تا ببینیم که عکسهای ارایه شده توسط کدامیک، جذابتر است؟
عنوان: یک جادوگر دوستانه!
توصیف: خلق یک عکس واقع گرایانه، 35 میلی متری، جادوگر شاد و دوستانه، در یک خانه حومه شهر، در حال هدیه دادن برای هالووین
عنوان: اسنوپی و کدو تنبل شاد!
توصیف: کارتون به سبک دهه 1960، هالووین کدو تنبل شاد، با سگ شاد شبیه اسنوپی
عنوان: بچهها با لباس!
توصیف: کودکانی با استایل لباسهای هالووینی و البته کمپانی پیکسار
عنوان: کابوس در دیتا سنتر!
توصیف: سبک کابوس قبل از کریسمس، سبک تیم برتون، فرد حرفهای آیتی در دیتا سنتر
با نگاهی به تصاویر بالا، متوجه مهارت فوقالعاده Midjourney و Dall E-3 در خلق تصاویر میشویم که با آنکه سبک تقریبا متفاوتی دارند، ولی تصاویر جذابی را تولید میکنند که برای درست کردن هر کدام نیاز به زمان زیادی است!
نظرات