أعلنت OpenAI رسميًا يوم الثلاثاء عن ChatGPT Images 2.0، وهو ما لا يعزز فقط بشكل كبير دقة توليد النص، بل ويرفع أيضًا جماليات التصميم في الملصقات وصور الأشخاص. كما قدم هذا النموذج لأول مرة «وضع التفكير»، ما يجعل إنشاء الصور يتمتع بقدرات البحث عبر الإنترنت وإخراج دفعات متعددة للصور، ليتقارب بشكل كامل مع سيناريوهات الاستخدام التجاري.

(أعلنت Canva عن تكامل عميق مع Claude، ما يتيح تحويل مسودات الذكاء الاصطناعي إلى منتجات تصميم نهائية)

من اختلاق القوائم إلى القوائم المثالية: تعلّم الذكاء الاصطناعي أخيرًا الإملاء

بالعودة إلى السنتين الماضيتين، كانت نقاط الضعف في نماذج توليد الصور بالذكاء الاصطناعي في مجال توليد النص شبه معروفة للجميع؛ فعندما يتضمن نصّ الإرشاد احتياجات إلى نص، غالبًا ما تمتلئ النتائج بأخطاء إملائية سخيفة بل وحتى اختلاق غير واقعي، ويزداد ذلك سوءًا في لغات غير الإنجليزية مثل الصينية واليابانية والكورية.

مخطط الملصقات الكورية في الإعلان الرسمي

واليوم، بات بإمكان ChatGPT Images 2.0 توليد ملصق إعلاني يمكن توفيره مباشرة للاستخدام من قبل المورّدين، مع نص واضح ودقيق. وفي السنوات الأخيرة، عمل الباحثون بنشاط على استكشاف بنيات جديدة مثل النماذج ذاتية الارتداد (Autoregressive Models) وغيرها، وقد تحسنت بشكل ملحوظ منطق التشغيل وفهم النص وقدرات التوليد والتحقق.

وضع التفكير متاح على الإنترنت: البحث الشبكي وتناسق التكوين في كل شيء

أكثر ترقية جوهرية في ChatGPT Images 2.0 هي «وضع التفكير (Thinking Capabilities)»، وهو متاح حاليًا للمستخدمين المدفوعين على ChatGPT Plus وPro والنسخة التجارية ونسخة المؤسسات. بعد تفعيله، يمكن للنموذج إجراء بحث فوري عبر الإنترنت للمساعدة في توليد الصور، كما يمكنه إنتاج توضيحات بصرية مقابلة اعتمادًا على الملفات التي يرفعها المستخدم، ويقوم أيضًا بإجراء مراجعة ذاتية وتحسين لمحتوى الصور قبل الإخراج الرسمي.

في التوليد على دفعات، يمكن لوضع التفكير—باستخدام موجه واحد فقط—إخراج ما يصل إلى ثماني صور في المرة الواحدة، كما يمكن الحفاظ على تمثيل متسق للشخصيات بين كل صورة، بالإضافة إلى أنماط الأشياء والأسلوب العام، وهو ما يجعله مناسبًا للّقطات القصصية في الرسوم الهزلية، وسلاسل الصور والنصوص على وسائل التواصل الاجتماعي، وحتى مخططات تخطيط المساحات في التصميم الداخلي لجميع المساحات.

مخطط لقطات القصص المصورة في الإعلان الرسمي

من ناحية الدقة، يدعم النموذج الجديد إخراجًا بحد أقصى 2K، كما تمت إضافة خيارات متعددة لنِسَب الأبعاد من 3:1 إلى 1:3، بما يلبي بشكل أكبر احتياجات الأعمال المختلفة.

تحسينات كبيرة للغات الآسيوية، والمستخدمون في الصين واليابان وكوريا على موعد مع الخير!

بالإضافة إلى الإنجليزية، أشارت OpenAI بشكل خاص إلى تحسينات كبيرة في النصوص الآسيوية في Images 2.0، حيث توجد تحسينات واضحة في اليابانية والكورية والصينية وغيرها.

كما أن مقال الاختبار الذي انتشر على نطاق واسع في المجتمع التقني الصيني قبل أيام قليلة أيد هذه المعلومة؛ إذ أجرى العديد من منشئي المحتوى على Zhihu مقارنات تجريبية بين GPT-Image-2 والمنافس Google Nano Banana Pro في ذلك الوقت، شملت سيناريوهات متعددة مثل تصميم الملصقات الصينية، وصور غلاف التجارة الإلكترونية، وواجهات وسائل التواصل الاجتماعي، والرسوم البيانية المرقمنة.

اختبار مقال Zhihu لـ GPT-Image 2.0

تظهر نتائج الاختبار أن GPT-Image-2 يتفوق بشكل واضح في جماليات الخط الصيني، وتسلسل التخطيط (مستويات التنسيق) والإحساس العام بالتصميم. كما أن أسلوب الملصقات التي تم توليدها يكون أقرب بكثير إلى المواد التجارية الحقيقية، وليس إخراجًا على نمط القوالب مع «إحساس واضح بالذكاء الاصطناعي». وأشار المقال أيضًا إلى أن GPT-Image-2 يظهر دقة أدق في إعادة إظهار (مثل لقطات شاشة من مشاهد الألعاب أو تطبيقات المراسلة)، وكذلك في استنساخ مشاهد الأشخاص الحقيقيين، من حيث التفاصيل.

إتاحة ChatGPT Images 2.0 بشكل كامل، وإطلاق API بالتزامن

حاليًا، منذ يوم الثلاثاء من هذا الأسبوع، يتم توفير ChatGPT Images 2.0 مجانًا لجميع مستخدمي ChatGPT وCodex لتقديم الوظائف الأساسية، بينما يمكن للمستخدمين المدفوعين فتح تأثيرات إخراج أكثر تقدمًا. وفي الوقت نفسه، قامت OpenAI أيضًا بإتاحة GPT-Image-2 API، ويعتمد التسعير على جودة الإخراج ودقة القرار وفقًا لتقسيمات الفئات، لتوفير مرونة التكامل لفرق الشركات والمطورين.

تجدر الإشارة إلى أن تاريخ توقف معرفة النموذج الجديد هو ديسمبر 2025، لذا قد تتأثر الدقة إلى حد ما عند تقديم موجهات توليد صور تتعلق بأحدث الأخبار الجارية. علاوة على ذلك، لا يمكن أن تصل سرعة توليد التكوينات المعقدة إلى مستوى سرعة الأسئلة والأجوبة النصية الفورية عادةً، لكن لا يزال الأمر يتطلب بضع دقائق فقط.

ظهرت هذه المقالة «ChatGPT Images 2.0: أطلقت! ارتفاع كبير في دقة توليد النص، وإنتاج ملصقات تسويقية بسهولة» لأول مرة على «لينك نيوز ABMedia».

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

سام ألتمان يفصّل مفاوضات فاشلة مع إيلون ماسك بشأن سيطرة OpenAI، والدعوى مزمّعة في 27 أبريل

أخبار صناعة AI

ألتمان في "الذاكرة الأساسية" يستعرض فشل محادثات الحوكمة في OpenAI مع إيلون ماسك: مراحل من التنازل نحو نموذج يهدف إلى الربح، مطالب ماسك بحصة أغلبية والتحكم بمنصب الرئيس التنفيذي، وألتمان يعارض السلطة المطلقة، مع اقتراب المحاكمة. ملخص: سام ألتمان يوضح، في "الذاكرة الأساسية"، تفاصيل مفاوضات فاشلة مع إيلون ماسك بشأن حوكمة OpenAI، مع عرض خطوات نحو نموذج يهدف إلى الربح، ومطالب ماسك بحصة أغلبية وسلطة الرئيس التنفيذي، ورفض ألتمان للسيطرة المطلقة؛ الدعوى القضائية المتوقعة مع تحديد محاكمة في 27 أبريل.

GateNewsمنذ 6 د

Brockman يتولى تكامل المنتجات في OpenAI؛ Sora تم تخفيض تصنيفها بسبب "تباعد الفروع التقنية"

أخبار صناعة AI

رسالة أخبار Gate، 22 أبريل — تولّى رئيس OpenAI، Greg Brockman، مهام التكامل الشامل لمنتجات الشركة وأبحاثها، وهو الدور الذي شغله لمدة تقارب "عدة أسابيع"، وفقًا لتصريحات أدلى بها في بودكاست Core Memory. وذكر الرئيس التنفيذي Sam Altman أن هذا التحول التنظيمي في الشركة قد جعلها داخليًا "أكثر سعادة بشكل ملحوظ."

GateNewsمنذ 10 د

Sam Altman 在播客中回应家中遭袭，预测将出现更多类似事件

أخبار صناعة AI

Gate News 消息，4 月 22 日——OpenAI 首席执行官 Sam Altman 在一次 Core Memory 播客露面期间，首次公开回应了对其住所的两起袭击。Altman 表示，此类事件在未来很可能还会发生，尽管他没有展开说明袭击的细节

GateNewsمنذ 18 د

شانغهاي تُكمل تسجيل خدمة واحدة للذكاء الاصطناعي التوليدي، ليصل الإجمالي التراكمي إلى 158

أخبار صناعة AI

تُبلّغ شانغهاي عن تسجيل خدمة جديدة للذكاء الاصطناعي التوليدي اعتبارًا من 21 أبريل 2026، ما يرفع إجمالي شانغهاي إلى 158 ضمن تدابير مؤقتة تتطلب التسجيل لدى الجهات التنظيمية. ملخص: يشير هذا البيان الموجز إلى أن إدارة الفضاء الإلكتروني في شانغهاي أعلنت أنه اعتبارًا من 21 أبريل 2026، اكتملت إجراءات تسجيل خدمة جديدة للذكاء الاصطناعي التوليدي، ما يرفع الإجمالي إلى 158. تأتي هذه الخطوة عقب «التدابير المؤقتة لإدارة خدمات الذكاء الاصطناعي التوليدي»، التي تتطلب من مقدمي الخدمات التسجيل لدى الجهات التنظيمية.

GateNewsمنذ 19 د

Hugging Face 开源 ml-intern：面向自主 ML 研究的 AI 代理

وكيل AI أخبار صناعة AI

开源的 ml-intern，Hugging Face 的自主 ML 研究代理，会阅读论文、策划数据、训练、评估，并在科学、医学和数学领域持续迭代。摘要：Hugging Face 的 ml-intern 是一个开源的自主 ML 研究代理：它会阅读论文、整理数据集，在本地或云端 GPU 上训练、评估结果，并迭代改进。它基于 smolagents，并提供 CLI 和网页界面，可在 arXiv/HF Papers、HF Hub 和 HF Jobs 之间导航。演示覆盖科学、医学和数学，展示端到端自动化以及性能提升。

GateNewsمنذ 34 د

JPMorgan Chase ترفع هدفها لنهاية العام لمؤشر S&P 500 إلى 7,600، مستشهدة بطفرة استثمارات الذكاء الاصطناعي وتراجع المخاطر الجيوسياسية

الأسهم المؤشرات أخبار صناعة AI

الملخص: رفع JPMorgan مؤشر S&P 500 لعام 2026 إلى 7,600، ولـ2027 إلى 385 ربحًا للسهم، مدفوعًا بحماس الذكاء الاصطناعي وتراجع حدة التوترات في الشرق الأوسط؛ كما يبقى السعر إلى الأرباح المستقبلية عند 22x، مع وجود احتمال لارتفاعه إلى 23x و~8,000 إذا تراجعت التوترات؛ ويحذر من حدوث تماسك قصير الأجل وسط مخاطر النفط والجيوسياسة. النص الموجز: فريق الاستراتيجية لدى JPMorgan، بقيادة Dubravko Lakos-Bujas، رفع توقعات S&P 500 لنهاية العام إلى 7,600 من 7,200، مشيرًا إلى تجدد حماس الذكاء الاصطناعي وتراجع التوترات في الشرق الأوسط. تم تعزيز ربحية السهم لـ2026 إلى $330 وإلى 2027 إلى $385، مع تثبيت المضاعف الآجل عند 22x؛ إذ يمكن أن يؤدي حل أسرع للأوضاع الجيوسياسية إلى رفع المضاعف إلى 23x ودفع 2026 نحو 8,000. اكتسب محور الذكاء الاصطناعي زخمًا بعد أن كشفت Anthropic عن Mythos، حيث حققت نحو ثلثي أسهم S&P 500 المرتبطة بالذكاء الاصطناعي أداءً يفوق السوق. تشمل المخاطر ارتفاع أسعار النفط واستمرار التوترات الجيوسياسية، ما يشير إلى احتمال حدوث تماسك قصير الأجل قبل تحقيق مكاسب إضافية.

GateNewsمنذ 38 د

تعليق

0/400

لا توجد تعليقات