آریا بانو

آخرين مطالب

همه چیز درباره هوش مصنوعی جدید «اوپن‌ای‌آی» اقتصادی

همه چیز درباره هوش مصنوعی جدید «اوپن‌ای‌آی»
  بزرگنمايي:

آریا بانو - ایسنا /«اوپن‌ای‌آی» روز دوشنبه خانواده جدیدی از مدل‌های هوش مصنوعی خود را به نام «GPT-4.1» معرفی کرد که تمرکز آن بر کدنویسی است.
«اوپن‌ای‌آی»(OpenAI) در حال حاضر مدل‌های «GPT-4.1»، «GPT-4.1 mini» و «GPT-4.1 nano» را دارد که برتری خود را در کدنویسی و دنبال کردن دستورالعمل‌ها نشان داده‌اند. مدل‌های چندوجهی که از طریق API اوپن‌ای‌آی در دسترس هستند، می‌توانند هر بار تقریبا یک میلیون توکن (750 هزار کلمه) را دریافت کنند. این میزان کلمه، یک متن طولانی‌تر از رمان «جنگ و صلح» را تشکیل می‌دهد.
به نقل از تک کرانچ، GPT-4.1 زمانی وارد شده است که رقبای اوپن‌ای‌آی مانند «گوگل» و «آنتروپیک» تلاش‌های خود را برای ساخت مدل‌های برنامه‌نویسی پیچیده افزایش می‌دهند. «جمینای 2.5 پرو»(Gemini 2.5 Pro) که اخیرا توسط گوگل منتشر شد و یک میلیون توکن را پوشش می‌دهد، رتبه بالایی را در معیارهای محبوب کدنویسی دارد. «کلود 3.7 سونت»(Claude 3.7 Sonnet) و «V3» ارتقاءیافته شرکت چینی «دیپ‌سیک»(DeepSeek) نیز همین طور هستند.
هدف بسیاری از غول‌های فناوری از جمله اوپن‌ای‌آی، آموزش دادن مدل‌های کدنویسی هوش مصنوعی است که می‌توانند وظایف پیچیده مهندسی نرم‌افزار را انجام دهند. «سارا فریار»(Sarah Friar)، مدیر ارشد مالی اوپن‌ای‌آی ماه گذشته در نشست فناوری لندن گفت که جاه‌طلبی بزرگ این شرکت، ایجاد یک مهندس نرم‌افزار عاملی است. این شرکت ادعا می‌کند که مدل‌های آینده‌ آن می‌توانند همه برنامه‌ها را به‌ صورت سرتاسری برنامه‌ریزی کنند و بر جنبه‌هایی مانند تضمین کیفیت، آزمایش مشکل و نوشتن مستندات مدیریت داشته باشند.
مدل GPT-4.1 گامی در این مسیر است. یکی از سخن‌گویان اوپن‌ای‌آی در یک ایمیل به تک کرانچ، گفت: ما GPT-4.1 را برای استفاده در دنیای واقعی بر اساس بازخورد مستقیم تنظیم کرده‌ایم تا در زمینه‌هایی که توسعه‌دهندگان بیشتر به آنها اهمیت می‌دهند مانند برنامه‌نویسی فرانت‌اند، کاهش ویرایش‌های اضافی، فرمت‌های قابل اعتماد، رعایت ساختار پاسخ و سفارش، استفاده ثابت از فناوری و موارد دیگر بهبود پیدا کنیم. این پیشرفت‌ها توسعه‌دهندگان را قادر می‌سازند تا عواملی را ارائه دهند که در کارهای مهندسی نرم‌افزار در دنیای واقعی به طور قابل توجهی بهتر باشند.
اوپن‌ای‌آی ادعا می‌کند که مدل کامل GPT-4.1 از مدل‌های GPT-4o و GPT-4o mini در معیارهای کدنویسی مانند «SWE-bench» بهتر عمل می‌کند. گفته می‌شود که GPT-4.1 mini و nano با کمی دقت، کارآمدتر و سریع‌تر عمل می‌کنند و GPT-4.1 nano سریع‌ترین و ارزان‌ترین مدل آن است.
مدل GPT-4.1 برای هر میلیون توکن ورودی، دو دلار و برای هر میلیون توکن خروجی، هشت دلار هزینه دارد. هزینه GPT-4.1 mini برای هر میلیون توکن ورودی 0.40 دلار و برای میلیون توکن خروجی 1.60 دلار است و GPT-4.1 nano برای هر میلیون توکن ورودی 0.10 دلار و برای هر میلیون توکن خروجی 0.40 دلار هزینه دارد.
آزمایش داخلی اوپن‌ای‌آی نشان می‌دهد GPT-4.1 که می‌تواند هم‌زمان توکن‌های بیشتری را نسبت به GPT-4o تولید کند (32768 در مقابل 16384)، امتیازی بین 52 تا 54.6 درصد در پایگاه داده «SWE-bench Verified» کسب کرده است. اوپن‌ای‌آی در یک پست وبلاگ خاطرنشان کرد که برخی از راه‌حل‌ها برای مشکلات SWE-bench Verified را نمی‌توان در زیرساخت‌های آن اجرا کرد و به همین دلیل، این دامنه امتیازها وجود دارند. این ارقام کمی کمتر از امتیازات گزارش‌شده توسط گوگل و آنتروپیک برای جمینای 2.5 پرو (63.8 درصد) و کلود 3.7 سونت (62.3 درصد) هستند.
اوپن‌ای‌آی در یک ارزیابی جداگانه، GPT-4.1 را با استفاده از «Video-MME» بررسی کرد که برای ارزیابی توانایی یک مدل در درک محتوای ویدئوها طراحی شده است. اوپن‌ای‌آی ادعا می‌کند که GPT-4.1 به دقت 72 درصدی در مقوله ویدئوهای طولانی و بدون زیرنویس رسیده است.
اگرچه GPT-4.1 امتیاز قابل قبولی را در معیارها کسب کرده و دارای یک رکورد جدیدتر در آموزش داده است، اما به خاطر داشته باشید حتی برخی از بهترین مدل‌های امروزی در حال دست‌وپنجه نرم کردن با وظایفی هستند که متخصصان را غافلگیر نمی‌کنند. به عنوان مثال، بسیاری از پژوهش‌ها نشان داده‌اند که مدل‌های تولیدکننده کد اغلب در رفع و حتی معرفی آسیب‌پذیری‌ها و مشکلات امنیتی شکست می‌خورند.
همچنین، اوپن‌ای‌آی تصدیق می‌کند که GPT-4.1 هر چه توکن‌های ورودی بیشتری داشته باشد، کمتر قابل اعتماد می‌شود؛ یعنی احتمال بروز اشتباه افزایش می‌یابد. در یکی از آزمایش‌های خود اوپن‌ای‌آی موسوم به «OpenAI-MRCR»، دقت مدل از حدود 84 درصد با 8000 توکن به 50 درصد با یک میلیون توکن کاهش یافت. اوپن‌ای‌آی می‌گوید که GPT-4.1 نسبت به GPT-4o به معنای واقعی کلمه دقیق‌تر است و گاهی اوقات به درخواست‌های مشخص‌تر و واضح‌تر نیاز دارد.

لینک کوتاه:
https://www.aryabanoo.ir/Fa/News/1388707/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

پلمپ نخی کیسه‌ها اینطور را باز کنید!

اهمیت شناسایی کم‌شنوایی در کودکی/آمار کم‌شنوایی ناتوان‌کننده در بزرگسالان

صادرات ضدآفتاب‌های نانویی ایرانی به 4 کشور

بخشی از کتاب/ زیستن یعنی آموختن

ماجدی: تیم های منتخب استان تهران پشتوانه تیم های ملی خواهند بود

مدیرعامل مستعفی در جلسه هیئت مدیره پرسپولیس

اعلام فینالیست‌های جوایز سالانه NBA

ثبت رکوردی جدید در تیم ملی والیبال

بدهی سنگین فتح‌الله‌زاده و یک میلیاردی مدیر سابق به استقلال

«دُرّ شَهوار سلطان»؛ شاهدخت عثمانی که «رضاخان» او را برای پسرش می‌خواست

بیوگرافی «ستاره پسیانی» و فیلم هایی که بازی کرد

چهره ها/ عکس یادگاری سانیا سالاری در کنار بزرگ مرد سینما

جزئیات طرح "خودروی متصل" از زبان سردار رادان

دستگیری زورگیران بی‌رحم خیابان بعثت

استراحت گلۀ گوزن زیرسایۀ شکوفه های گیلاس در ژاپن

مگشت پلو، از غذاهای خوشمزه و لذیذ خوزستانی

از هر 1000 تولد 4 نوزاد با شکاف لب متولد می‌شوند

مسیر بازگشت به زندگی پس از تجاوز

تماشای پشت دیوار در تاریکی مطلق با امواج وای‌فای

مرادمند بازی با هوادار را از دست داد

آرنولد حق بازی کردن برای لیورپول را ندارد!

آنچلوتی: در نیمه دوم در تمامی جنبه‌ها عالی بودیم

کلهر: مدیرعامل جدید، اشتباهات درویش را تکرار نکند

دیدار تاریخی سفیر آمریکا با مهدی بازرگان، اولین نخست وزیر پس از انقلاب/ عکس

آرش ظلی‌پور: خوشحالم در نمایشی بازی می‌کنم که درباره جزیره هرمز است

عکس بازسازی شده «سعید کنگرانی» در ایام جوانی

تقی آزاد ارمکی: آقایان، موضوع مهاجرت افغان ها را به شوخی گرفته‌اند/ ویدئو

کنسرت وحید تاج از حوزه هنری مجوز داشت/ درخواستی از وزارت فرهنگ نداشتیم

بازخوانی جنجالی‌ترین پرونده قتل 12سال اخیر؛ چرا جسد غزاله پیدا نشد؟

تمدید اعتبار کارت‌های هوشمند ملی تا پایان سال 1405

خیابان «هرجور راحتی» در هند

آموزش نوشیدنی کافی شادی با 3 قلم مواد

اهمیت تفاهم بین زوجین و راه های تقویت آن

پرده‌برداری از راز مسری بودن خمیازه

من از تکثر باران ندیده‌ام خیری؛ مرا به خلوت آغوش یار برگردان

والورده: فکر نکردم، فقط شوت زدم!

حضور علی پاکدامن در گرندپری سئول

ورود VAR به بازی‌های حساس لیگ دسته اول فوتبال

دعوت از 19 ورزشکار به اردوی تیم ملی پاراتیراندازی با کمان

حذف وزنه‌برداری و گلف از المپیک جوانان 2026

استفاده از تجربیات بازنشستگان موجب ارتقا بهره وری بنیاد است

پنج سریال خارجی برتر سال 2025 که باید دید

بابک رضایی مدیر کل دفتر موسیقی شد

پیگیری مسئولان برای برگزاری فستیوال «کوچه»/ شریفیان: کوچه نیازی به مجوز نداشت

سوراخ کردن گوش در مترو فقط 30 هزار تومان!

نمای زیبا از کابین خلبان در پرواز رشت به تهران

کیک صبحانه خونگی بدون مواد نگهدارنده

باید و نبایدهای سه ماه اول بارداری

درمان نوین زخم‌های مزمن با کمک سلول‌های بدن

ما چون ز دری پای کشیدیم کشیدیم