Bu gün:

Yeni Sİ testi modellərin zəif nəticələrini üzə çıxarıb


"The Arc Prize Foundation" süni intellekt modellərinin ümumi biliyini qiymətləndirmək üçün yeni bir test hazırlayıb. ARC-AGI-2 adlanan bu test, ən qabaqcıl süni intellekt modellərini belə çətin vəziyyətə salıb.

TechCrunch xəbər verir ki, tanınmış Sİ tədqiqatçısı François Chollet tərəfindən birgə təsis edilən "The Arc Prize Foundation", yeni testin nəticələrini açıqlayıb. Bu test süni intellektin vizual nümunələri tanımaq və yeni problemlərə uyğunlaşmaq qabiliyyətini qiymətləndirir.

Testin nəticələrinə görə, OpenAİ-nin Q-pro və DeepSeek R1* kimi qabaqcıl süni intellekt modelləri ARC-AGI-2 testində cəmi 1%-1.3% arasında nəticə göstərib. Digər güclü Sİ modelləri, məsələn, GPT-4.5, Claude 3.7 Sonnet və Gemini 2.0 Flash, təxminən 1% nəticə əldə edib.

ARC-AGI testləri süni intellektin müxtəlif rəngli kvadratların içindəki vizual nümunələri tanıyaraq düzgün "cavab" şəbəkəsini yaratmasını tələb edir. Bu testlər Sİ-in daha öncə rastlaşmadığı problemləri həll etmə qabiliyyətini ölçmək üçün hazırlanıb.

Mütəxəssislər bildirirlər ki, süni intellekt modellərinin bu qədər aşağı nəticə göstərməsi, onların ümumi intellekt sahəsində hələ də ciddi məhdudiyyətlərə malik olduğunu göstərir.


Mənbə: Techcrunch 

Tərcümə etdi: Zeynəb Yunuszadə



Paylaş
Şərh əlavə et