رونمایی از مدل هوش مصنوعی گوگل با تأخیر ۱۰۴ ثانیهای در پاسخ به «سلام»

به گزارش اقتصاد داخلی وبانگاه بر اساس دادههای منتشرشده در ایسنا، مدل جدید هوش مصنوعی گوگل با نام «جمینای ۳.۱ پرو» (Gemini 3.1 Pro) در زمان رونمایی با تأخیر قابل توجهی در پاسخگویی روبرو شد؛ این مدل برای پاسخ دادن به واژه «سلام» ۱۰۴ ثانیه زمان نیاز داشت.
جمینای ۳.۱ پرو، آخرین مدل هوش مصنوعی گوگل است که در تاریخ ۱۹ فوریه با ادعای کسب بالاترین امتیاز در معیارهای استدلالی صنعت عرضه شد. با این حال، عملکرد این مدل در روز عرضه، آن را برای توسعهدهندگانی که بیشترین نیاز را به سرعت دارند، عملاً غیرقابل استفاده کرد. اگرچه امتیاز ۷۷.۱ درصدی در معیار سنجش «ARC-AGI-2» نشاندهنده پیشرفت قابل توجهی است و طبق اعلام رسمی گوگل، عملکرد این مدل بیش از دو برابر «جمینای ۳ پرو» است، اما توسعهدهندگان با اختلال در گردشهای کاری، وقفههای چندساعته و ناتوانی مدل در اجرای دستورات اولیه بدون تأخیرهای طولانی مواجه شدند.
بهینهسازی مدل توسط مقامات گوگل برای تسلط بر جدول امتیازات، منجر به ارائه مدلی شده که محیطهای تولید واقعی را مختل میکند. این موضوع اهمیت ویژهای دارد، زیرا رقابت بر سر کسب امتیاز در معیارهای سنجش به یک صنعت تبدیل شده است. امتیازهای جمینای ۳.۱ پرو نشاندهنده تلاش گوگل برای ساخت مدلی بود که بتواند در وظایف استدلالی با هوش مصنوعی شرکتهای «آنتروپیک» (Anthropic) و «اوپنایآی» (OpenAI) رقابت کند. اما کاربران اولیه یک نسخه پیشنمایش دریافت کردند که در تولید کد مشکل داشته و حدود دو دقیقه برای پاسخ به «سلام» زمان صرف میکرد.
مشخصات فنی جمینای ۳.۱ پرو چشمگیر است، از جمله پنجره ورودی با ظرفیت یک میلیون توکن، ظرفیت خروجی ۶۴ هزار توکن و امتیاز ۷۷.۱ درصدی ARC-AGI-2 که آن را در میان مدلهای تولیدی پیشتاز نشان میدهد. پست وبلاگ گوگل بر حل مسائل پیچیده و عملکرد عامل هوش مصنوعی تأکید داشت، اما به زمان انتظار طولانی که استدلال گسترده این مدل به آن نیاز دارد و عملاً آن را برای توسعه تعاملی غیرقابل استفاده میکند، اشارهای نشد.
«سیمون ویلیسون» (Simon Willison)، برنامهنویس اهل انگلستان، گزارش داد که ظرف چند ساعت پس از راهاندازی، پاسخ ۱۰۴ ثانیهای «سلام» را دریافت کرده است. انجمنهای آنلاین پر از شکایات درباره عملکرد فوقالعاده کند و پیامهای خطای «مهلت منقضیشده» بود. یکی از کاربران در انجمن هوش مصنوعی گوگل نوشت: «لطفاً این بهروزرسانی را به حالت قبل بازگردانید. این بهروزرسانی کاملاً خراب است. این مشکل هرگز تمام نخواهد شد و برای اعتماد کاربران اولیه خوب نیست.»
این اعتماد اهمیت زیادی دارد. کاربران اولیه انتظار یک ارتقای بینقص و یک جمینای ۳ پرو هوشمندتر را داشتند که بتواند وظایف پیچیدهتری را انجام دهد. اما محصولی اساساً متفاوت دریافت کردند که در هر گردش کاری نیاز به بازنگری دارد. با وجود قیمتگذاری رقابتی مدل جمینای ۳.۱ پرو (دو دلار به ازای هر یک میلیون توکن ورودی و ۱۲ دلار به ازای هر یک میلیون توکن خروجی، که تقریباً نصف هزینه جدیدترین مدل پرچمدار شرکت آنتروپیک است)، انفجار زمان پاسخگویی این مزیت قیمتی را از بین میبرد.
شکایتهای مطرحشده، هزینه واقعی را آشکار میکنند. توسعهدهندگان نه تنها از پاسخهای کند، بلکه از اعتماد ازدسترفته خشمگین هستند. آنها با انتظار عملکرد بهتر، مدل را ارتقاء دادند و مدلی دریافت کردند که قادر به انجام کارهای اساسی نیست. این مسئله نه یک مشکل عملکردی، بلکه یک عدم تطابق محصول است.