رونمایی از مدل هوش مصنوعی گوگل با تأخیر ۱۰۴ ثانیه‌ای در پاسخ به «سلام»

مدل جدید هوش مصنوعی گوگل، جمینای ۳.۱ پرو، با وجود ادعای پیشرفت در استدلال، در روز عرضه با مشکل تأخیر در پاسخگویی مواجه شد و ۱۰۴ ثانیه برای گفتن «سلام» زمان صرف کرد.

به گزارش اقتصاد داخلی وبانگاه بر اساس داده‌های منتشرشده در ایسنا، مدل جدید هوش مصنوعی گوگل با نام «جمینای ۳.۱ پرو» (Gemini 3.1 Pro) در زمان رونمایی با تأخیر قابل توجهی در پاسخگویی روبرو شد؛ این مدل برای پاسخ دادن به واژه «سلام» ۱۰۴ ثانیه زمان نیاز داشت.

جمینای ۳.۱ پرو، آخرین مدل هوش مصنوعی گوگل است که در تاریخ ۱۹ فوریه با ادعای کسب بالاترین امتیاز در معیارهای استدلالی صنعت عرضه شد. با این حال، عملکرد این مدل در روز عرضه، آن را برای توسعه‌دهندگانی که بیشترین نیاز را به سرعت دارند، عملاً غیرقابل استفاده کرد. اگرچه امتیاز ۷۷.۱ درصدی در معیار سنجش «ARC-AGI-2» نشان‌دهنده پیشرفت قابل توجهی است و طبق اعلام رسمی گوگل، عملکرد این مدل بیش از دو برابر «جمینای ۳ پرو» است، اما توسعه‌دهندگان با اختلال در گردش‌های کاری، وقفه‌های چندساعته و ناتوانی مدل در اجرای دستورات اولیه بدون تأخیرهای طولانی مواجه شدند.

بهینه‌سازی مدل توسط مقامات گوگل برای تسلط بر جدول امتیازات، منجر به ارائه مدلی شده که محیط‌های تولید واقعی را مختل می‌کند. این موضوع اهمیت ویژه‌ای دارد، زیرا رقابت بر سر کسب امتیاز در معیارهای سنجش به یک صنعت تبدیل شده است. امتیازهای جمینای ۳.۱ پرو نشان‌دهنده تلاش گوگل برای ساخت مدلی بود که بتواند در وظایف استدلالی با هوش مصنوعی شرکت‌های «آنتروپیک» (Anthropic) و «اوپن‌ای‌آی» (OpenAI) رقابت کند. اما کاربران اولیه یک نسخه پیش‌نمایش دریافت کردند که در تولید کد مشکل داشته و حدود دو دقیقه برای پاسخ به «سلام» زمان صرف می‌کرد.

مشخصات فنی جمینای ۳.۱ پرو چشمگیر است، از جمله پنجره ورودی با ظرفیت یک میلیون توکن، ظرفیت خروجی ۶۴ هزار توکن و امتیاز ۷۷.۱ درصدی ARC-AGI-2 که آن را در میان مدل‌های تولیدی پیشتاز نشان می‌دهد. پست وبلاگ گوگل بر حل مسائل پیچیده و عملکرد عامل هوش مصنوعی تأکید داشت، اما به زمان انتظار طولانی که استدلال گسترده این مدل به آن نیاز دارد و عملاً آن را برای توسعه تعاملی غیرقابل استفاده می‌کند، اشاره‌ای نشد.

«سیمون ویلیسون» (Simon Willison)، برنامه‌نویس اهل انگلستان، گزارش داد که ظرف چند ساعت پس از راه‌اندازی، پاسخ ۱۰۴ ثانیه‌ای «سلام» را دریافت کرده است. انجمن‌های آنلاین پر از شکایات درباره عملکرد فوق‌العاده کند و پیام‌های خطای «مهلت منقضی‌شده» بود. یکی از کاربران در انجمن هوش مصنوعی گوگل نوشت: «لطفاً این به‌روزرسانی را به حالت قبل بازگردانید. این به‌روزرسانی کاملاً خراب است. این مشکل هرگز تمام نخواهد شد و برای اعتماد کاربران اولیه خوب نیست.»

این اعتماد اهمیت زیادی دارد. کاربران اولیه انتظار یک ارتقای بی‌نقص و یک جمینای ۳ پرو هوشمندتر را داشتند که بتواند وظایف پیچیده‌تری را انجام دهد. اما محصولی اساساً متفاوت دریافت کردند که در هر گردش کاری نیاز به بازنگری دارد. با وجود قیمت‌گذاری رقابتی مدل جمینای ۳.۱ پرو (دو دلار به ازای هر یک میلیون توکن ورودی و ۱۲ دلار به ازای هر یک میلیون توکن خروجی، که تقریباً نصف هزینه جدیدترین مدل پرچم‌دار شرکت آنتروپیک است)، انفجار زمان پاسخگویی این مزیت قیمتی را از بین می‌برد.

شکایت‌های مطرح‌شده، هزینه واقعی را آشکار می‌کنند. توسعه‌دهندگان نه تنها از پاسخ‌های کند، بلکه از اعتماد ازدست‌رفته خشمگین هستند. آن‌ها با انتظار عملکرد بهتر، مدل را ارتقاء دادند و مدلی دریافت کردند که قادر به انجام کارهای اساسی نیست. این مسئله نه یک مشکل عملکردی، بلکه یک عدم تطابق محصول است.

©‌ وبانگاه, ایسنا, تک کرانچ

دکمه بازگشت به بالا