در حوزه هوش مصنوعی، کسبوکارها با چالشهای بیسابقهای برای مدیریت بهینه منابع محاسباتی روبهرو هستند. به همین دلیل، سرویس Azure OpenAI به عنوان بستری حیاتی برای سازمانهایی که به دنبال بهرهبرداری از قابلیتهای پیشرفته هوش مصنوعی هستند مطرح میشود، و رزروهای اختصاصی (Provisioned Reservations) به استراتژیای هوشمندانه برای صرفهجویی در هزینهها تبدیل شدهاند.
از آنجا که نیازهای کسبوکار دائماً در حال تغییر است، انعطافپذیری در مدیریت این رزروها بسیار مهم است. در این مطلب، علاوه بر بررسی اهمیت رزروهای اختصاصی در عملیات هوش مصنوعی از نظر تابآوری و بهرهوری هزینهای، با دنبال کردن شرکت خیالی Contoso، سناریوهای واقعیای را بررسی میکنیم که نشان میدهند چگونه تبادل رزروها به مقیاسپذیری بهتر و کنترل بیشتر بر بودجه منجر میشود.
Azure OpenAI یک سرویس قدرتمند مبتنی بر فضای ابری است که دسترسی به مدلهای پیشرفته یادگیری ماشین OpenAI را فراهم میکند. این سرویس به توسعهدهندگان امکان میدهد تا برنامههای هوش مصنوعی را با سهولت و کارایی بینظیر بسازند و استقرار دهند. این پلتفرم طیف گستردهای از قابلیتها، از پردازش زبان طبیعی تا شناسایی تصویر را ارائه میدهد که برای کسبوکارهایی که بهدنبال بهرهگیری از فناوری هوش مصنوعی هستند، بسیار ارزشمند است.
آشنایی با گزینههای پرداخت: PAYG در برابر PTU
در استفاده از Azure OpenAI، مشتریان دو گزینه اصلی برای مدیریت مصرف و هزینه دارند:
پرداخت بر اساس مصرف (Pay-As-You-Go - PAYG)
در مدل PAYG، کاربران فقط برای منابعی که استفاده میکنند پرداخت مینمایند. این مدل برای برنامههایی با ترافیک متغیر یا غیرقابل پیشبینی ایدهآل است، زیرا انعطافپذیری بالایی دارد و به جلوگیری از هزینههای غیرضروری کمک میکند. هزینهها بر اساس تعداد توکنهای پردازششده و سایر معیارهای مصرف محاسبه میشود، و این گزینهای مقیاسپذیر و شفاف برای بسیاری از سناریوهاست.
واحدهای توان عملیاتی تخصیصیافته (Provisioned Throughput Units - PTU)
در مقابل، مدل PTU راهکاری قابل پیشبینیتر و تحت کنترلتر برای مدیریت بارهای کاری هوش مصنوعی ارائه میدهد. با تخصیص مقدار مشخصی از توان عملیاتی، مشتریان میتوانند عملکرد و تأخیر پایدار را برای برنامههای خود تضمین کنند. این مدل بهویژه برای محیطهای تولید با الگوهای ترافیکی تعریفشده و ثابت مناسب است و پیشبینی ظرفیت و مدیریت هزینهها را آسان میکند.
چه زمانی از مدل PTU استفاده کنیم؟
استفاده از واحدهای PTU زمانی توصیه میشود که نیازهای توان عملیاتی شما مشخص و قابل پیشبینی باشد. این معمولاً زمانی است که یک برنامه برای استفاده تولیدی آماده است یا قبلاً در محیط تولید راهاندازی شده و حجم ترافیک آن بهخوبی مشخص است. سناریوهای کلیدی شامل:
برنامههایی که آماده ورود به محیط تولید هستند یا در آن مستقر شدهاند.
برنامههایی با الگوهای مصرف یا ظرفیت پیشبینیپذیر.
برنامههایی با نیازهای لحظهای یا حساس به تأخیر.
درک دقیق مصرف مورد انتظار توکن در دقیقه (TPM)، بهویژه برای موارد استفاده مرتبط با فراخوانی توابع یا عاملهای هوشمند، قبل از مهاجرت به PTU بسیار مهم است.
تغییرات مدل PTU که در آگوست ۲۰۲۴ اعلام شد:
در آگوست ۲۰۲۴، مایکروسافت بهروزرسانیهای مهمی در مدل PTU ارائه داد که بر اساس بازخورد مشتریان طراحی شده و هدف آن افزایش قابلیت استفاده و چابکی عملیاتی است. این تغییرات عبارتاند از:
سهمیه مستقل از مدل
تغییر از سهمیههای اختصاصی مدل به سهمیه مستقل، مدیریت سهمیه را سادهتر کرده و امکان آزمایش سریعتر مدلهای جدید را فراهم میکند. اکنون یک سهمیه واحد برای تمام مدلها و نسخهها در یک اشتراک و منطقه اعمال میشود.درخواست سهمیه بهصورت سلفسرویس
کاربران اکنون میتوانند بدون نیاز به ارتباط با تیم فروش، درخواست افزایش سهمیه بدهند و بسیاری از درخواستها بهصورت خودکار تأیید میشوند.مدل تجاری ساعتی / رزرو جدید
این مدل جدید امکان پرداخت ساعتی و همچنین تخفیفهای چشمگیر برای تعهدات زمانی (یکماهه یا یکساله) از طریق رزروهای Azure را فراهم میکند.سهمیه پیشفرض در بسیاری از مناطق
اشتراکهای جدید و موجود اکنون بهطور پیشفرض سهمیهای کوچک در بسیاری از مناطق دریافت میکنند، و نیازی به درخواست اولیه برای فعالسازی منطقه نیست.پشتیبانی از نسلهای جدید مدلها
برای استقرار مدلهایی که پس از ۱ آگوست ۲۰۲۴ منتشر شدهاند، استفاده از مدل ساعتی/رزروی الزامی است، تا مشتریان بتوانند از پیشرفتهای جدید در فناوری AI بهرهمند شوند.شفافیت بیشتر در ظرفیت
ابزارها و APIهای جدید اطلاعات لحظهای درباره ظرفیت در دسترس ارائه میدهند، و به کاربران کمک میکنند مناطقی با ظرفیت مناسب برای استقرار مدلهای خود را شناسایی کنند. این امر زمان استقرار را کاهش داده و روند عرضه به بازار را تسریع میکند.
این بهروزرسانیها نشاندهنده تعهد مستمر مایکروسافت به بهبود سرویس Azure OpenAI است — سرویس را انعطافپذیرتر، کاربرپسندتر و منطبقتر با نیازهای برنامههای هوش مصنوعی مدرن میسازد.

بهروزرسانیهای سرویس Azure OpenAI
در این بهروزرسانی، تغییرات کلیدی و قابلیتهای جدیدی معرفی شدهاند که شامل گزینههای متنوع استقرار، تمرکز بر مناطق داده (Data Zones) و بهبود تابآوری (Resiliency) میشود. یکی از نکات مهم، معرفی مناطق داده برای هر دو مدل «پرداخت بر اساس مصرف» و «توان عملیاتی تخصیصیافته (PTU)» است که امکان استقرار در مناطقی خاص مانند ایالات متحده و اتحادیه اروپا را فراهم میکند.
مناطق داده (Data Zones)
مناطق داده به دستیابی به توان عملیاتی بهتر، کاهش تأخیر و رعایت الزامات حاکمیت داده کمک میکنند. دو منطقه داده اصلی تعریف شدهاند:
منطقه داده ایالات متحده (US Data Zone)
منطقه داده اتحادیه اروپا (EU Data Zone)
با توجه به محدودیتهای ظرفیت مقطعی OpenAI در مناطق مختلف Azure، اکنون توانایی هدفگذاری یک منطقه جغرافیایی مانند EU (با دو منطقه فعال) امکان در دسترس بودن بیشتر سرویس را فراهم میسازد. علاوه بر این، استقرارهای استاندارد جدید بر پایه مناطق داده، از زیرساخت جهانی Azure بهره میبرند تا ترافیک را به مرکز دادهای با بهترین در دسترسبودن در منطقه داده مایکروسافت هدایت کنند. این نوع استقرار از مدلهایی مانند gpt-4o-2024-08-06
پشتیبانی میکند و سهمیه پیشفرض بیشتری ارائه میدهد.
کاهش هزینهها
هزینه واحدهای توان عملیاتی تخصیصیافته کاهش یافته و قیمت جهانی آن به ۱ دلار در ساعت رسیده است (پیشتر ۲ دلار بود). حداقل نیاز PTU نیز کاهش یافته و این امر استفاده را برای برنامههای کوچکتر در دسترستر میسازد. همچنین، Batch جهانی Azure OpenAI اکنون در دسترس عمومی قرار دارد و پردازش دستهای را با ۵۰٪ هزینه کمتر از مدل استاندارد جهانی و هدف زمان تحویل ۲۴ ساعته ارائه میدهد.
کش پرامپت (Prompt Caching)
از کش کردن پرامپتها پشتیبانی میشود؛ این ویژگی اجازه میدهد تا توکنسازی قبلی برای پرامپتهایی با کاراکترهای ابتدایی مشابه مجدداً استفاده شود و بدین ترتیب، مصرف محاسباتی کاهش یابد.
انعطافپذیری در انتخاب مدل
اکنون امکان تغییر مدل و نسخه در طول دوره رزرو فراهم شده است؛ مثلاً جابهجایی بین GPT-4 و GPT-4 mini.
پشتیبانی API و مدلها
مدلهای o1-preview
و o1-mini
اکنون از طریق API قابل دسترسی و استقرار هستند. ثبتنام برای استفاده الزامی است و دسترسی بر اساس معیارهای تأیید مایکروسافت ارائه میشود. پشتیبانی از سری مدلهای o1 در نسخه API با تاریخ 2024-09-01-preview
افزوده شده و پارامتر max_tokens
منسوخ و با max_completion_tokens
جایگزین شده است. این مدلها در مناطق East US2 و Sweden Central برای مشتریان تأییدشده در دسترس هستند.
API جدید GPT-4o Realtime
مدل صوتی Azure OpenAI GPT-4o بخشی از خانواده مدل GPT-4o است که از تعاملات گفتاری با تأخیر بسیار کم (speech in / speech out) پشتیبانی میکند. مدل gpt-4o-realtime-preview
در حال حاضر برای استقرار جهانی در مناطق East US2 و Sweden Central قابل استفاده است و برای مواردی مانند پشتیبانی زنده مشتریان، دستیارهای صوتی و مترجمهای لحظهای ایدهآل است.
گامهای بعدی
در راستای چارچوب پذیرش فضای ابری مایکروسافت (Cloud Adoption Framework)، خدماتی نظیر ارزیابی آمادگی فضای ابری با تمرکز بر هوش مصنوعی، کارگاههای نوآوری ابری برای توسعه قابلیتهای AI در سازمان شما، و بستههای شروع سریع هوش مصنوعی (AI Starter Packages) ارائه میدهیم که راهحلهای آماده استفاده بر پایه Microsoft AI Services (از جمله OpenAI و Copilot) را شامل میشوند.
نقش حیاتی رزروهای اختصاصی در زیرساخت هوش مصنوعی مدرن
رزروهای اختصاصی در Azure OpenAI به سازمانها اجازه میدهند با تعهد به استفاده از واحد توان عملیاتی اختصاصی (PTU) برای مدت یک ماه یا یک سال، هزینهها را کاهش دهند. این رزروها در دسترسبودن تضمینی و هزینههای قابل پیشبینی را ممکن میسازند. با انتخاب منطقه، نوع استقرار و مقدار مناسب، هزینهها در مقایسه با پرداخت ساعتی کاهش مییابند.
مدیریت فعالانه و نظارت دقیق بر این رزروها برای بهرهبرداری حداکثری ضروری است. دلایل آن:
بهینهسازی استفاده: نظارت مداوم تضمین میکند که رزروها با استفاده واقعی تطابق دارند و منابع هدر نمیروند.
انطباق با تغییرات تجاری: رزروها را میتوان با تغییر نیازها تنظیم کرد.
جلوگیری از تعهد بیش از حد: مدیریت پیشگیرانه از خرید بیش از اندازه جلوگیری میکند.
تقویت کنترل هزینه و پاسخگویی: ردیابی استفاده از رزروها به بهبود کنترل بودجه هوش مصنوعی کمک میکند.
بهرهبرداری از بینشهای کاربرد هوش مصنوعی: تحلیل استفاده، دیدی ارزشمند نسبت به عملکرد و الگوهای استفاده ارائه میدهد.
ارزش تبادل رزروهای اختصاصی
یکی از قدرتمندترین ویژگیهای رزروهای اختصاصی، قابلیت تبادل (Exchange) آنهاست. این قابلیت انعطافپذیری بالایی برای تطبیق با نیازهای در حال تحول کسبوکار فراهم میکند. تبادل رزروها از طریق Azure Portal یا Azure Reservation API قابل انجام است.
شرکت Contoso که یک شرکت فناوری جهانی است، از Azure OpenAI برای چتباتهای پشتیبانی مشتری و ابزارهای تولید محتوا استفاده میکند. با رشد کسبوکار، نیازهای هوش مصنوعی آنها تغییر کرد و قابلیت تبادل رزرو به شدت مفید واقع شد.
انواع تبادل رزروهای اختصاصی
Contoso از انواع مختلف تبادل برای بهینهسازی استفاده خود از Azure OpenAI استفاده کرد:
تبادل منطقهای (Region Exchange): Contoso در ابتدا رزرو خود را در منطقه East US انجام داده بود، اما با گسترش فعالیت به اروپای غربی، رزرو را به West Europe انتقال داد تا عملکرد بهینهتری برای کاربران آن منطقه حاصل شود.
تبادل نوع استقرار (Deployment Type Exchange): سه نوع استقرار وجود دارد: جهانی (Global)، منطقهای (Geography)، و منطقه داده خاص مایکروسافت. Contoso ابتدا از استقرار منطقهای استفاده کرد اما سپس به استقرار جهانی تغییر مسیر داد تا درخواستها از هر جایی پردازش شوند. این تغییر، صرفهجویی در هزینهها را نیز حفظ کرد.
تبادل مدت زمان (Term Exchange): ابتدا تعهد یکماهه داشتند اما بعد به تعهد یکساله تغییر دادند تا مدیریت بودجه آسانتر شود.
تبادل روش پرداخت (Payment Exchange): از پرداخت پیشپرداخت به پرداخت ماهانه تغییر دادند تا جریان نقدی خود را بهتر مدیریت کنند.
تغییر دامنه رزروها
با گسترش استفاده Contoso از Azure OpenAI در بخشهای مختلف، نیاز به تنظیم دامنه رزروها پیش آمد. Azure امکان تعیین دامنه رزروها را در سطح گروه منابع، اشتراکها، یا پروفایلهای صورتحسابی فراهم میکند. Contoso با استفاده از Microsoft Cost Management دامنه رزروهای خود را بهگونهای تنظیم کرد که هر بخش منابع مورد نیاز خود را داشته باشد.
تنظیم تمدید خودکار برای رزروها
برای جلوگیری از اختلال در خدمات و حفظ پیشبینیپذیری بودجه، Contoso تمدید خودکار رزروها را فعال کرد. مزایای تمدید خودکار:
تداوم خدمات
پیشبینیپذیری هزینه
کاهش بار مدیریتی
این قابلیت از طریق Azure Portal بهراحتی قابل فعالسازی است.
بررسی گزارش استفاده از رزروها
تیم مالی و فناوری اطلاعات Contoso بهطور منظم گزارش استفاده از رزروها را از Azure Cost Management بررسی میکنند تا از بهرهوری سرمایهگذاری خود مطمئن شوند. این گزارشها کمک میکنند:
منابع کماستفاده را شناسایی کنند
رزروها را مطابق استفاده واقعی تنظیم کنند
هزینهها را بهینه و بهرهوری را افزایش دهند
تنظیم هشدارهای استفاده
برای نظارت پیشگیرانه، Contoso هشدارهای استفاده را تنظیم کرده است. این هشدارها در صورت افت استفاده به زیر یک آستانه خاص، اطلاعرسانی میکنند.
مزایای این هشدارها:
دریافت اعلان بلادرنگ درباره تغییرات استفاده
تنظیم رزروها برای جلوگیری از اتلاف منابع
حفظ بهرهوری بهینه منابع
بهترین روشها برای مدیریت رزروهای اختصاصی Azure OpenAI
رزروهای اختصاصی ابزار قدرتمندی برای کنترل هزینه هستند، اما مدیریت فعالانه آنها کلید استفاده بهینه است. همانطور که در مثال Contoso دیدیم، بهترین روشها شامل موارد زیر است:
پایش منظم استفاده
تنظیمات و تبادلات استراتژیک
اجرای سیاستهای حاکمیتی
خودکارسازی هشدارها و گزارشها
با بهرهبرداری از انعطافپذیری تبادل رزروها و پیادهسازی این روشها، هر کسبوکاری میتواند سرمایهگذاریهای هوش مصنوعی خود را بهینه و بهرهوری بلندمدت را افزایش دهد.
مایکروسافت در بهروزرسانیهای اخیر سرویس Azure OpenAI تمرکز زیادی بر افزایش بهرهوری و انعطافپذیری در استفاده از منابع محاسباتی داشته است. یکی از مهمترین تغییرات، بهبود قابلیت «رزروهای اختصاصی» است که به سازمانها اجازه میدهد ظرفیت مشخصی از سرویس را برای مدت معین با هزینه کمتر و تضمین دسترسی رزرو کنند. این رزروها حالا قابل تبادل هستند، یعنی میتوان آنها را از نظر منطقه، مدت، نوع استقرار یا حتی مدل پرداخت تغییر داد تا با نیازهای متغیر سازمان هماهنگ شوند. این تغییرات در کنار کاهش هزینهها، ابزارهای گزارشگیری بهتر، و قابلیتهایی مانند تجدید خودکار، به کسبوکارها کمک میکنند هوشمندانهتر منابع را مدیریت کرده و از سرویس Azure OpenAI بهرهوری بیشتری بهدست آورند.