آخرین به‌روزرسانی‌های سرویس Azure OpenAI : حداکثرسازی بهره‌وری با مدیریت و تبادل رزروهای اختصاصی در Azure OpenAI Service

در حوزه هوش مصنوعی، کسب‌وکارها با چالش‌های بی‌سابقه‌ای برای مدیریت بهینه منابع محاسباتی روبه‌رو هستند. به همین دلیل، سرویس Azure OpenAI به عنوان بستری حیاتی برای سازمان‌هایی که به دنبال بهره‌برداری از قابلیت‌های پیشرفته هوش مصنوعی هستند مطرح می‌شود، و رزروهای اختصاصی (Provisioned Reservations) به استراتژی‌ای هوشمندانه برای صرفه‌جویی در هزینه‌ها تبدیل شده‌اند.

از آنجا که نیازهای کسب‌وکار دائماً در حال تغییر است، انعطاف‌پذیری در مدیریت این رزروها بسیار مهم است. در این مطلب، علاوه بر بررسی اهمیت رزروهای اختصاصی در عملیات هوش مصنوعی از نظر تاب‌آوری و بهره‌وری هزینه‌ای، با دنبال کردن شرکت خیالی Contoso، سناریوهای واقعی‌ای را بررسی می‌کنیم که نشان می‌دهند چگونه تبادل رزروها به مقیاس‌پذیری بهتر و کنترل بیشتر بر بودجه منجر می‌شود.

Azure OpenAI یک سرویس قدرتمند مبتنی بر فضای ابری است که دسترسی به مدل‌های پیشرفته یادگیری ماشین OpenAI را فراهم می‌کند. این سرویس به توسعه‌دهندگان امکان می‌دهد تا برنامه‌های هوش مصنوعی را با سهولت و کارایی بی‌نظیر بسازند و استقرار دهند. این پلتفرم طیف گسترده‌ای از قابلیت‌ها، از پردازش زبان طبیعی تا شناسایی تصویر را ارائه می‌دهد که برای کسب‌وکارهایی که به‌دنبال بهره‌گیری از فناوری هوش مصنوعی هستند، بسیار ارزشمند است.

آشنایی با گزینه‌های پرداخت: PAYG در برابر PTU

در استفاده از Azure OpenAI، مشتریان دو گزینه اصلی برای مدیریت مصرف و هزینه دارند:

پرداخت بر اساس مصرف (Pay-As-You-Go - PAYG)

در مدل PAYG، کاربران فقط برای منابعی که استفاده می‌کنند پرداخت می‌نمایند. این مدل برای برنامه‌هایی با ترافیک متغیر یا غیرقابل پیش‌بینی ایده‌آل است، زیرا انعطاف‌پذیری بالایی دارد و به جلوگیری از هزینه‌های غیرضروری کمک می‌کند. هزینه‌ها بر اساس تعداد توکن‌های پردازش‌شده و سایر معیارهای مصرف محاسبه می‌شود، و این گزینه‌ای مقیاس‌پذیر و شفاف برای بسیاری از سناریوهاست.

واحدهای توان عملیاتی تخصیص‌یافته (Provisioned Throughput Units - PTU)

در مقابل، مدل PTU راهکاری قابل پیش‌بینی‌تر و تحت کنترل‌تر برای مدیریت بارهای کاری هوش مصنوعی ارائه می‌دهد. با تخصیص مقدار مشخصی از توان عملیاتی، مشتریان می‌توانند عملکرد و تأخیر پایدار را برای برنامه‌های خود تضمین کنند. این مدل به‌ویژه برای محیط‌های تولید با الگوهای ترافیکی تعریف‌شده و ثابت مناسب است و پیش‌بینی ظرفیت و مدیریت هزینه‌ها را آسان می‌کند.


چه زمانی از مدل PTU استفاده کنیم؟

استفاده از واحدهای PTU زمانی توصیه می‌شود که نیازهای توان عملیاتی شما مشخص و قابل پیش‌بینی باشد. این معمولاً زمانی است که یک برنامه برای استفاده تولیدی آماده است یا قبلاً در محیط تولید راه‌اندازی شده و حجم ترافیک آن به‌خوبی مشخص است. سناریوهای کلیدی شامل:

  • برنامه‌هایی که آماده ورود به محیط تولید هستند یا در آن مستقر شده‌اند.

  • برنامه‌هایی با الگوهای مصرف یا ظرفیت پیش‌بینی‌پذیر.

  • برنامه‌هایی با نیازهای لحظه‌ای یا حساس به تأخیر.

درک دقیق مصرف مورد انتظار توکن در دقیقه (TPM)، به‌ویژه برای موارد استفاده مرتبط با فراخوانی توابع یا عامل‌های هوشمند، قبل از مهاجرت به PTU بسیار مهم است.

تغییرات مدل PTU که در آگوست ۲۰۲۴ اعلام شد:

در آگوست ۲۰۲۴، مایکروسافت به‌روزرسانی‌های مهمی در مدل PTU ارائه داد که بر اساس بازخورد مشتریان طراحی شده و هدف آن افزایش قابلیت استفاده و چابکی عملیاتی است. این تغییرات عبارت‌اند از:

  • سهمیه مستقل از مدل
    تغییر از سهمیه‌های اختصاصی مدل به سهمیه مستقل، مدیریت سهمیه را ساده‌تر کرده و امکان آزمایش سریع‌تر مدل‌های جدید را فراهم می‌کند. اکنون یک سهمیه واحد برای تمام مدل‌ها و نسخه‌ها در یک اشتراک و منطقه اعمال می‌شود.

  • درخواست سهمیه به‌صورت سلف‌سرویس
    کاربران اکنون می‌توانند بدون نیاز به ارتباط با تیم فروش، درخواست افزایش سهمیه بدهند و بسیاری از درخواست‌ها به‌صورت خودکار تأیید می‌شوند.

  • مدل تجاری ساعتی / رزرو جدید
    این مدل جدید امکان پرداخت ساعتی و همچنین تخفیف‌های چشمگیر برای تعهدات زمانی (یک‌ماهه یا یک‌ساله) از طریق رزروهای Azure را فراهم می‌کند.

  • سهمیه پیش‌فرض در بسیاری از مناطق
    اشتراک‌های جدید و موجود اکنون به‌طور پیش‌فرض سهمیه‌ای کوچک در بسیاری از مناطق دریافت می‌کنند، و نیازی به درخواست اولیه برای فعال‌سازی منطقه نیست.

  • پشتیبانی از نسل‌های جدید مدل‌ها
    برای استقرار مدل‌هایی که پس از ۱ آگوست ۲۰۲۴ منتشر شده‌اند، استفاده از مدل ساعتی/رزروی الزامی است، تا مشتریان بتوانند از پیشرفت‌های جدید در فناوری AI بهره‌مند شوند.

  • شفافیت بیشتر در ظرفیت
    ابزارها و APIهای جدید اطلاعات لحظه‌ای درباره ظرفیت در دسترس ارائه می‌دهند، و به کاربران کمک می‌کنند مناطقی با ظرفیت مناسب برای استقرار مدل‌های خود را شناسایی کنند. این امر زمان استقرار را کاهش داده و روند عرضه به بازار را تسریع می‌کند.

این به‌روزرسانی‌ها نشان‌دهنده تعهد مستمر مایکروسافت به بهبود سرویس Azure OpenAI است — سرویس را انعطاف‌پذیرتر، کاربرپسندتر و منطبق‌تر با نیازهای برنامه‌های هوش مصنوعی مدرن می‌سازد.

• آخرین به‌روزرسانی‌های سرویس Azure OpenAI : حداکثرسازی بهره‌وری با مدیریت و تبادل رزروهای اختصاصی در Azure OpenAI Service مرداد 1404

به‌روزرسانی‌های سرویس Azure OpenAI

در این به‌روزرسانی، تغییرات کلیدی و قابلیت‌های جدیدی معرفی شده‌اند که شامل گزینه‌های متنوع استقرار، تمرکز بر مناطق داده (Data Zones) و بهبود تاب‌آوری (Resiliency) می‌شود. یکی از نکات مهم، معرفی مناطق داده برای هر دو مدل «پرداخت بر اساس مصرف» و «توان عملیاتی تخصیص‌یافته (PTU)» است که امکان استقرار در مناطقی خاص مانند ایالات متحده و اتحادیه اروپا را فراهم می‌کند.

مناطق داده (Data Zones)

مناطق داده به دستیابی به توان عملیاتی بهتر، کاهش تأخیر و رعایت الزامات حاکمیت داده کمک می‌کنند. دو منطقه داده اصلی تعریف شده‌اند:

  • منطقه داده ایالات متحده (US Data Zone)

  • منطقه داده اتحادیه اروپا (EU Data Zone)

با توجه به محدودیت‌های ظرفیت مقطعی OpenAI در مناطق مختلف Azure، اکنون توانایی هدف‌گذاری یک منطقه جغرافیایی مانند EU (با دو منطقه فعال) امکان در دسترس بودن بیشتر سرویس را فراهم می‌سازد. علاوه بر این، استقرارهای استاندارد جدید بر پایه مناطق داده، از زیرساخت جهانی Azure بهره می‌برند تا ترافیک را به مرکز داده‌ای با بهترین در دسترس‌بودن در منطقه داده مایکروسافت هدایت کنند. این نوع استقرار از مدل‌هایی مانند gpt-4o-2024-08-06 پشتیبانی می‌کند و سهمیه پیش‌فرض بیشتری ارائه می‌دهد.

کاهش هزینه‌ها

هزینه واحدهای توان عملیاتی تخصیص‌یافته کاهش یافته و قیمت جهانی آن به ۱ دلار در ساعت رسیده است (پیش‌تر ۲ دلار بود). حداقل نیاز PTU نیز کاهش یافته و این امر استفاده را برای برنامه‌های کوچکتر در دسترس‌تر می‌سازد. همچنین، Batch جهانی Azure OpenAI اکنون در دسترس عمومی قرار دارد و پردازش دسته‌ای را با ۵۰٪ هزینه کمتر از مدل استاندارد جهانی و هدف زمان تحویل ۲۴ ساعته ارائه می‌دهد.

کش پرامپت (Prompt Caching)

از کش کردن پرامپت‌ها پشتیبانی می‌شود؛ این ویژگی اجازه می‌دهد تا توکن‌سازی قبلی برای پرامپت‌هایی با کاراکترهای ابتدایی مشابه مجدداً استفاده شود و بدین ترتیب، مصرف محاسباتی کاهش یابد.

انعطاف‌پذیری در انتخاب مدل

اکنون امکان تغییر مدل و نسخه در طول دوره رزرو فراهم شده است؛ مثلاً جابه‌جایی بین GPT-4 و GPT-4 mini.

پشتیبانی API و مدل‌ها

مدل‌های o1-preview و o1-mini اکنون از طریق API قابل دسترسی و استقرار هستند. ثبت‌نام برای استفاده الزامی است و دسترسی بر اساس معیارهای تأیید مایکروسافت ارائه می‌شود. پشتیبانی از سری مدل‌های o1 در نسخه API با تاریخ 2024-09-01-preview افزوده شده و پارامتر max_tokens منسوخ و با max_completion_tokens جایگزین شده است. این مدل‌ها در مناطق East US2 و Sweden Central برای مشتریان تأییدشده در دسترس هستند.

API جدید GPT-4o Realtime

مدل صوتی Azure OpenAI GPT-4o بخشی از خانواده مدل GPT-4o است که از تعاملات گفتاری با تأخیر بسیار کم (speech in / speech out) پشتیبانی می‌کند. مدل gpt-4o-realtime-preview در حال حاضر برای استقرار جهانی در مناطق East US2 و Sweden Central قابل استفاده است و برای مواردی مانند پشتیبانی زنده مشتریان، دستیارهای صوتی و مترجم‌های لحظه‌ای ایده‌آل است.

گام‌های بعدی

در راستای چارچوب پذیرش فضای ابری مایکروسافت (Cloud Adoption Framework)، خدماتی نظیر ارزیابی آمادگی فضای ابری با تمرکز بر هوش مصنوعی، کارگاه‌های نوآوری ابری برای توسعه قابلیت‌های AI در سازمان شما، و بسته‌های شروع سریع هوش مصنوعی (AI Starter Packages) ارائه می‌دهیم که راه‌حل‌های آماده استفاده بر پایه Microsoft AI Services (از جمله OpenAI و Copilot) را شامل می‌شوند.

نقش حیاتی رزروهای اختصاصی در زیرساخت هوش مصنوعی مدرن

رزروهای اختصاصی در Azure OpenAI به سازمان‌ها اجازه می‌دهند با تعهد به استفاده از واحد توان عملیاتی اختصاصی (PTU) برای مدت یک ماه یا یک سال، هزینه‌ها را کاهش دهند. این رزروها در دسترس‌بودن تضمینی و هزینه‌های قابل پیش‌بینی را ممکن می‌سازند. با انتخاب منطقه، نوع استقرار و مقدار مناسب، هزینه‌ها در مقایسه با پرداخت ساعتی کاهش می‌یابند.

مدیریت فعالانه و نظارت دقیق بر این رزروها برای بهره‌برداری حداکثری ضروری است. دلایل آن:

  • بهینه‌سازی استفاده: نظارت مداوم تضمین می‌کند که رزروها با استفاده واقعی تطابق دارند و منابع هدر نمی‌روند.

  • انطباق با تغییرات تجاری: رزروها را می‌توان با تغییر نیازها تنظیم کرد.

  • جلوگیری از تعهد بیش از حد: مدیریت پیش‌گیرانه از خرید بیش از اندازه جلوگیری می‌کند.

  • تقویت کنترل هزینه و پاسخ‌گویی: ردیابی استفاده از رزروها به بهبود کنترل بودجه هوش مصنوعی کمک می‌کند.

  • بهره‌برداری از بینش‌های کاربرد هوش مصنوعی: تحلیل استفاده، دیدی ارزشمند نسبت به عملکرد و الگوهای استفاده ارائه می‌دهد.

ارزش تبادل رزروهای اختصاصی

یکی از قدرتمندترین ویژگی‌های رزروهای اختصاصی، قابلیت تبادل (Exchange) آن‌هاست. این قابلیت انعطاف‌پذیری بالایی برای تطبیق با نیازهای در حال تحول کسب‌وکار فراهم می‌کند. تبادل رزروها از طریق Azure Portal یا Azure Reservation API قابل انجام است.

شرکت Contoso که یک شرکت فناوری جهانی است، از Azure OpenAI برای چت‌بات‌های پشتیبانی مشتری و ابزارهای تولید محتوا استفاده می‌کند. با رشد کسب‌وکار، نیازهای هوش مصنوعی آن‌ها تغییر کرد و قابلیت تبادل رزرو به شدت مفید واقع شد.

انواع تبادل رزروهای اختصاصی

Contoso از انواع مختلف تبادل برای بهینه‌سازی استفاده خود از Azure OpenAI استفاده کرد:

  • تبادل منطقه‌ای (Region Exchange): Contoso در ابتدا رزرو خود را در منطقه East US انجام داده بود، اما با گسترش فعالیت به اروپای غربی، رزرو را به West Europe انتقال داد تا عملکرد بهینه‌تری برای کاربران آن منطقه حاصل شود.

  • تبادل نوع استقرار (Deployment Type Exchange): سه نوع استقرار وجود دارد: جهانی (Global)، منطقه‌ای (Geography)، و منطقه داده خاص مایکروسافت. Contoso ابتدا از استقرار منطقه‌ای استفاده کرد اما سپس به استقرار جهانی تغییر مسیر داد تا درخواست‌ها از هر جایی پردازش شوند. این تغییر، صرفه‌جویی در هزینه‌ها را نیز حفظ کرد.

  • تبادل مدت زمان (Term Exchange): ابتدا تعهد یک‌ماهه داشتند اما بعد به تعهد یک‌ساله تغییر دادند تا مدیریت بودجه آسان‌تر شود.

  • تبادل روش پرداخت (Payment Exchange): از پرداخت پیش‌پرداخت به پرداخت ماهانه تغییر دادند تا جریان نقدی خود را بهتر مدیریت کنند.

تغییر دامنه رزروها

با گسترش استفاده Contoso از Azure OpenAI در بخش‌های مختلف، نیاز به تنظیم دامنه رزروها پیش آمد. Azure امکان تعیین دامنه رزروها را در سطح گروه منابع، اشتراک‌ها، یا پروفایل‌های صورتحسابی فراهم می‌کند. Contoso با استفاده از Microsoft Cost Management دامنه رزروهای خود را به‌گونه‌ای تنظیم کرد که هر بخش منابع مورد نیاز خود را داشته باشد.

تنظیم تمدید خودکار برای رزروها

برای جلوگیری از اختلال در خدمات و حفظ پیش‌بینی‌پذیری بودجه، Contoso تمدید خودکار رزروها را فعال کرد. مزایای تمدید خودکار:

  • تداوم خدمات

  • پیش‌بینی‌پذیری هزینه

  • کاهش بار مدیریتی

این قابلیت از طریق Azure Portal به‌راحتی قابل فعال‌سازی است.

بررسی گزارش استفاده از رزروها

تیم مالی و فناوری اطلاعات Contoso به‌طور منظم گزارش استفاده از رزروها را از Azure Cost Management بررسی می‌کنند تا از بهره‌وری سرمایه‌گذاری خود مطمئن شوند. این گزارش‌ها کمک می‌کنند:

  • منابع کم‌استفاده را شناسایی کنند

  • رزروها را مطابق استفاده واقعی تنظیم کنند

  • هزینه‌ها را بهینه و بهره‌وری را افزایش دهند

تنظیم هشدارهای استفاده

برای نظارت پیش‌گیرانه، Contoso هشدارهای استفاده را تنظیم کرده است. این هشدارها در صورت افت استفاده به زیر یک آستانه خاص، اطلاع‌رسانی می‌کنند.

مزایای این هشدارها:

  • دریافت اعلان بلادرنگ درباره تغییرات استفاده

  • تنظیم رزروها برای جلوگیری از اتلاف منابع

  • حفظ بهره‌وری بهینه منابع

بهترین روش‌ها برای مدیریت رزروهای اختصاصی Azure OpenAI

رزروهای اختصاصی ابزار قدرتمندی برای کنترل هزینه هستند، اما مدیریت فعالانه آن‌ها کلید استفاده بهینه است. همان‌طور که در مثال Contoso دیدیم، بهترین روش‌ها شامل موارد زیر است:

  • پایش منظم استفاده

  • تنظیمات و تبادلات استراتژیک

  • اجرای سیاست‌های حاکمیتی

  • خودکارسازی هشدارها و گزارش‌ها

با بهره‌برداری از انعطاف‌پذیری تبادل رزروها و پیاده‌سازی این روش‌ها، هر کسب‌وکاری می‌تواند سرمایه‌گذاری‌های هوش مصنوعی خود را بهینه و بهره‌وری بلندمدت را افزایش دهد.

 

مایکروسافت در به‌روزرسانی‌های اخیر سرویس Azure OpenAI تمرکز زیادی بر افزایش بهره‌وری و انعطاف‌پذیری در استفاده از منابع محاسباتی داشته است. یکی از مهم‌ترین تغییرات، بهبود قابلیت «رزروهای اختصاصی» است که به سازمان‌ها اجازه می‌دهد ظرفیت مشخصی از سرویس را برای مدت معین با هزینه کمتر و تضمین دسترسی رزرو کنند. این رزروها حالا قابل تبادل هستند، یعنی می‌توان آن‌ها را از نظر منطقه، مدت، نوع استقرار یا حتی مدل پرداخت تغییر داد تا با نیازهای متغیر سازمان هماهنگ شوند. این تغییرات در کنار کاهش هزینه‌ها، ابزارهای گزارش‌گیری بهتر، و قابلیت‌هایی مانند تجدید خودکار، به کسب‌وکارها کمک می‌کنند هوشمندانه‌تر منابع را مدیریت کرده و از سرویس Azure OpenAI بهره‌وری بیشتری به‌دست آورند.

3.9/5 - (10 نظر)

دیگر مطالب

مایکروسافت لایسنس(شرکت رایان نت) به عنوان اولین تأمین کننده رسمی لایسنس‌های اصلی محصولات مایکروسافت و تنها همکار تجاری رسمی مایکروسافت در ایران (Microsoft Partner)، با سابقه فعالیت بیش از یک دهه در واردات عمده محصولات اورجینال مایکروسافت و همکاری با بیش از 200 هولدینگ و سازمان دولتی، خصوصی و بین‌المللی شاخص و مطرح در ایران و همچنین ارائه خدمات به بیش از پنج هزار مشتری حقیقی و حقوقی، با وجود تحریم های آمریکا، به واسطه شخصیت حقوقی مستقل خود در انگلستان Talee Limited، به عنوان Partner & Solution Provider رسمی مایکروسافت مشغول به فعالیت است. با توجه به حجم موجودی شرکت، تمامی محصولات به صورت فوری تحویل داده می‌شوند و دارای پشتیبانی، گارانتی و همچنین پشتیبانی فنی مایکروسافت هستند. علاوه بر این، لازم به ذکر است که هیچ یک از محصولات ارائه شده از نوع OEM ،Academic یا Charity نیستند و تمامی محصولات با لایسنس Retail و یا Volume License معتبر و قابل استعلام از مایکروسافت ارائه می‌شوند. مایکروسافت لایسنس به عنوان یک تأمین کننده رسمی، با فعالیت طولانی در ارائه محصولات اصلی مایکروسافت و تجربه ارائه خدمات به بسیاری از سازمان‌های خصوصی و دولتی برجسته کشور، افتخار دارد که تمام محصولات نرم‌افزاری مایکروسافت را بدون واسطه و با شرایط تحویل آنی و با تضمین بهترین قیمت (بر اساس نوع لایسنس و شرایط استفاده) به صورت مستقیم عرضه نماید.

برخی از مزایای نسخه‌های اورجینال

افزایش کارایی و سرعت رایانه

پشتیبانی مایکروسافت

امکان دریافت به روز رسانی به صورت واقعی

امنیت بیشتر در مقابل بدافزارها و حملات

پایداری بیشتر در مقایسه با نسخه های جعلی

رعایت قوانین و مقررات

امکان استفاده همیشگی از جواز ویندوز

دریافت نرم افزارهای کاربردی از مایکروسافت که نیاز به ویندوز اصل دارند

بدون نیاز به تعویض های مکرر سیستم عامل نسبت به نمونه کپی

توانایی تشخیص و عیب یابی به وسیله بخش عیب یابی سیستم عامل

سبد خرید
ما از کوکی ها استفاده می کنیم تا اطمینان حاصل کنیم که بهترین تجربه را در وب سایت خود به شما ارائه می دهیم.
خانه
0 مورد سبد خرید
حساب من
منو