الگوریتم

عمومی

دیتابیس

مصاحبه

راهنمای مفهومی High Availability

این کتاب درباره این است که چگونه وب‌سایت‌ها و سرویس‌های دیجیتال را، فارغ از هر اتفاقی که می‌افتد، آنلاین نگه داریم. هدف ما در اینجا این است که مفاهیم پیچیده مهندسی را ساده کنیم و با استفاده از مثال‌ها و داستان‌های ملموس، آن‌ها را توضیح دهیم. این کتاب برای کسانی نوشته شده که می‌خواهند بدون درگیر شدن با جزئیات فنی سنگین، اصول کار را یاد بگیرند.

126 دانشجو

2h, 50m

19 جلسه

مقدماتی

مدرسین:

بهمن شادمهر

خرید دوره

رایگان

درباره‌ی دوره

درباره این کتاب

فهرست مطالب

بخش ۱: زیربنا و هدف (The Foundation & The Goal)

۱. مقدمه: چرا "Up" بودن مهم است؟

هزینه واقعی Downtime (پول و اعتبار).
معنای واقعی "High Availability".
داستان "Nines": تفاوت ۹۹.۹٪ با ۹۹.۹۹۹٪.
Scale Perspectives: وقتی ترافیک از ۱۰۰ به ۵۰۰,۰۰۰ درخواست در ثانیه می‌رسد چه تغییری می‌کند؟

۲. فیزیکِ Performance (متریک‌ها)

Latency: زمان سفر (رفت و برگشت).
Throughput: ظرفیت بزرگراه (تعداد خودروها).
Bandwidth: پهنای لوله.
The Trade-off: چرا همیشه نمی‌توانیم همزمان سرعت و حجم بالا داشته باشیم.
Response Time: حسی که کاربر از سرعت دارد.

۳. اندازه‌گیری Reliability (خط‌کش اندازه‌گیری)

SLA (Service Level Agreement): قولی که به مشتری می‌دهیم.
SLO (Service Level Objective): هدفی که خودمان داریم.
SLI (Service Level Indicator): چیزی که در واقعیت اتفاق می‌افتد.
MTTR و MTTF: سرعت تعمیر در برابر مدت زمان کارکردن بدون خرابی.

بخش ۲: سرعت و کارایی (لایه Caching)

۴. اینترنت واقعاً چگونه کار می‌کند (به زبان ساده)

سفر یک کلیک: از مانیتور شما تا سرور و برگشت.
پروتکل‌ها: HTTP (مکالمه) و TCP/IP (پستچی).
Compression: فشرده‌سازی برای سفر سریع‌تر.

۵. هنر به خاطر سپردن (Caching)

مفهوم Caching (مثال "کوله پشتی").
Browser Caching: حافظه مرورگر شما.
DNS Caching: دفترچه تلفن اینترنت.
CDN: نزدیک کردن محتوا به کاربر.
استراتژی‌ها: Cache-Aside و Write-Through.
مشکلات رایج: وقتی کش دردسرساز می‌شود (Stale Data و Cache Stampede).

بخش ۳: طراحی نرم‌افزار Reliable (منطق)

۶. معماری Application

Stateless Systems: چرا سرورها باید "حافظه ماهی قرمز" داشته باشند.
Microservices vs Monoliths: تکه‌تکه کردن برنامه برای امنیت بیشتر.
API Gateways: مسئول پذیرش.
Serverless: تمرکز روی کد به جای سرور.

۷. مهندسی برای سرعت و Scale

Algorithmic Efficiency: چرا کدهای بد در مقیاس بالا فاجعه می‌سازند.
Data Structures: انتخاب ظرف مناسب برای دیتا.
Concurrency vs Parallelism: انجام کارهای همزمان.
انتخاب ابزار: استفاده از ابزار درست برای هر کار.

۸. مدیریت الگوهای Traffic

صف‌ها (Queues): اتاق انتظار برای مدیریت ترافیک.
Asynchronous Processing: انجام کارها در پس‌زمینه.
Rate Limiting: جلوگیری از شلوغی بیش از حد.
Throttling: کنترل سرعت به جای مسدود کردن.

۹. مکانیسم‌های ایمنی در کد

Idempotency: جلوگیری از پرداخت تکراری.
Timeouts و Retries: کی صبر کنیم و کی دوباره تلاش کنیم.
Exponential Backoff: صبر هوشمندانه.
Circuit Breakers: فیوزهایی برای جلوگیری از سوختن سیستم.
Feature Flags: کنترل امکانات بدون تغییر کد.

بخش ۴: لایه Data (حافظه)

۱۰. مدیریت Data در Scale

Replication: کپی کردن دیتا برای روز مبادا.
Sharding: تقسیم کردن دیتابیس‌های غول‌پیکر.
Connection Pooling: مدیریت خطوط ارتباطی.
Indexing: فهرست‌بندی برای جستجوی سریع.
Query Optimization: نوشتن کوئری‌های بهینه.

۱۱. جابجایی Data و Consistency

Batch vs Stream: جابجایی با کامیون یا لوله؟
Push vs Pull: خبر کردن یا پرسیدن؟
ACID vs BASE: دقت بانکی یا سرعت شبکه‌های اجتماعی؟
The CAP Theorem: انتخاب بین Consistency و Availability.

بخش ۵: ضدگلوله کردن Infrastructure (سخت‌افزار)

۱۲. Redundancy و Scaling

Load Balancing: توزیع ترافیک (لایه ۴ و ۷).
الگوریتم‌ها: روش‌های انتخاب سرور.
Horizontal vs Vertical Scaling: تعداد بیشتر یا قدرت بیشتر؟
Auto-Scaling: تغییر سایز خودکار.

۱۳. استراتژی‌های Disaster Recovery

Availability Zones: محافظت در برابر حوادث محلی.
Multi-Region: محافظت در برابر حوادث منطقه‌ای.
انواع Failover: آماده‌باش Hot، Warm و Cold.

بخش ۶: عامل انسانی و Operations

۱۴. چه کسی چراغ‌ها را روشن نگه می‌دارد؟

DevOps و SRE: نقش‌ها و فرهنگ.
On-Call: مدیریت شیفت‌های اضطراری.
Runbooks: دستورالعمل‌های زمان بحران.

۱۵. تعالی عملیاتی

CI/CD: اتوماسیون در توسعه و عرضه.
Blue/Green Deployments: آپدیت بدون قطعی.
Canary Releases: تست روی جمعیت کم.
Observability: دیدن داخل سیستم (Logging, Metrics, Tracing).

بخش ۷: مدیریت آشوب، Security و اقتصاد

۱۶. Security به عنوان Availability

DDoS: حمله با ارتش زامبی‌ها.
WAF: فایروال هوشمند وب.
Bot Mitigation: مدیریت ربات‌ها.

۱۷. برنامه‌ریزی برای بدترین شرایط

RPO و RTO: چقدر دیتا و زمان می‌توانیم از دست بدهیم؟
Chaos Engineering: تمرین شکست برای قوی‌تر شدن.

۱۸. اقتصادِ Uptime

FinOps: مدیریت هزینه‌ها.
Diminishing returns: هزینه رسیدن به ۱۰۰٪.

نتیجه‌گیری

۱۹. فلسفه Reliability

طراحی برای شکست.
اعتماد سازی.

رایگان

دسترسی کامل به محتوای دوره

مدت زمان

2h, 50m

تعداد جلسات

19 جلسه

رایگان

خرید دوره

راهنمای مفهومی High Availability

درباره‌ی دوره

درباره این کتاب

فهرست مطالب

بخش ۱: زیربنا و هدف (The Foundation & The Goal)

بخش ۲: سرعت و کارایی (لایه Caching)

بخش ۳: طراحی نرم‌افزار Reliable (منطق)

بخش ۴: لایه Data (حافظه)

بخش ۵: ضدگلوله کردن Infrastructure (سخت‌افزار)

بخش ۶: عامل انسانی و Operations

بخش ۷: مدیریت آشوب، Security و اقتصاد

نتیجه‌گیری

سرفصل‌های دوره

بخش ۱: زیربنا و هدف (The Foundation & The Goal)

فصل ۱: مقدمه – چرا "Up" بودن مهم است؟

فصل ۲: فیزیکِ Performance (متریک‌ها)

فصل ۳: اندازه‌گیری Reliability (خط‌کش اندازه‌گیری)

بخش ۲: سرعت و کارایی (لایه Caching)

فصل ۴: اینترنت واقعاً چگونه کار می‌کند (به زبان ساده)

فصل ۵: هنر به خاطر سپردن (Caching)

بخش ۳: طراحی نرم‌افزار Reliable (منطق)

فصل ۶: معماری Application

فصل ۷: مهندسی برای سرعت و Scale

فصل ۸: مدیریت الگوهای Traffic

فصل ۹: مکانیسم‌های ایمنی در کد

بخش ۴: لایه Data (حافظه)

فصل ۱۰: مدیریت Data در Scale

فصل ۱۱: جابجایی Data و Consistency

بخش ۵: ضدگلوله کردن Infrastructure (سخت‌افزار)

فصل ۱۲: Redundancy و Scaling

فصل ۱۳: استراتژی‌های Disaster Recovery

بخش ۶: عامل انسانی و Operations

فصل ۱۴: چه کسی چراغ‌ها را روشن نگه می‌دارد؟

فصل ۱۵: تعالی عملیاتی

بخش ۷: مدیریت آشوب، Security و اقتصاد

فصل ۱۶: Security به عنوان Availability

فصل ۱۷: برنامه‌ریزی برای بدترین شرایط

فصل ۱۸: اقتصادِ Uptime

نتیجه‌گیری

فصل ۱۹: نتیجه‌گیری – فلسفه Reliability

دسترسی محدود

مدرسین دوره

بهمن شادمهر

درباره استاد

نظرات دانشجویان

هنوز نظری ثبت نشده

سوالات متداول

سوالات متداول

رایگان