...

ZOOM, NETFLIX VÀ GRAB: CUỘC CHIẾN MỞ RỘNG KHI CẢ THẾ GIỚI CÙNG "NHẤN NÚT"

Cập nhật 14:47, 03/04/2025

1353 lượt xem

Admin

Hãy tưởng tượng bạn đang xem Netflix vào tối thứ Bảy, hàng triệu người trên toàn cầu cũng đang “cày” phim giống bạn, nhưng bạn vẫn stream mượt mà, không buffering. Hay bạn gọi xe Grab vào giờ tan tầm, lượng đơn hàng tăng vọt, nhưng ứng dụng vẫn tìm tài xế cho bạn trong tích tắc. Điều gì đứng sau những kỳ tích này? Đó chính là Scalability – khả năng mở rộng, và hôm nay mình sẽ kể bạn nghe câu chuyện về cách các “ông lớn” chuẩn bị cho những ngày nhu cầu bùng nổ.
Mình là một Business Analyst, và mình hiểu rằng trong thế giới công nghệ, nếu hệ thống không “chịu lớn” được, nó sẽ “chết” ngay khi áp lực ập đến. Cùng khám phá nhé!
1/ ĐẦU TIÊN LÀ NỀN TẢNG ZOOM VÀ KẾ HOẠCH CHO NGÀY MAI
- Năm 2020, khi cả thế giới chuyển sang làm việc online, Zoom đã phải nghĩ xa: “Nếu lượng người dùng tăng gấp 10 lần thì sao?” Từ 10.000 cuộc họp mỗi ngày, họ cần sẵn sàng cho 100.000 cuộc họp trong tương lai. Đây chính là Scalability – khả năng mở rộng để xử lý khối lượng công việc tăng vọt. Zoom làm được nhờ hệ thống đám mây (cloud infrastructure).
N- hưng “đám mây” là gì mà thần kỳ vậy? Nói đơn giản, thay vì dùng máy chủ cố định ở một nơi, Zoom đặt hệ thống trên các máy chủ ảo, nằm rải rác khắp thế giới, được quản lý bởi các nhà cung cấp như Amazon Web Services (AWS). Khi lượng người dùng tăng – ví dụ, từ 10.000 lên 100.000 người – hệ thống tự động “gọi thêm” máy chủ mới trong vài giây, giống như bạn gọi thêm bạn bè đến phụ giúp khi công việc quá tải. Tài nguyên được phân bổ ngay lập tức: thêm CPU, thêm băng thông, thêm bộ nhớ. Kết quả? Zoom đã sẵn sàng cho ngày cả thế giới cùng “nhấn nút” Join Meeting, mà không cần lo hệ thống sập.
2/ TIẾP NỮA LÀ NETFLIX VÀ CƠN SỐT PHIM TOÀN CẦU
- Chuyển cảnh sang Netflix, một tối thứ Bảy, lượng người xem tăng vọt từ 1 triệu lên 5 triệu người trên toàn cầu vì một bộ phim hot vừa ra mắt. Nếu hệ thống không mở rộng được, bạn sẽ chỉ thấy vòng xoay “buffering” đáng ghét.
- Netflix làm thế nào? Họ dùng hệ thống phân tán (distributed system) trên đám mây, với các máy chủ đặt ở nhiều khu vực – từ Mỹ, châu Âu đến châu Á. Khi lượng người xem tăng, Netflix tự động phân phối nội dung từ máy chủ gần bạn nhất, đồng thời tăng tài nguyên cho khu vực có nhu cầu cao. Nhờ vậy, bạn vẫn xem phim 4K mượt mà, dù cả thế giới cùng “cày” phim.
3/ RỒI THÌ GRAB VÀ GIỜ TAN TẦM BÃO TỐ
- Đến với Grab tại Việt Nam, vào giờ tan tầm, lượng đơn hàng tăng gấp 3 lần – từ 50.000 lên 150.000 đơn mỗi giờ. Nếu hệ thống không mở rộng được, bạn sẽ phải chờ mãi mà không có tài xế. Grab đã chuẩn bị bằng cách dùng kiến trúc microservices – chia nhỏ hệ thống thành các phần độc lập như đặt xe, thanh toán, và định vị.
- Khi lượng đơn tăng, họ chỉ cần “bơm” thêm tài nguyên cho phần đặt xe, mà không cần nâng cấp toàn bộ hệ thống. Kết quả? Bạn vẫn có xe đón đúng giờ, dù cả thành phố cùng gọi Grab.
4/ PHÂN BIỆT SCALABILITY VÀ PERFORMANCE: ĐỪNG NHẦM LẪN!
- Bạn có thể thắc mắc: “Scalability nghe giống Performance quá, phải không?” Mình cũng từng nghĩ vậy, nhưng thực ra chúng khác nhau rõ rệt. Performance (Hiệu suất) là về tốc độ và hiệu quả ngay bây giờ: hệ thống chạy nhanh thế nào với lượng người dùng hiện tại? Ví dụ: Shopee tải trang trong 2 giây với 10.000 người dùng, hay Grab tìm tài xế trong 5 giây với 50.000 đơn hàng.
- Còn Scalability (Khả năng mở rộng) là về tương lai: hệ thống có thể xử lý bao nhiêu người dùng hơn nữa nếu nhu cầu tăng? Ví dụ: Grab có thể tăng từ 50.000 lên 150.000 đơn mà không sập. Nói cách khác, Performance là “hệ thống chạy tốt thế nào hôm nay”, còn Scalability là “hệ thống có thể lớn hơn bao nhiêu ngày mai”. Hiểu rõ sự khác biệt này giúp bạn tránh nhầm lẫn khi làm việc với các yêu cầu hệ thống.
5/ MÌNH VIẾT YÊU CẦU SCALABILITY CHI TIẾT THẾ NÀO?
Là một Business Analyst, mình luôn phải viết yêu cầu Scalability rõ ràng để đội kỹ thuật hiểu và triển khai đúng. Dưới đây là cách mình viết yêu cầu chi tiết cho các ví dụ trên, và bạn cũng có thể áp dụng cách trình bày này:
- Zoom: “Hệ thống phải có khả năng mở rộng để xử lý từ 10.000 lên 100.000 cuộc họp đồng thời trong vòng 5 phút khi nhu cầu tăng, với thời gian thêm tài nguyên (scaling time) dưới 30 giây, sử dụng cloud infrastructure (AWS). Đo lường bằng load test với 100.000 người dùng giả lập.”
- Netflix: “Hệ thống phải mở rộng để hỗ trợ từ 1 triệu lên 5 triệu người xem đồng thời trong giờ cao điểm, đảm bảo không tăng độ trễ streaming quá 5% (tối đa 1 giây buffering), sử dụng hệ thống phân tán trên đám mây. Đo lường bằng stress test với 5 triệu luồng stream giả lập.”
- Grab: “Hệ thống phải mở rộng để xử lý từ 50.000 lên 150.000 đơn hàng mỗi giờ trong giờ cao điểm, với thời gian tìm tài xế không tăng quá 10% (tối đa 5,5 giây), sử dụng kiến trúc microservices và auto-scaling. Đo lường bằng load test với 150.000 đơn hàng giả lập.”
Hướng dẫn trình bày:
Khi viết yêu cầu Scalability, bạn cần:
  • (1) Xác định mức tăng trưởng (từ bao nhiêu lên bao nhiêu)
  • (2) Đưa ra tiêu chí đo lường (thời gian, độ trễ)
  • (3) Nêu công nghệ sử dụng (cloud, microservices)
  • (4) Đề xuất cách kiểm tra (load test, stress test). Cách viết này giúp yêu cầu rõ ràng, đo lường được, và dễ triển khai.
6/ KINH NGHIỆM BỎ TÚI CỦA MÌNH LÀ
Khi làm việc với Scalability, mình luôn phải nghĩ xa: “Hệ thống sẽ thế nào nếu lượng người dùng tăng gấp 10 lần?” Đầu tiên, mình hỏi khách hàng: “Bạn kỳ vọng hệ thống xử lý bao nhiêu người? Bao nhiêu giao dịch trong tương lai?” – ví dụ, 5 triệu người xem Netflix hay 150.000 đơn Grab mỗi giờ.
Sau đó, mình đề xuất cách kiểm tra: dùng load test để mô phỏng lượng truy cập tăng đột biến, xem hệ thống có “sống sót” không. Cuối cùng, mình phối hợp với đội kỹ thuật, đảm bảo họ thiết kế hệ thống với khả năng auto-scaling, như dùng đám mây hoặc microservices.
7/ TỔNG KẾT LẠI
Scalability là “lá chắn” giúp hệ thống không sụp đổ khi nhu cầu bùng nổ. Zoom, Netflix, Grab – họ thành công vì đã chuẩn bị cho những ngày “cả thế giới cùng nhấn nút”.
Là Business Analyst, mình học được rằng: không có hệ thống nào “nhỏ mãi”, và nếu không nghĩ đến mở rộng, bạn sẽ mất khách hàng ngay khi họ cần bạn nhất. Lần tới khi bạn xem phim hay gọi xe, hãy nhớ: Có cả một đội ngũ đang “bơm sức” để hệ thống không sập!
Bài này tiếp nối Series Non-Functional Requirement P2. Bạn nào chưa đọc phần trước thì tìm đọc lại cho đầy đủ nghen. Have a nice day!

CÓ THỂ BẠN QUAN TÂM

TÌM HIỂU VỀ TÀI LIỆU PRODUCT REQUIREMENTS DOCUMENT (PRD)

Trong quá trình phát triển sản phẩm, việc đảm bảo tất cả các bên liên quan đều hiểu rõ về mục tiêu, tính năng và cách thức hoạt động của sản phẩm là điều vô cùng quan trọng.PRD không chỉ giúp Product Manager truyền đạt rõ ràng ý tưởng sản phẩm mà còn là kim chỉ nam để các nhóm kỹ thuật và kinh doanh có thể phát triển, triển khai và tiếp thị sản phẩm hiệu quả. Hãy cùng True Skill Center tìm hiểu về loại tài liệu này thông qua bài viết bên dưới

5 Kỹ Năng Cần Có Để Trở Thành Một Product Owner Xuất Sắc

Trong ngành IT, vai trò của một Product Owner không chỉ dừng lại ở việc viết user stories hay quản lý backlog đơn thuần, một Product Owner xuất sắc chính là người cùng đưa ra quyết định và chịu trách nhiệm cho sản phẩm xuyên suốt từ giai đoạn ý tưởng ban đầu cho đến khi sản phẩm được triển khai ra thị trường. Cùng True Skill Center tìm hiểu 5 kỹ năng mà bất kỳ Product Owner nào cũng nên có và trau dồi bên dưới nhé!

TẤT TẦN TẬT “USER RESEARCH” (PHẦN 2)

Trong thế giới sản phẩm số, một ý tưởng hay chưa đủ để tạo nên thành công. Điều quan trọng là sản phẩm của bạn có thực sự phù hợp với End User hay không.

ITBA

TẤT TẦN TẬT “USER RESEARCH” (PHẦN 1)

Nghiên cứu người dùng trong Product Management đề cập đến quá trình có hệ thống thu thập và phân tích thông tin về người dùng của một sản phẩm hoặc dịch vụ.

Đăng kí nhận tư vấn

Hãy nhập ngay email của bạn vào form bên dưới để được nhận tư vấn trực tiếp từ trung tâm.