• Yen Truong

OPERATIONAL EXCELLENCE - TRỤ CỘT ĐẦU TIÊN TRONG KHUNG KIẾN TRÚC TỐI ƯU CƠ SỞ HẠ TẦNG

Đối với bất kỳ kỹ sư đám mây nào, nền tảng hạ tầng là một vấn đề cốt lõi, quyết định đến chất lượng sản phẩm cuối cùng. Khung kiến trúc được coi là vấn đề tiên quyết, giúp kiến trúc sư đám mây xây dựng hạ tầng cho ứng dụng một cách an toàn, linh hoạt và hiệu quả. Có 5 trụ cột chính trong khung này, bao gồm: Operational Excellence (hiệu quả tổ chức), Security (bảo mật), Reliability (độ tin cậy), Performance Efficiency (hiệu suất hoạt động), và Cost Optimization (tối ưu hóa chi phí). Theo đó, khung kiến trúc giúp bảo mật và toàn vẹn dữ liệu, xác định và quản lý với từng đặc quyền riêng biệt, bảo toàn hệ thống, kiểm soát và phát hiện các sự kiện liên quan đến bảo mật (security events).


Để có thể xây dựng được một khung kiến trúc tốt và bền vững, việc thấu hiểu từng trụ cột là điều cần thiết. Qua đó, các kỹ sư đám mây có thể xây dựng được nền tảng hạ tầng vững chắc và hoạt động hiệu quả. Bài viết dưới đây sẽ giới thiệu về tiêu chí đầu tiên trong khung kiến trúc này - Operational Excellence (Hiệu quả tổ chức).


Operational Excellence là gì?


Tiêu chí Operational Excellence bao gồm khả năng chạy và giám sát các hệ thống để cung cấp giá trị kinh doanh và liên tục cải thiện các quy trình, thủ tục hỗ trợ.


Chiến lược để đạt được Operational Excellence:

  • Tự động xây dựng, thử nghiệm và triển khai: Sử dụng các đường dẫn tích hợp và triển khai liên tục (CI / CD) để xây dựng thử nghiệm tự động vào các bản phát hành. Thực hiện kiểm tra và triển khai tích hợp tự động.

  • Giám sát số liệu mục tiêu kinh doanh: Xác định, đo lường và cảnh báo về các số liệu kinh doanh có liên quan.

  • Tiến hành kiểm tra khắc phục rủi ro: Định kỳ xác minh rằng các quy trình khắc phục thảm họa của bạn hoạt động và kiểm tra các quy trình thường xuyên.

Operational Excellence
Trụ côt đầu tiên của khung kiến trúc tối ưu cơ sở hạ tầng là Operational Excellence

Ví dụ điển hình


Các nhóm hoạt động cần phải hiểu nhu cầu kinh doanh và khách hàng của họ để có thể hỗ trợ kết quả kinh doanh. Operational Excellence tạo và sử dụng các quy trình để đáp ứng với các sự kiện hoạt động, đo lường tính hiệu quả của chúng để hỗ trợ các nhu cầu kinh doanh. Ngoài ra, các số liệu cũng được thu thập và sử dụng để đo lường thành tích của kết quả kinh doanh mong muốn. Để đạt được tiêu chí này, các bước thực hiện bao gồm: 


Tăng tốc độ phát triển phần mềm và phát hành.


Sử dụng phương pháp CI / CD để tăng vận tốc. Trước tiên, nhóm phát triển phần mềm cần tự động hoá thử nghiệm tích hợp hiệu quả hơn vào quy trình xây dựng. Bạn tự động triển khai sau khi bản dựng đã đáp ứng các tiêu chí thử nghiệm cụ thể của bạn. Các nhà phát triển có thể thực hiện các thay đổi nhỏ thường xuyên hơn. Các thay đổi được kiểm tra kỹ lưỡng và giảm được thời gian triển khai.

Các yếu tố của cách tiếp cận CI / CD bao gồm: kỹ thuật phát hành, tự động hóa, kho mã trung tâm, xây dựng đường ống, thử nghiệm và triển khai.


Theo dõi sức khỏe hệ thống và sức khỏe doanh nghiệp.


Thông qua giám sát, bạn có thể đưa ra quyết định về tác động của các thay đổi đối với dịch vụ của mình, áp dụng phương pháp khoa học để ứng phó sự cố và đo lường sự phù hợp của dịch vụ với mục tiêu kinh doanh của bạn, bao gồm các bước như sau:

  • Phân tích xu hướng dài hạn.

  • So sánh thí nghiệm của bạn theo thời gian.

  • Xác định cảnh báo về các số liệu quan trọng.

  • Xây dựng bảng điều khiển thời gian thực có liên quan.

  • Thực hiện phân tích hồi cứu.

Các số liệu định hướng doanh nghiệp giúp bạn hiểu hệ thống hỗ trợ doanh nghiệp của bạn có tốt hay không. Ví dụ: bạn có thể theo dõi chi phí để phục vụ người dùng trong ứng dụng, thay đổi lưu lượng truy cập đến trang web sau khi thiết kế lại hoặc mất bao lâu để khách hàng mua sản phẩm trên trang web của bạn. Số liệu sức khỏe hệ thống giúp bạn hiểu liệu hệ thống của bạn có hoạt động chính xác và trong mức hiệu suất có thể chấp nhận hay không.


Sử dụng 4 “tín hiệu vàng” sau đây để giám sát hệ thống của bạn:

  • Độ trễ: Thời gian cần thiết để phục vụ một yêu cầu.

  • Lượt traffic: Có bao nhiêu nhu cầu đang được đặt trên hệ thống của bạn.

  • Lỗi: Tỷ lệ yêu cầu thất bại.

  • Độ bão hòa: Dịch vụ của bạn đầy đủ như thế nào. Một thước đo các nguồn lực hạn chế nhất của bạn. 

Lập kế hoạch và thiết kế cho những thất bại.


Thiết kế hệ thống để dự đoán và xử lý các tình huống lỗi giúp đảm bảo rằng nếu có rủi ro xảy ra, sự ảnh hưởng lên hệ thống được giảm thiểu. Để lường trước những thất bại, hãy đảm bảo bạn có kế hoạch khắc phục thảm họa (DR) được xác định rõ và thường xuyên kiểm tra để sao lưu và khôi phục các dịch vụ và dữ liệu.


Các sự kiện gián đoạn dịch vụ có thể xảy ra bất cứ lúc nào. Mạng của bạn có thể bị ngừng hoạt động, ứng dụng mới nhất của bạn có thể gây ra lỗi nghiêm trọng. Khi mọi thứ trở nên tồi tệ, điều quan trọng là phải có một kế hoạch DR mạnh mẽ, đúng mục tiêu và được thử nghiệm tốt.


Operational Excellence là tiêu chí đầu tiên và rất quan trọng khi xây dựng nền tảng hạ tầng cho một hệ thống. Tuy nhiên, đây cũng không phải là tiêu chí dễ dàng đạt được. Điều này đòi hỏi những kỹ sư có chuyên môn cao trong lĩnh vực này. Vì vậy, doanh nghiệp cần cân nhắc khi đầu tư nguồn lực để triển khai.


Khung xây dựng kiến trúc tối ưu (Architecture Framework) hiện đang được Google CloudAmazon Web Services xây dựng với nhiều ưu điểm khác nhau. Nếu bạn cũng đang quan tâm về việc nâng cấp cơ sở hạ tầng cho hệ thống trên Cloud theo mô hình Architecture Framework, đội ngũ chuyên nghiệp của CloudAZ sẽ sẵn sàng tư vấn và đưa ra giải pháp tối ưu nhất cho doanh nghiệp của bạn.


Tham khảo thêm về tiêu chí Operational Excellence tại đây



16 views