Nên xây dựng AI Infrastructure như thế nào?

Bài viết liên quan

Trong một thế giới có rất nhiều dữ liệu, dữ liệu được chia sẻ, dự đoán luôn có giá trị hơn dữ liệu được lưu trữ. Trí tuệ nhân tạo đang tạo ra các hệ thống tự học có thể thực hiện các nhiệm vụ thường yêu cầu trí thông minh của con người.

Từ những chiếc xe tự lái đến dự đoán tương lai, AI đang cách mạng hóa cách chúng ta có thể sử dụng dữ liệu để định hình thế giới của mình. Bài viết sau đây là một góc nhìn về việc xây dựng hạ tầng cho AI.



AI Infrastructure là gì?
AI Infrastructure là cơ sở hạ tầng cho trí tuệ nhân tạo Artificial intelligence (AI), đề cập đến nền tảng công nghệ (cả phần cứng và phần mềm) cần thiết để xây dựng, thử nghiệm, đào tạo và triển khai các ứng dụng do AI hỗ trợ. Từ GPU đến scale-out flash đến data fabrics, việc cạnh tranh trong thế giới AI không ngừng phát triển đòi hỏi sự đầu tư liên tục vào các công nghệ dữ liệu mới nhất.

AI đã sẵn sàng mở ra làn sóng tiếp theo về chuyển đổi kinh doanh, đặc biệt là trong bối cảnh đại dịch hiện nay. Bị ảnh hưởng bởi sự gián đoạn chuỗi cung ứng và các biện pháp giãn cách xã hội, các doanh nghiệp đã tăng tốc phát triển AI kể từ khi COVID-19 bùng nổ để giúp giảm thiểu rủi ro và duy trì hoạt động kinh doanh liên tục. Trên thực tế, thị trường AI dự kiến ​​sẽ tạo ra tổng doanh thu 554,3 tỷ USD vào năm 2024, với tốc độ tăng trưởng kép hàng năm (CAGR) trong 5 năm là 17,5% (Theo báo cáo của International Data Corporation - IDC).
 
Mặc dù AI và Machine Learning (“ML”) cung cấp cho các doanh nghiệp cơ hội tận dụng tiềm năng to lớn của dữ liệu lớn, nhưng chúng cũng đặt ra những thách thức cấp bách trong việc thiết lập tính sẵn sàng của dữ liệu và cơ sở hạ tầng cho đào tạo và suy luận. Để giúp các doanh nghiệp khai thác giá trị bị ‘chôn vùi’ trong dữ liệu của họ, chúng ta cùng thảo luận về cách xây dựng, ‘trao quyền’ cho AI với cơ sở hạ tầng phù hợp.

Sự sẵn sàng của dữ liệu: tận dụng Big Data
Trong hầu hết các trường hợp, các doanh nghiệp bắt đầu hành trình AI của mình với việc đào tạo ML. Điều này đề cập đến việc tạo một thuật toán ML dựa trên dữ liệu đầu vào đã chọn. Một trong những suy nghĩ sai lầm phổ biến nhất mà các doanh nghiệp mắc phải là họ cho rằng, nếu có một dữ liệu lớn có nghĩa là họ đã sẵn sàng cho ML hoạt động. Tuy nhiên, việc thiếu các hướng dẫn cụ thể khiến việc cung cấp dữ liệu vào các thuật toán trở nên khó khăn. Các doanh nghiệp cần dữ liệu có cấu trúc, rõ ràng để tạo nền tảng vững chắc cho việc phân tích chính xác.
 
Khi nói đến suy luận, các doanh nghiệp đang trở nên chủ động hơn trong việc khai thác dữ liệu. Diễn đàn Kinh tế Thế giới (WEF) chỉ ra rằng hơn 85% công ty sẽ áp dụng big data và công nghệ phân tích vào năm 2025. Đáng chú ý hơn, trí thông minh thu được từ dữ liệu đang chuyển từ cách tiếp cận nhận dạng mẫu truyền thống sang dự đoán tương lai nhiều hơn. Bối cảnh thay đổi đang thúc đẩy nhu cầu ngày càng tăng về việc dữ liệu được ghi lại ngay lập tức và phân tích theo thời gian thực, thúc đẩy chương trình cho một cơ sở hạ tầng kỹ thuật số chuyên dụng để nghiên cứu và xử lý dữ liệu.

AI Infrastructure: on-premise (tại chỗ) hay trên Cloud? 
Cơ sở hạ tầng tối ưu cho AI và ML là gì? Câu trả lời thực sự phụ thuộc vào các trường hợp sử dụng cụ thể. Mặc dù điện toán đám mây là ‘trending’, như một nguồn tài nguyên quan trọng cho khối lượng công việc của AI nhờ tính linh hoạt và dễ dàng thiết lập và triển khai, các doanh nghiệp vẫn cần dựa vào tài nguyên tại chỗ khi các yêu cầu bài toán về độ trễ thấp, bảo mật dữ liệu hoặc chi phí.

Các hệ thống AI cần phải xử lý nhanh hơn khi các ứng dụng và dữ liệu di chuyển đến tận cùng (the edge), bởi vì độ trễ thấp trở nên quan trọng đối với trải nghiệm liền mạch khi dữ liệu được xử lý theo thời gian thực. Tuy nhiên, các đám mây công cộng có thể liên quan đến độ trễ đáng kể do khoảng cách vật lý và chia sẻ tài nguyên. Để vượt qua rào cản này, doanh nghiệp cần thu thập và phân tích dữ liệu đến cùng. Điều này đòi hỏi sự hiện diện cơ sở hạ tầng là local và truy cập nhanh vào các dịch vụ điện toán đám mây và điện toán biên (edge computing).

Tuân thủ là một thách thức phổ biến khác. Vì AI và ML thường liên quan đến các bộ dữ liệu khổng lồ, các quốc gia trên toàn cầu đã và đang thiết lập các quy định để đảm bảo chủ quyền và an ninh dữ liệu. Các quy định có thể yêu cầu một số dữ liệu nhất định phải được lưu trữ và xử lý trong một môi trường vật lý riêng tư, điều này khiến cho việc lựa chọn on-premise là cần thiết.
 
Mặc dù ban đầu, việc các doanh nghiệp sử dụng đám mây cho các dự án AI nhỏ có thể có ý nghĩa, nhưng chi phí để xử lý các bộ dữ liệu lớn thông qua đám mây có thể tăng theo cấp số nhân trong nhiều trường hợp. Từ quan điểm dài hạn, việc xây dựng mô hình AI on-premise có thể cung cấp cho các nhà phát triển số lần lặp lại không giới hạn mà không phải lo lắng về chi phí bổ sung.

Nguồn bài viết: Viettel IDC 


Chia sẻ bài viết

Author:

Mong rằng những bài viết được viết và tổng hợp trên blog này sẽ cung cấp những thông tin hữu ích đến bạn. Chúc một ngày vui vẻ !

0 comments: