1. Why? Tại sao AI/Data Science cần xác suất?
Bạn có bao giờ tự hỏi tại sao chiếc điện thoại thông minh của bạn lại có thể đoán trước được từ tiếp theo bạn muốn gõ? Hay tại sao các ứng dụng mạng xã hội lại biết bạn thích xem những nội dung gì? Đó chính là nhờ vào sức mạnh của AI và Data Science. Và một trong những yếu tố cốt lõi làm nên điều đó chính là xác suất.
Xác suất là gì?
Xác suất là một nhánh của toán học liên quan đến các mô tả bằng số về khả năng xảy ra một sự kiện, hoặc khả năng một mệnh đề là đúng. Xác suất của một sự kiện là một số trong khoảng từ 0 đến 1, trong đó, nói một cách đại khái, 0 biểu thị sự bất khả thi của sự kiện và 1 biểu thị sự chắc chắn.
Định nghĩa trên của Wikipedia, sử dụng từ “sự kiện” (tiếng anh là event) nhưng mình thì thường dùng từ “biến cố” hơn (nếu bạn không biết “biến cố” là gì thì đừng lo lắng, chúng ta sẽ tìm hiểu chúng ở bài tiếp theo). Ví dụ, khi bạn tung một đồng xu, xác suất xuất hiện mặt sấp là 1/2, nghĩa là nếu bạn tung đồng xu nhiều lần, trung bình cứ 2 lần tung thì sẽ có 1 lần xuất hiện mặt sấp. Trong AI và Data Science, chúng ta sử dụng xác suất để đánh giá khả năng xảy ra của các biến cố khác nhau, chẳng hạn như khả năng một bức ảnh là hình ảnh một con mèo hay một con chó.
Xác suất trong đời sống
Xác suất có mặt trong rất nhiều lĩnh vực của cuộc sống hàng ngày. Một số ví dụ:
- Y học:
- Chẩn đoán bệnh: Các bác sĩ sử dụng xác suất để đánh giá khả năng một bệnh nhân mắc một căn bệnh cụ thể dựa trên các triệu chứng và kết quả xét nghiệm.
- Thử nghiệm lâm sàng: Xác suất được sử dụng để đánh giá hiệu quả của một loại thuốc mới.
- Tài chính:
- Đánh giá rủi ro: Các nhà đầu tư sử dụng xác suất để đánh giá rủi ro của các khoản đầu tư.
- Dự báo thị trường: Các nhà phân tích thị trường sử dụng xác suất để dự đoán sự biến động của thị trường chứng khoán.
- Bảo hiểm:
- Tính phí bảo hiểm: Các công ty bảo hiểm sử dụng xác suất để tính toán phí bảo hiểm cho các loại hình bảo hiểm khác nhau.
- Kinh doanh:
- Quản lý kho: Các doanh nghiệp sử dụng xác suất để dự đoán nhu cầu của khách hàng và quản lý hiệu quả kho hàng.
- Marketing: Các công ty sử dụng xác suất để phân tích hành vi của khách hàng và đưa ra các chiến dịch marketing hiệu quả.
- Thời tiết:
- Dự báo thời tiết: Các nhà khí tượng sử dụng xác suất để dự báo thời tiết trong tương lai.
Hãy tưởng tượng bạn muốn mua một chiếc ô tô đã qua sử dụng. Bạn sẽ dựa vào nhiều yếu tố như tuổi đời của xe, số km đã chạy, lịch sử bảo dưỡng để đánh giá chất lượng của chiếc xe đó. Tại đây, bạn đang sử dụng một cách trực giác để đánh giá xác suất chiếc xe sẽ gặp sự cố trong tương lai. Các công ty bảo hiểm ô tô cũng sử dụng các phương pháp thống kê và xác suất tương tự để tính toán phí bảo hiểm cho bạn.
Tại sao xác suất lại cần thiết trong AI và Data Science?
- Xác suất là nền tảng của học máy: Hãy tưởng tượng bạn muốn dạy máy tính phân biệt giữa một con mèo và một con chó. Bạn sẽ cho máy tính xem rất nhiều ảnh của mèo và chó, sau đó máy tính sẽ tự học cách phân biệt dựa trên các đặc trưng của từng loài. Ở đây, xác suất giúp chúng ta đánh giá khả năng một hình ảnh thuộc về lớp mèo hoặc lớp chó.
- Xác suất giúp xử lý dữ liệu không chắc chắn: Trong thế giới thực, dữ liệu thường không hoàn hảo. Có thể thiếu một số thông tin, hoặc có những thông tin không chính xác. Xác suất giúp chúng ta mô hình hóa sự không chắc chắn này. Ví dụ, khi dự báo thời tiết, chúng ta không thể nói chắc chắn rằng ngày mai trời sẽ mưa hay nắng, mà chỉ có thể đưa ra một xác suất nhất định.
- Xác suất giúp đưa ra quyết định: Dựa trên các xác suất đã tính toán được, chúng ta có thể đưa ra các quyết định tốt hơn. Ví dụ, khi một ngân hàng muốn quyết định có nên cho một khách hàng vay tiền hay không, họ sẽ sử dụng các mô hình dự đoán dựa trên xác suất để đánh giá khả năng khách hàng đó sẽ trả nợ.
Kết luận
Xác suất là một công cụ vô cùng mạnh mẽ trong AI/Data Science. Nó giúp chúng ta xây dựng các mô hình học máy phức tạp, xử lý dữ liệu không hoàn hảo và đưa ra các quyết định thông minh. Tất nhiên với những gì chúng ta vừa tìm hiểu chưa đủ để ứng dụng xác suất liền vào AI/Data Science, bạn sẽ phải tìm hiểu thêm về các khái niệm như phân phối xác suất, định lý Bayes, và các thuật toán học máy, v.v… Hãy tiếp tục với những bài tiếp theo, mình đảm bảo các bạn sẽ thấy hứng thú với những gì mà xác suất có thể mang lại.