Bài viết được dịch từ trang web SAS
Machine learning là một phương pháp phân tích dữ liệu mà sẽ tự động hóa việc xây dựng mô hình phân tích. Sử dụng các thuật toán lặp để học từ dữ liệu, machine learning cho phép máy tính tìm thấy những thông tin giá trị ẩn sâu mà không được lập trình một cách rõ ràng nơi để tìm.
Khía cạnh lặp lại của machine learning là quan trọng bởi vì khi các mô hình này được tiếp xúc với dữ liệu mới thì chúng có thể thích ứng một cách độc lập. Chúng học từ các tính toán trước đó để tạo ra những quyết định cũng như kết quả lặp lại và đáng tin cậy. Đó là một ngành khoa học không mới - nhưng hiện nay đang dành được nhiều mối quan tâm để phát triển bùng nổ.
Nhờ vào các công nghệ điện toán mới, machine learning hiện nay không còn giống như machine learning trong quá khứ. Trong khi rất nhiều các thuật toán machine learning vẫn còn được sử dụng hiệu quả trong một thời gian dài, khả năng tự động áp dụng các tính toán toán học phức tạp trên dữ liệu lớn - ngày càng lớn hơn và nhanh hơn - là một sự phát triển gần đây. Dưới đây là một vài ví dụ được công bố công khai rộng rãi về các ứng dụng của machine learning mà bạn có thể đã quen thuộc:
- Những thông tin thổi phồng về xe hơi tự lái của Google? Bản chất là machine learning.
- Những phần giới thiệu trực tuyến (recommendation) của Amazon và Netflix? Đó là các ứng dụng của machine learning trong cuộc sống hàng ngày.
- Biết những khách hàng nào đang nói về bạn trên mạng xã hội Twitter? Machine learning kết hợp với việc tạo ra quy tắc ngôn ngữ.
- Phát hiện gian lận? Một trong những ứng dụng rất quan trọng trong thế giới của chúng ta ngày nay.
Tại sao mối quan tâm đối với machine learning ngày càng tăng?
Gần đây mối quan tâm dành cho machine learning ngày càng tăng là do các yếu tố tương tự như đã làm cho data mining và phân tích Bayesian trở nên phổ biến hơn bao giờ hết. Những điều như sự gia tăng dung lượng và loại dữ liệu có sẵn, việc xử lý tính toán ngày càng rẻ hơn và mạnh mẽ hơn, và lưu trữ dữ liệu có giá cả phải chăng.
Tất cả những điều này có nghĩa là nó có thể nhanh chóng và tự động tạo ra các mô hình mà có thể phân tích dữ liệu lớn hơn và phức tạp hơn cũng như cung cấp các kết quả nhanh hơn, chính xác hơn - ngay cả trên một quy mô rất lớn. Kết quả là gì? Những dự đoán có giá trị cao có thể hướng dẫn đưa ra các quyết định tốt hơn và các hành động thông minh trong thời gian thực mà không cần sự can thiệp của con người.
Một chìa khóa để tạo ra các hành động thông minh trong thời gian thực là việc xây dựng các mô hình tự động. Thomas H. Davenport đã viết trên tờ Wall Street Journal rằng với sự thay đổi nhanh chóng, và gia tăng khối lượng dữ liệu như ngày nay, "... bạn cần phải có luồng mô hình phát triển nhanh để theo kịp." Và bạn có thể làm điều đó với machine learning. Ông nói, "Con người thường chỉ có thể tạo ra một hoặc hai mô hình tốt mỗi tuần; machine learning có thể tạo ra hàng ngàn mô hình mỗi tuần."
Machine learning được sử dụng hiện nay như thế nào?
Đã bao giờ bạn tự hỏi làm thế nào mà một trang bán lẻ trực tuyến cung cấp lời mời chào gần như tức thời cho các sản phẩm khác có thể bạn quan tâm? Hoặc làm thế nào người cho vay có thể cung cấp gần như tức thời câu trả lời cho các yêu cầu vay tiền của bạn? Nhiều hoạt động hàng ngày của chúng ta được trợ giúp bởi các thuật toán machine learning, bao gồm:
- Phát hiện gian lận.
- Các kết quả tìm kiếm trên web.
- Quảng cáo theo thời gian thực trên các trang web và các thiết bị di động.
- Phân tích tình cảm dựa trên văn bản.
- Điểm số tín dụng và lời mời chào tiếp theo tốt nhất.
- Dự đoán những hư hỏng của thiết bị.
- Những mô hình định giá mới.
- Phát hiện xâm nhập mạng.
- Nhận dạng qua pattern (mẫu) và hình ảnh.
- Lọc bỏ các email spam.
Một ứng dụng phổ biến của machine learning hiện nay là việc nhận dạng pattern (mẫu) bởi vì nó có thể được sử dụng để nhận ra nhiều loại hình ảnh khác nhau. Ví dụ, Bưu điện Mỹ sử dụng machine learning để nhận dạng chữ viết tay.
Bình luận