Bài viết của Andrew Ng - Giám đốc khoa học của Baidu, đồng sáng lập Coursera.

Andrew ng

Rất nhiều lãnh đạo có hỏi tôi về khả năng thực sự của trí tuệ nhân tạo. Họ muốn có cái nhìn khách quan nhất về ảnh hưởng của AI tới hoạt động của doanh nghiệp mà họ đang nắm giữ.

Qua sách, báo, blog, truyền hình,... Các bạn đều thấy AI đang thể hiện vai trò tuyệt đối của mình trong các bài toán rất phức tạp và đa dạng trong các lĩnh vực như: tìm kiếm, quảng cáo, thương mại điện tử, tài chính,... Tuy nhiên, giới truyền thông đang tung hô và thần thánh hóa AI một cách ngoạn mục.

Tôi - Andrew Ng, cựu team lead của Google Brain, nguyên giám đốc phòng thí nghiệm AI của đại học Stanford. Tôi đã phát triển rồi dẫn dắt những team làm AI hàng đầu thế giới và cho ra các sản phẩm AI được hàng triệu người sử dụng. Tôi đã chứng kiến sức mạnh của AI. Tuy nhiên tôi khẳng định, AI không phải là điều gì đó quá kì diệu như truyền thông đang nhắc đến.

Google Brain

Bạn sẽ bất ngờ đấy. Khác với việc được tung hô như một vị thần, trên thực tế, các quá trình triển khai AI đều hướng đến mục đích chung: đưa dữ liệu đầu vào (input) A. AI sẽ sử dụng đầu vào đó để generate dữ liệu đầu ra (output) B với tốc độ nhanh nhất có thể.

Input AOutput BỨng dụng
ẢnhNhận dạng xem có phải là mặt người khôngTự động tag ảnh
Giấy vay tiềnXác nhận xem tiền vay đã được trả chưa?Đánh giá & phê duyệt các khoản vay
Quảng cảo + thông tin người dùngNgười dùng có click quảng cáo hay khôngChạy banner quảng cáo
Một đoạn âm thanhTranscript (lời thoại dạng text)Nhận diện giọng nói
Một câu (tiếng Anh)Câu tương đương trong ngôn ngữ khácDịch thuật
Dữ liệu của các cảm biến (trong máy móc..)Đánh giá rủi roHệ thống an toàn
Camera + các cảm biến trên xeVị trí và trạng thái của xeÔ tô tự lái
Tham khảo các khóa học lập trình online, onlab, và thực tập lập trình tại TechMaster

Việc xây dựng được các hệ thống nhận input A và cho ra output B (gọi tắt là A -> B) sẽ làm thay đổi bộ mặt của nhiều ngành. Trong giới kỹ thuật, phương pháp xây dựng các hệ thống nhận input A và cho ra output B như trên được gọi là supervised learning (tạm dịch:học máy có giám sát).

Trí tuệ của con người thừa sức xử lý được các bài toán dạng A -> B như trên, tuy nhiên máy móc thì cần một quá trình phát triển dài hơi trước khi chạm đến đẳng cấp đó. Bạn thấy đấy, chiếc máy tính đầu tiên ra đời cách đây gần 1 thế kỷ. Trong khi đó, các hệ thống AI tối tân nhất hiện nay mới chỉ giải quyết một số bài toán cụ thể như tôi đã liệt kê ở trên.Tuy nhiên các hệ thống đó không ngừng được đầu tư và cải tiến. Đại diện sáng giá nhất của AI hiện nay sử dụng deep learning (deep learning được phát triển theo hướng mô phỏng một phần cơ chế hoạt động của não người). AI được nhiều nhóm nghiên cứu tiếp cận theo các phương pháp khác nhau. Một số nhóm đã chứng minh, bằng cả lý thuyết lẫn thực tế, rằng AI rất mạnh trong việc giải quyết các bài toán trong một ngữ cảnh cụ thể. Tuy vậy, AI cần vượt qua một "bậc thang" nữa để có được những kết quả mang tính cách mạng trên nhiều lĩnh vực. Và con đường dẫn đến "bậc thang" này vẫn chưa được tìm ra.

deep learning

Khi đã nắm được AI có thể và không thể làm những việc gì, tiếp theo ta cần kết hợp nó với chiến lược phát triển. Điều này đồng nghĩa với việc bạn phải biết được thông tin mình thu thập nằm ở đâu, thu thập như thế nào và khi thu thập thông tin  thì gặp những khó khăn gì.

Nếu để ý kỹ bạn sẽ thấy một nhược điểm của tất cả các hệ thống học máy có giám sát hiện nay: chúng cần quá nhiều input để đưa ra output. 

Ví dụ, để hệ thống tự động tag đúng ảnh của một người bạn của bạn, AI cần 10.000 đến 100.000 bức ảnh và một vài thẻ tag có sẵn từ trước để nhận diện bạn của bạn. 

Một hệ thống nhận diện và xử lý giọng nói cần 10.000 giờ clip audio chứa đoạn transcipt dài không quá 1000 ký tự để nhận diện đoạn transcript đó khi được đọc và in nó ra màn hình.

Để AI hoạt động hoàn hảo, việc lựa chọn input A và output B phù hợp là cực kỳ quan trọng. Nghe thì có vẻ đơn giản nhưng việc lực chọn A và B một cách tối ưu đã tạo ra nhiều cuộc cách mạng trong một số ngành công nghiệp.

Cộng đồng nghiên cứu và phát triển AI tương đối "mở" - tức các framework, source code được chia sẻ không giới hạn. Tuy nhiên có 2 khó khăn mà bất kỳ cá nhân và tổ chức nào cũng gặp phải khi áp dụng AI cho bài toán của họ:

  1. Về dữ liệu: như tôi đã đề cập ở trên, chọn input và output hợp lý là một việc quan trọng. Các ý tưởng và giải pháp triển khai của các team nghiên cứu AI có thể giống nhau nhưng việc thu thập dữ liệu đúng mẫu thì không phải team nào cũng hoàn thành tốt được. Và tất nhiên thiếu dữ liệu thì các engine AI khó có thể hoàn thành nhiệm vụ được giao.
  2. Về khả năng linh hoạt của team: các engine AI không phải là mỳ ăn liền. Bạn cần tùy biến một chút để nó phù hợp với nhu cầu và bài toán mà bạn đang cần giải quyết. Và tất nhiên rồi, không phải ai cũng có thể tùy biến các engine này.

Bạn sẽ thấy rằng tự tìm hiểu về AI thú vị hơn rất nhiều so với việc chỉ nghe truyền thông tung hô nó. Tuy giúp chúng ta rất nhiều nhưng AI cũng lấy đi của chúng ta không ít. Việc hiểu được vai trò của AI trong bài toán mà chúng ta đang giải quyết sẽ mở ra một chân trời mới cho ngành tự động hóa nói riêng và cách mang công nghiệp nói chung.

 hbr