Andrew Ng nghĩ gì về Deep Learning?
Trí tuệ nhân tạo

Andrew Ng nghĩ gì về Deep Learning?

Andrew Ng nghĩ gì về Deep Learning? Deep Learning là một công cụ tuyệt vời giúp cho việc tạo ra rất nhiều các ứng dụng AI thú vị. Nó giúp chúng ta tạo nên xe tự lái, nhận diện giọng nói, máy tính hiểu được hình ảnh và nhiều hơn nữa.

Câu trả lời của Andrew Ng trên quora vào 2/3/2016 tại https://goo.gl/vswBrL

Dù thời gian gần đây có những tiến bộ nhất định, tôi vẫn thấy có nhiều cơ hội lớn chưa được khai thác. Có rất nhiều dự án trong nông nghiệp chính xác (precision agriculture), trong tài chính tiêu dùng (consumer finance), trong y học… Ở đó, tôi thấy được một cơ hội rõ ràng cho deep learning có được một tầm ảnh hưởng lớn, nhưng chưa có ai trong chúng ta có thời gian để tập trung vào. Vì vậy, tôi tin rằng deep learning sẽ không chững lại và nó sẽ vẫn tiếp tục phát triển nhanh chóng.

Deep Learning cũng đang bị thổi phồng lên. Bởi vị Neural Networks là một chủ đề rất kỹ thuật và khó giải thích, rất nhiều người trong chúng ta đã quen với việc giải thích nó bằng việc miêu tả nó với một sự tương tự như não người. Nhưng chúng ta gần như không biết gì về cách hoạt động của bộ não sinh học. Micheal Jordan của UC Berkeley gọi deep learning là một bản “hoạt hình” của bộ não sinh học – một phiên bản bị đơn giản hóa rất nhiều của một thứ mà chúng ta còn chưa hiểu được – và tôi đồng ý với điều đó. Bỏ qua sư phóng đại của các phương tiện truyền thông, chúng ta còn ở cách rất xa trình độ có thể tạo ra được một trí tuệ gần với trình độ của con người (Nguyên văn: we’re nowhere near being able to build human-level intelligence). Bởi vì về cơ bản, chúng ta không biết não hoạt động như thế nào. Những nỗ lực tái tại một cách mù quáng phần nhỏ kiến thức mà chúng ta biết (về não bộ) lên một chiếc máy tính vẫn chưa tạo ra một hệ thống AI đặc biệt hữu ích. Thay vào đó, hệ thống Deep Learning hiệu quả nhất hiện nay tiến bộ được nhờ vào các nguyên tắc trong khoa học máy tính (Computer Science) và kỹ nghệ (engineering), và nhất là các cảm hứng đến từ sinh học, hơn là việc cố gắng sao chép một cách mù quáng mù quáng sinh học.

Cụ thể là: nếu bạn nghe ai đó nói “Bộ não làm việc X, hệ thống của tôi cũng làm việc X, vậy là chúng tôi đang tạo ra bộ não”; thì tôi chỉ có thể khuyên các bạn là hãy tránh xa.

Nhiều ý tưởng được sử dụng trong Deep Learning đã có từ nhiều thập kỷ trước, nhưng tại sao đến tận bây giờ nó mới bắt đầu cất cánh? Hai trong số các nguyên nhân chính tạo ra sự cất cánh đó là: (1) quy mô dữ liệu (scale of data), và (2) khả năng tính toán của máy (scale of computation). Với việc xã hội chúng ta đang dành nhiều thời gian trên các website và thiết bị di động, dữ liệu đã được tích lũy nhanh chóng trong hai thập kỷ qua. Chỉ đến gần đây khi chúng ta bắt đầu biết làm thế nào để mở rộng được khả năng tính toán và đã tạo được các thuật toán Deep Learning có thể tận dụng được lượng dữ liệu khổng lồ này.

Điều này đã đẩy chúng ta vào hai vòng lặp phản hồi tích cực và giúp đẩy nhanh các tiến bộ của Deep Learning:

Thứ nhất, chúng ta hiện có những cỗ máy khổng lồ có thể hấp thụ được một lượng lớn dữ liệu, giá trị của big data ngày càng rõ ràng hơn. Điều này tạo ra một động lực lớn hơn để thu thập nhiều dữ liệu hơn nữa và đến lượt nó lại thúc đẩy khao khát tạo ra những mạng neural networks lớn hơn/ nhanh hơn.

Thứ hai là chúng ta đã có các phương thức triển khai Deep Learning nhanh chóng, và điều đó thúc đẩy sự sáng tạo cũng như các tiến bộ trong nghiên cứu. Rất nhiều người đánh giá thấp tác động của sự đầu tư vào các hệ thống máy tính trong Deep Learning. Khi thực hiện các nghiên cứu deep learning, chúng ta không biết thuật toán nào sẽ chạy và cái nào không, và việc của chúng ta là làm rất nhiều thí nghiệm và tìm ra điều đó. Nếu chúng ta có một hạ tầng tính toán hiệu quả cho phép chạy thử nghiệm trong vòng một ngày chứ không phải một tuần thì tiến trình nghiên cứu của bạn đă có thể nhanh hơn tới 7 lần.

Đấy là lý do tại sao vào khoảng năm 2008 nhóm của tôi tại Stanford bắt đầu ủng hộ việc chuyển Deep Learning vào GPU (lúc đó thật sự là một việc gây tranh cãi, nhưng hiện giờ thì mọi người đều làm việc đó), và giờ tôi đang ủng hộ việc chuyển sang HPC (High Performance Computing/ Supercomputing) để mở rộng Deep Learning. Machine learning nên bao gồm HPC. Những phương pháp này sẽ khiến cho các nhà nghiên cứu làm việc hiệu quả hơn và giúp thúc đẩy toàn bộ lĩnh vực của chúng ta tiến lên.

Để tóm lại, deep learning đã giúp AI có những tiến bộ to lớn, nhưng những gì đằng trước vẫn còn những thứ tốt đẹp hơn sẽ tới.

Người dịch: Lưu Bích Hồng

Đăng bình luận