Sau thành tích đánh bại những kiện tướng thế giới cờ vây, DeepMind, công ty con chuyên về AI của Google đã đạt được một thành tích mới: đánh bại một trong những chương trình chơi cờ vua tốt nhất hiện nay.
Trong công trình vừa được công bố ngày 5/12 của các nhà nghiên cứu ở DeepMind, AlphaZero, một phần mềm được sinh ra từ AlphaGo nổi tiếng, đã thành công trong việc thử sức với cờ vua: trong vòng vài giờ huấn luyện, AlphaZero đã mạnh ngang với Stockfish, phần mềm được xem là chương trình chơi cờ vua tốt nhất hiện tại.
Cờ vua từ lâu đã không còn là một bí ẩn với trí tuệ nhân tạo. Năm 1997 đánh dấu một sự kiện lớn làm thay đổi lịch sử ngành tin học: chương trình Deep Blue của IBM đã đánh bại nhà vô địch Gary Kasparov. Nhưng có một sự khác biệt giữa cách mà 2 chương trình này được tạo ra. Deep Blue được tạo ra chỉ để chơi cờ vua, và các kỹ sư đã trang bị cho nó các luật và chiến lược chơi khác nhau từ những người chơi giỏi nhất, và đã lập trình nó để tính ra được quyết định có lợi nhất từ một lượng khổng lồ các khả năng có thể xảy ra sau mỗi nước đi.
Ngược lại, AlphaGo đầu tiên được làm ra để chơi cờ vây, vốn là một trò chơi khác hoàn toàn với cờ vua. Để tạo ra chiến lược chơi, các kỹ sư chỉ cung cấp duy nhất những quy định của cờ vây mà không chỉ dẫn bất cứ điều gì thêm về chiến lược. AlphaGo hay phiên bản mới nhất của nó, AlphaGo Zero, đã chơi hàng triệu ván, bằng cách đấu lại chính nó. Chương trình đã bắt đầu bằng việc đi các bước ngẫu nhiên, tinh chỉnh dần chiến lược của mình qua các phần chơi, và cuối cùng trở thành người chơi tốt nhất trên thế giới (đánh bại cả người và máy).
Cũng là AlphaGo nhưng lần này các nhà nghiên cứu đã đưa ra các luật chơi của cờ vua và đổi tên thành AlphaZero. AlphaZero đã tự học chơi cờ vua và đạt được những kết quả ấn tượng: trong 100 ván đấu với Stockfish, AlphaZero không thua trận nào: thắng 28 trận và còn lại là hòa. Điều đáng nói ở đây là AlphaZero đã chơi tốt hơn được Stockfish chỉ sau 4 giờ huấn luyện, có nghĩa là với việc bắt đầu từ số 0, nó chỉ mất 4 giờ tự đấu với chính mình để trở thành người chơi xuất sắc.
Tristan Cazenave, giáo sư chuyên ngành lập trình trò chơi ở Labo Lamsade của đại học Paris Dauphine cho rằng đây là bằng chứng cho thấy phương pháp của họ (các nhà nghiên cứu ở Google DeepMind) là phương pháp chung. Các thuật toán họ dùng cũng đúng khi chơi cờ vua, một điều mà trước đấy không hiển nhiên chút nào. Đến nay, các chương trình trí tuệ nhân tạo chơi cờ vua chỉ dừng lại ở dạng Deep Blue, và không được nhúng những công nghệ Deep Learning như của AlphaZero. Ông cũng nhấn mạnh rằng: theo thời gian, các chương trình này đã được tối ưu hóa đến nỗi khó mà hình dung được rằng người ta còn có thể làm tốt hơn được nữa. Nhưng AlphaZero không chỉ dừng lại ở cờ vua: Nó cũng đã đạt được những kết quả tuyệt vời với cờ shogi – cờ vua Nhật Bản, vốn là một thách đố với ngành công nghệ thông tin. Chỉ sau 2 giờ huấn luyện, AlphaZero đã đánh bại Elmo, một trong những chương trình chơi shogi tốt nhất. Trên 100 ván, AlphaZero đã chiến thắng không dưới 90 trận, thua 8 và hòa 2.
Các nhà nghiên cứu ở DeepMind đã tóm tắt lại như sau: Chỉ bằng việc bắt đầu chơi một cách ngẫu nhiên và không nhận bất kỳ kiến thức nào trước đó trừ luật chơi, AlphaZero chỉ cần 24 giờ huấn luyện để đạt được đẳng cấp trội hơn con người với cờ vua, shogi và cờ vây, và nó cũng đã chiến thắng tất cả những chương trình chơi tốt nhất trong mỗi trò chơi này.
DeepMind, một công ty chuyên về trí tuệ nhân tạo có trụ sở chính ở London, bị mua lại bởi Google vào năm 2014, đã trở nên nổi tiếng với chiến thắng lịch sử trong trò chơi cờ vây. Hiện DeepMind đang cố gắng tạo ra những thành tựu mới với Starcraft 2, một game điện tử nhiều thách thức với trí tuệ nhân tạo. Ngoài ra, công ty này cũng giải quyết những vấn đề hóc búa trong lĩnh vực y tế.
Theo Le Monde, Morgane Tual, 07.12.2017, Après le jeu de go, l’intelligence artificielle de Google DeepMind devient une virtuose des échecs. https://goo.gl/fVQg5z