‘Tự học’ trong 4 giờ, trí tuệ nhân tạo của Google trở thành nhà vô địch mới về cờ vua

Thành Đô
•
Thứ Tư, 13/12/2017

Mặc dù cờ vua là trò chơi không hề đơn giản ngay cả với con người vì sự đa dạng trong các luật chơi và các nước đi, nhưng trí tuệ nhân tạo mang tên AlphaZero lại có thể làm chủ trò chơi này chỉ trong vài giờ.

‘Học’ trong 4 giờ, AlphaZero của Google trở thành nhà vô địch cờ vua — AlphaZero đã vượt qua nhiều hệ thống AI khác, trong đó có cả người tiền nhiệm AlphaGo Zero.

Theo tin tức gần đây của Google, chỉ sau 4 giờ “học tập”, sản phẩm trí tuệ nhân tạo AlphaZero của họ đã chiến thắng áp đảo Stockfish, một trí tuệ nhân tạo khác, là nhà vô địch thế giới môn cờ vua trước khi cuộc tỉ thí này diễn ra. Như vậy nó đã vượt qua kiến thức về cờ vua mà toàn nhân loại tích lũy trong lịch sử chỉ trong một thời gian ngắn ngủi như vậy.

Trong 100 ván cờ đánh với Stockfish, AlphaZero thắng 25/50 ván khi đi trước và thắng 3/50 ván khi đi sau, còn lại là hòa, không thua trận nào. Điều đáng ngạc nhiên hơn là người ta không lập trình chiến thuật chơi cho AlphaZero, chỉ lập trình luật chơi, AlphaZero đã học bằng cách tự chơi với mình.

“Giờ thì chúng ta đã biết bá chủ mới là ai” tổng giám đốc David Kramaley của trang web về khoa học cờ vua Chessable đã phải thốt lên như vậy. Ông cũng nói thêm rằng kết quả này có thể được áp dụng sang cả các lĩnh vực khác bên ngoài cờ vua, như quản lý các thành phố, và thậm chí là các lục địa.

>> Sau khi đánh bại các nhà vô địch cờ vây, AlphaGo của Google sẽ ‘nghỉ hưu’

AlphaZero là một phiên bản được điều chỉnh và mở rộng từ AlphaGo Zero, vốn chỉ được dùng để đánh cờ vây. Các phiên bản trước AlphaGo Zero phải học bằng cách xem con người chơi, nhưng đến AlphaGo Zero thì máy có thể hoàn toàn tự học.

“Cứ như thể là nền văn minh ngoài trái đất đang phát minh ra toán học của riêng họ vậy”, nhà khoa học máy tính Nick Hynes của MIT nói,“Đây là một mô hình hoàn toàn không phụ thuộc vào bất kỳ định kiến hay quan niệm nào của con người, nó tự xác định được cách nào là tốt nhất.”

Ngoài cờ vua, AlphaZero còn được cho thử thách với cờ vây và cờ Shogi của Nhật Bản, nó cũng chỉ mất 2 tiếng để nắm bắt toàn bộ về cờ Shogi và 8 tiếng để học hết về cờ vây.

Sau 100 “trận chiến” cờ vua với Stockfish, AlphaZero “luyện tập” thêm 2 giờ đồng hồ và lại thi đấu 100 “trận” nữa với AI Elmo, “siêu cao thủ” cờ Shogi của Nhật Bản . Kết quả là AlphaZero thắng 90, thua 8 và hòa 2.

Còn về cờ vây, không lâu trước đây, AlphaGo Zero được mệnh danh là “độc cô cầu bại”, nhưng vẫn phải chào thua phiên bản mở rộng của mình là AlphaZero. Sau khi “luyện tập” 8 giờ, AlphaZero đã chơi 100 ván và thắng 60, thua 40.

Trước những kết quả quá đỗi ấn tượng như vậy, đại kiện tướng Peter Heine Nielse cũng phải thừa nhận với BBC: “Trước đây tôi tự hỏi, sẽ ra sao nếu các sinh vật siêu cấp hạ cánh xuống Trái Đất và trình diễn chúng ta thấy cách họ chơi cờ, nhưng bây giờ thì tôi đã biết.”

Thành Đô tổng hợp

Xem thêm:

Từ khóa google trí tuệ nhân tạo máy học cờ vây cờ vua