Nytimes: Thử thách mới nhất của AI: bài toán trong cách kỳ thi Olympics

l0ganepe

Senior Member
Trong bốn năm qua, nhà khoa học máy tính Trịnh Hoàng Triều đã tập trung giải quyết một vấn đề toán học siêu cấp: cách xây dựng một mô hình trí tuệ nhân tạo (A.I.) giải các bài toán hình học từ Olympic Toán Quốc Tế, cuộc thi hàng năm dành cho học sinh trung học có năng khiếu toán học xuất sắc nhất thế giới.

Tuần trước, Tiến sĩ Triều đã bảo vệ thành công luận án tiến sĩ của mình về chủ đề này tại Đại học New York; tuần này, ông mô tả kết quả nghiên cứu của mình trong tạp chí Nature. Hệ thống, được đặt tên là AlphaGeometry, giải các bài toán hình học Olympic gần như ở mức độ của một người đoạt huy chương vàng.

Trong quá trình phát triển dự án, Tiến sĩ Triều đã trình bày nó cho hai nhà nghiên cứu tại Google, và họ đã mời ông tham gia làm nghiên cứu từ 2021 đến 2023. AlphaGeometry gia nhập đội ngũ hệ thống A.I. của Google DeepMind, nổi tiếng với việc giải quyết những thách thức lớn. Có lẽ nổi tiếng nhất là AlphaZero, một thuật toán học sâu, đã chinh phục cờ vua vào năm 2017. Toán học là một vấn đề khó hơn, khi số lượng con đường có thể dẫn đến giải pháp đôi khi là vô hạn; cờ vua luôn là hữu hạn.
Đồng tác giả của bài báo là giáo sư hướng dẫn của Tiến sĩ Trinh, He He, tại Đại học New York; Yuhuai Wu, được biết đến với tên Tony, người đồng sáng lập xAI (trước đây ở Google), người vào năm 2019 đã độc lập bắt đầu khám phá một ý tưởng tương tự; Lương Minh thắng và Lê Viết Quốc, đều đến từ Google DeepMind.
Bước nhảy vọt lớn
Với 30 bài toán hình học trong kỳ thi Olympic Toán quốc tế (IMO) giai đoạn 2000-2022, AlphaGeometry giải được 25 bài, trong thời gian quy định. Trong khi đó, một hệ thống tiên tiến trước đây chỉ giải được 10 bài, còn một người đạt huy chương vàng IMO trung bình giải được 25,9 bài.

Theo Google, mỗi kỳ Olympic có 6 bài toán, thường gồm 2 bài hình học nên AlphaGeometry chỉ có thể xử lý 1/3 số bài. Nếu tính riêng về hình học, AI này ngang ngửa mức độ của những người từng giành huy chương vàng IMO. Còn nếu tính tổng số bài, đây là mô hình AI đầu tiên trên thế giới có thể vượt qua ngưỡng huy chương đồng của IMO 2000 và 2015.

Nhiều chuyên gia AI và nhà Toán học đánh giá đây là kết quả ấn tượng.

"Hoàn toàn hợp lý khi các nhà nghiên cứu AI thử sức với các vấn đề hình học IMO, bởi vì việc tìm ra giải pháp cho chúng hơi giống với cờ vua, ở chỗ chúng ta có rất ít cách đi hợp lý ở mỗi bước. Nhưng tôi vẫn ngạc nhiên khi họ có thể làm được điều đó", Giáo sư Ngô Bảo Châu nói.

Terence Tao, nhà toán học tại Đại học California, Los Angeles — và người đoạt huy chương vàng Olympic trẻ nhất, khi ông 12 tuổi — nói ông nghĩ rằng AlphaGeometry là "nice work" và đã đạt được "kết quả đáng ngạc nhiên mạnh mẽ." Việc tinh chỉnh một hệ thống A.I. để giải quyết các bài toán Olympic có thể không cải thiện kỹ năng nghiên cứu sâu của nó, ông nói, nhưng trong trường hợp này hành trình có thể quý giá hơn điểm đến.
Chứng minh
AlphaGeometry được kết hợp giữa một mô hình ngôn ngữ dựa trên mạng nơ ron (neural language model) có khả năng suy luận tốt và một công cụ biểu tượng (symbolic engine) chuyên về lập luận logic, sau đó được tùy chỉnh để đọc hiểu hình học.

1705547118209.png

Các bước để AlphaGeometry giải bài 3 IMO năm 2015 (bài khó nhất của day1)

Đầu tiên, mạng nơ ron được đào tạo dựa trên dữ liệu, tạo ra bằng thuật toán với 100 triệu ví dụ chứng minh hình học mà không sử dụng các lời giải của con người. Khi AlphaGeometry bắt đầu giải quyết một bài toán, công cụ biểu tượng sẽ bắt đầu trước. Nếu gặp bế tắc, mạng nơ ron sẽ đề xuất những cách khác để hỗ trợ.


Quá trình này được gọi là "dựng điểm phụ", kẻ thêm một đường thẳng, chia đôi một góc, vẽ một vòng tròn phụ... giống như cách con người giải một bài hình học. Vòng lặp tiếp tục cho đến khi ra đáp án hoặc cho đến khi hết 4,5 giờ, thời lượng dành cho các bài toán trong kỳ thi IMO.

Điểm đặc biệt của AI này, theo ba tiến sĩ là các dữ liệu đầu vào hoàn toàn nhân tạo. Triều cho biết AlphaGeometry tự sinh ra dữ liệu chất lượng cao, đủ tốt để đạt được hiệu suất nhất định mà không cần dữ liệu huấn luyện từ lời giải của con người. Đây là điều mà các công cụ AI khác như ChatGPT hay Gemini chưa làm được.

"Nói đơn giản là AlphaGeometry cho ra lời giải từ không có gì hết. Còn các mô hình AI hiện tại thì sẽ tìm kiếm các lời giải có sẵn hoặc tương tự của con người", TS Thắng chia sẻ.

Nhóm nghiên cứu cũng tạo ra một một hệ thống, gồm system 1 (phản ứng nhanh, tự động, vô thức) và system 2 (chậm rãi, logic) kết hợp với nhau. Việc này khá bình thường, nhưng khi đi chung với các dữ liệu nhân tạo thì tạo ra đột phá
Một tháng trước, khi trở về trường Phổ thông Năng khiếu, TS Thắng đã gửi cho TS Lê Bá Khánh Trình, lời giải của AI cho bài toán số 3 tại IMO 2015. Đây là một trong những bài toán hình học khó nhất trong các kỳ IMO. AlphaGeometry đã đưa ra đáp án sau 109 bước.

"Thầy Trình ấn tượng vì nó giải bằng các quy tắc rất đơn giản, nhưng thầy không hài lòng lắm vì các bài giải theo thầy phải có hồn, có vẻ đẹp nhất định và phải có sự kết nối với nhau", anh Thắng kể lại.
source: https://www.nytimes.com/2024/01/17/..._dGcS4JN7wWDxxTWd1aysT09_BJ9vjZ2k9oSCw8ADLgTg
Bài ghê nhất con AI này giải, 247 bước
0641_Facebook.jpg
 
chưa hiểu lắm cơ chế nhưng mà con AI này train mà ko dùng tới human label thì có vẻ hay đây
ông first author từng là cựu sv APCS,tức là học cử nhân 4 năm ở VN, là minh chứng cho việc sv VN vẫn có cơ hội ở sân chơi lớn, vozer nên bớt bỉ bôi sv Việt thế này thế nọ nhé :byebye:
via theNEXTvoz for iPhone
 
Last edited:
chưa hiểu lắm cơ chế nhưng mà con AI này train mà ko dùng tới human label thì có vẻ là một đột phá
ông first author từng là cựu sv APCS,tức là học cử nhân 4 năm ở VN, là minh chứng cho việc sv VN vẫn có cơ hội ở sân chơi lớn, vozer nên bớt bỉ bôi sv Việt thế này thế nọ nhé :byebye:

via theNEXTvoz for iPhone
Cùng trường ông này (k biết có cùng làm không) cũng có cu e mình đang học PhD. Trước đó nó cũng học 4 năm ở BKHN
Nền cơ bản của sv VN k tệ đâu
 
AI này giải toán như người rồi
O1rb0sK.png

Vì con người khi tiếp cận với bài toán mới thì cũng chỉ có cách thử sai, áp một số pattern quen thuộc vào xem có đưa nó về dạng bài thông thuộc không thôi. Xưa học hình cũng toàn kẻ bừa các đường, cho tới khi ra được dấu hiệu giải. Brute Force là cách duy nhất để "giải mã" một bài toán không có dấu hiệu nhận biết rồi
Yt3tXr3.gif
 
Ngoại đạo nên hỏi ngu chút, mấy con ai này là riêng rẽ à các fen, có gộp nó lại được với nhau ko?
 
Với 30 bài toán hình học trong kỳ thi Olympic Toán quốc tế (IMO) giai đoạn 2000-2022,
mấy bài toán cũ đã có đáp án tòe loe trên mạng thì AI gọi là copy paste chứ sao lại là giải toán nhỉ, phải cho làm những bài mới nhất đáp án chưa đc công bố chứ :ah:
 
chưa hiểu lắm cơ chế nhưng mà con AI này train mà ko dùng tới human label thì có vẻ là một đột phá
ông first author từng là cựu sv APCS,tức là học cử nhân 4 năm ở VN, là minh chứng cho việc sv VN vẫn có cơ hội ở sân chơi lớn, vozer nên bớt bỉ bôi sv Việt thế này thế nọ nhé :byebye:

via theNEXTvoz for iPhone
Vẫn có cơ hội nhưng cơ hội bao nhiêu thì không biết :shame:
Không biết có bản dùng thử con trên chưa nhỉ
 
mấy bài toán cũ đã có đáp án tòe loe trên mạng thì AI gọi là copy paste chứ sao lại là giải toán nhỉ, phải cho làm những bài mới nhất đáp án chưa đc công bố chứ :ah:
anh chưa đọc bài báo à, nói chung con này ko học thuộc như con gpt, nó tự sinh data (synthetic data) rồi train dần trên data đó

via theNEXTvoz for iPhone
 
mấy bài toán cũ đã có đáp án tòe loe trên mạng thì AI gọi là copy paste chứ sao lại là giải toán nhỉ, phải cho làm những bài mới nhất đáp án chưa đc công bố chứ :ah:
Đầu tiên, mạng nơ ron được đào tạo dựa trên dữ liệu, tạo ra bằng thuật toán với 100 triệu ví dụ chứng minh hình học mà không sử dụng các lời giải của con người. Khi AlphaGeometry bắt đầu giải quyết một bài toán, công cụ biểu tượng sẽ bắt đầu trước. Nếu gặp bế tắc, mạng nơ ron sẽ đề xuất những cách khác để hỗ trợ
Lý do nó tởm đây này.

Đầu tiên feed cho nó 100 triệu ví dụ chứng minh cơ bản. Kiểu 1+1 = 2, 2+2 =4, 2x3 = 6, 3! = 6 v...v
Sau đó cho nó ngồi làm tích phân, nó cứ áp các phương án thử sai vào cho tới khi ra được "chìa khóa" thì chạy theo hướng đó. Các phương án thử sai có thể là nhóm nhân tử chung, đặt ẩn phụ, logarit các thứ v...v
Giống y hệt cách con người giải toán luôn rồi
 
Lý do nó tởm đây này.

Đầu tiên feed cho nó 100 triệu ví dụ chứng minh cơ bản. Kiểu 1+1 = 2, 2+2 =4, 2x3 = 6, 3! = 6 v...v
Sau đó cho nó ngồi làm tích phân, nó cứ áp các phương án thử sai vào cho tới khi ra được "chìa khóa" thì chạy theo hướng đó. Các phương án thử sai có thể là nhóm nhân tử chung, đặt ẩn phụ, logarit các thứ v...v
Giống y hệt cách con người giải toán luôn rồi
chuẩn rồi, nó ko giải bằng symbolic solver dc thì sẽ nhờ language model tìm một auxiliary point gì đấy (thường là kẻ hình phụ các thứ), đúng như cách con người giải toán :big_smile:

via theNEXTvoz for iPhone
 
Nó biết kẻ đường phụ, đường phiếc thì mức độ tư duy tởm đấy :burn_joss_stick: , sớm muộn rồi các thầy cô giáo phổ thông sẽ bị thay thế nếu nó học được cách tư duy và truyền đạt được tư duy đó :burn_joss_stick:
 
Nó biết kẻ đường phụ, đường phiếc thì mức độ tư duy tởm đấy :burn_joss_stick: , sớm muộn rồi các thầy cô giáo phổ thông sẽ bị thay thế nếu nó học được cách tư duy và truyền đạt được tư duy đó :burn_joss_stick:
như trong phim wall-e 2008 luôn, con nít được dạy học bằng giáo viên AI.
 
Con này nó còn mới đẻ ra, cho nó sống sót luyện công thêm vài năm nữa thì lại chả khác gì cờ vây, máy ở level riêng còn human tự ngồi trong giếng thủ dâm với nhau :doubt:
 
như trong phim wall-e 2008 luôn, con nít được dạy học bằng giáo viên AI.
H những con AI này cho nó thêm 1 cái giọng đọc ngon, học thêm kĩ năng giảng dạy qua việc bắt chiếc các thầy cô giáo giảng hay thì nó xịn hơn giáo viên phổ thông nhiều, lại còn biết giảng k biết mệt mỏi, không phải chế độ, k phải thuê lớp, giáo viên không có cửa bật luôn :burn_joss_stick:
 
H những con AI này cho nó thêm 1 cái giọng đọc ngon, học thêm kĩ năng giảng dạy qua việc bắt chiếc các thầy cô giáo giảng hay thì nó xịn hơn giáo viên phổ thông nhiều, lại còn biết giảng k biết mệt mỏi, không phải chế độ, k phải thuê lớp, giáo viên không có cửa bật luôn :burn_joss_stick:
Nó chưa xử lý được học sinh làm trò. Giờ áp dụng thực tiễn chắc là áp cho đám dạy thi học sinh giỏi trước, vì nó làm thật, nên nó có thể áp dụng phương pháp vào dạy bọn gà nòi.

Chứ dạy phổ cập đại chúng máy móc vô hồn tôi e hơi căng
JtPO4ad.png
 
Lý do nó tởm đây này.

Đầu tiên feed cho nó 100 triệu ví dụ chứng minh cơ bản. Kiểu 1+1 = 2, 2+2 =4, 2x3 = 6, 3! = 6 v...v
Sau đó cho nó ngồi làm tích phân, nó cứ áp các phương án thử sai vào cho tới khi ra được "chìa khóa" thì chạy theo hướng đó. Các phương án thử sai có thể là nhóm nhân tử chung, đặt ẩn phụ, logarit các thứ v...v
Giống y hệt cách con người giải toán luôn rồi
hoạt động theo nguyên lý này thì AI của Google đã làm để đánh cờ vua, cờ vây nhiều năm trước rồi mà, chỉ không phải lĩnh vực toán học thôi.

Alpha Zero của Google được nạp luật chơi cờ ban đầu và tự học bằng cách đánh đi đánh lại với chính bản thân nó hàng triệu ván. Kết quả:

- Cờ vây: đánh bại kỳ vương cờ Vây Lee Sedol trong một trận BO5. Lee Sedol sau đó quá sốc và anh đã tuyên bố giải nghệ vì anh cho rằng con người không bao giờ có thể đánh cờ thắng được AI nữa.

- Cờ vua: Alpha Zero tự học chỉ trong ... vài ngày và thắng áp đảo StockFish - phần mềm cờ Vua vốn được xem là mạnh nhất thế giới từ trước tới nay. Sở dĩ Stockfish mạnh như thế là vì nó là một phần mềm mã nguồn mỡ, không ngừng được được hàng triệu kỳ thủ, lập trình viên trên khắp thế giới chung tay phát triển, cập nhật. Nó rất bá, cho tới khi gặp... Alpha Zero của Google.
 
Back
Top