Kỹ sư phần mềm Neel Somani thử nghiệm khả năng toán học trên mô hình GPT 5.2 của OpenAI và phát hiện điều thú vị: AI có thể giải toán ở cấp độ cao thay vì chỉ dừng ở mức giải bài tập sách giáo khoa. Ông nghiên cứu các bài toán Erdős - tập hợp hơn 1.000 giả thuyết của nhà toán học Hungary Paul Erdős, hiện được lưu trữ trực tuyến trên website cùng tên với mức độ phức tạp trải dài từ bài toán sơ cấp đến những vấn đề nằm ở ranh giới cao nhất của toán học hiện đại.
Erdős được xem là một trong những nhà toán học xuất sắc thế kỷ XX, với hàng trăm công trình toán học ở các lĩnh vực tổ hợp, lý thuyết đồ thị, số, xấp xỉ, tập hợp và xác suất. Để ghi nhận những cống hiến của ông, từ năm 2015, Hungary đã thành lập một cuộc thi có tên "Thách thức toán học quốc tế Paul Erdős".
Somani đã đưa một bài toán Erdős có độ phức tạp cao vào ChatGPT và để AI xử lý. Trong 15 phút, lời giải hoàn chỉnh đã được đưa ra. Thông qua công cụ đánh giá độc lập Harmonic, mọi bước giải và kết quả đều chính xác.
Minh họa khả năng AI có thể giải toán. Ảnh: ChatGPT
Theo Somani, chuỗi suy luận trên ChatGPT thậm chí ấn tượng hơn khi liệt kê ra các tiên đề toán học như công thức Legendre, tiên đề Bertrand và định lý Ngôi sao David (Star of David Theorem). So với lời giải của nhà toán học Noam Elkies ở Đại học Harvard đưa ra năm 2013, ChatGPT có giải pháp được đánh giá hoàn chỉnh hơn.
Với những người hoài nghi về trí tuệ máy móc, đây là kết quả đáng ngạc nhiên. Trước đó, AI bị đánh giá gặp khó khăn khi giải toán, kể cả với các bài đơn giản. Theo Wu Yiquan, nhà nghiên cứu khoa học máy tính tại Đại học Chiết Giang ở Hàng Châu, việc AI không giỏi toán rất phổ biến. Các LLM đứng sau không sở hữu khả năng toán học, bởi chúng dự đoán câu trả lời dựa trên dữ liệu đào tạo.
"Một số LLM hoạt động tốt trong bài kiểm tra toán có thể là do 'nhiễm dữ liệu', nghĩa là thuật toán đã ghi nhớ câu trả lời vì các câu hỏi tương tự đã có trong dữ liệu đào tạo của nó", Yiquan giải thích với SCMP năm ngoái. "Thế giới AI được mã hóa, do đó số, từ, dấu câu và khoảng trắng đều được xử lý như nhau. Bất kỳ thay đổi nào trong lời nhắc đều có thể ảnh hưởng đáng kể đến kết quả".
Năm 2023, giáo sư toán học Michael Brenner của Trường Kỹ thuật và Khoa học ứng dụng John A. Paulson đã giảng dạy một lớp cao học, ứng dụng AI cho các phương trình vi phân riêng phần phi tuyến trong khóa học. "Nó ổn, nhưng không xuất sắc lắm", Brenner nói với Harvard Gazette khi đó. "AI chỉ giải được từ 30% đến 50% số bài toán trong ba tuần đầu tiên của khóa học".
"Nhìn chung, AI không giỏi toán", Alex Kotran, đồng sáng lập kiêm CEO của AI Education Project, nói với The74 cuối năm 2024. "Các mô hình ngôn ngữ chỉ dự đoán từ tiếp theo, bạn sẽ nhận được kết quả không nhất quán. Nó chưa đủ trưởng thành để có thể được tin tưởng để mở rộng quy mô khi làm toán".
Tuy nhiên, sau hơn một năm, các mô hình AI tiến bộ nhanh chóng. Khả năng giải toán cải thiện theo từng phiên bản. Chẳng hạn, GPT 5.2 hiện suy luận tốt hơn các phiên bản trước. Với các bài toán trên website Erdős, kể từ ngày 25/12/2025 đến nay, có 15 vấn đề đã chuyển từ trạng thái "chưa giải quyết" sang "đã giải quyết", 11 trong số đó ghi nhận có sự tham gia của các mô hình AI.
"Nhiều bài toán Erdős vốn gây khó cho giới toán học, nhưng được AI hỗ trợ xử lý", nhà toán học Terence Tao viết trên Mastodon. Ông đưa ra giả thuyết rằng tính chất có thể mở rộng của các hệ thống AI khiến chúng "phù hợp hơn để được áp dụng một cách có hệ thống". Điều này giúp đơn giản hóa bài toán phức tạp.
Năm ngoái, một số AI được ghi nhận có khả năng giành huy chương vàng toán Olympic. Deep Think của DeepMind và ChatGPT của OpenAI giải được 5/6 bài trong đề thi Olympic Toán quốc tế (IMO) 2025. Năm 2024, AlphaGeometry 2 của Google giải đúng 42/50 bài hình học của IMO 25 năm qua, còn AlphaProof đạt điểm tuyệt đối 4 trong 6 bài IMO 2024, giành 28/42 điểm, ngang với thí sinh giành huy chương bạc.
Tuy nhiên, việc AI ngày càng giỏi toán cũng đặt ra câu hỏi mới về khả năng của LLM trong thúc đẩy ranh giới tri thức của con người. Latrenda Knighten, Chủ tịch Hội đồng Quốc gia Giáo viên Toán (NCTM) của Mỹ, đánh giá AI đã hỗ trợ con người giải toán, nhưng vẫn cần dựa vào khả năng phán đoán của bản thân để giải quyết các vấn đề toán học.
"Chúng ta biết rằng trẻ em học toán bằng cách giải quyết vấn đề, dùng kỹ năng lập luận, tư duy phản biện, có cơ hội hợp tác với nhau và thảo luận về những gì chúng đang làm", Knighten nói với Education Week. "Nếu phụ thuộc AI, những kỹ năng đó sẽ không được phát huy".
Trong quá khứ, nhiều chuyên gia cũng khuyến cáo người dùng không nên tin hoàn toàn vào mô hình AI. Thực tế, chúng nhiều lần bị phát hiện trả lời sai hoặc gặp tình trạng "ảo giác", tức bịa ra câu trả lời sao cho nghe có vẻ thuyết phục nhất.
Bảo Lâm tổng hợp
- Tiến sĩ Việt kể về 'bốn ngày kỳ diệu' phát triển AI giải toán Olympic