Trong điều kiện tương tự thi thật, với hai buổi thi kéo dài 4,5 giờ, không sử dụng công cụ hay Internet, Deep Think đạt 35/42 điểm trong 5 câu hỏi đầu, do chính giám khảo của IMO chấm. Trong kỳ IMO năm nay, chỉ 67/630 thí sinh đạt từ 35 điểm trở lên - mức giành huy chương vàng.
"Chúng tôi xác nhận Google DeepMind đã đạt cột mốc được mong đợi từ lâu. Lời giải của AI đáng kinh ngạc ở nhiều khía cạnh. Giám khảo IMO nhận xét chúng rõ ràng, chính xác và phần lớn dễ hiểu", giáo sư Gregor Dolinar, Chủ tịch IMO, cho biết.
Xem lời giải đề thi IMO của Deep Think

Nhóm Google DeepMind chụp cùng Terence Tao (giữa) - Huy chương Fields, ở IMO 2025 tại Australia. Từ trái qua: Dawsen Hwang, Junehyuk Jung, Thang Luong, Yuri Chervonyi. Ảnh: NVCC
Deep Think là bản nâng cao của mô hình trí tuệ nhân tạo Gemini, được thiết kế đặc biệt để giải những bài toán phức tạp như trong kỳ thi IMO. Điểm nổi bật của AI này nằm ở khả năng tư duy song song, tức cho phép mô hình cùng lúc khám phá và kết hợp nhiều hướng giải khác nhau trước khi đưa ra câu trả lời, thay vì đi theo một chuỗi suy luận tuyến tính như các mô hình thông thường.
Để phát huy tối đa năng lực suy luận, nhóm nghiên cứu huấn luyện Gemini bằng kỹ thuật học tăng cường mới, sử dụng dữ liệu chuyên sâu lập luận nhiều bước, giải quyết vấn đề và chứng minh định lý. Ngoài ra, mô hình được cung cấp một kho dữ liệu chọn lọc gồm các lời giải toán học chất lượng cao, cùng các mẹo và chiến lược tổng quát để tiếp cận bài toán IMO hiệu quả hơn.
Google cho biết đây là bước tiến vượt bậc so với các mô hình trước. Năm ngoái, AlphaGeometry 2 của hãng cũng giải đúng 42/50 bài hình học của IMO 25 năm qua, ngang trình độ thí sinh giành huy chương vàng (40,9 bài). Còn AlphaProof cũng đạt điểm tuyệt đối 4 trong 6 bài IMO 2024, giành 28/42 điểm, ngang với thí sinh giành huy chương bạc.
"Chúng tôi tin rằng kết hợp sự lưu loát trong ngôn ngữ tự nhiên với khả năng lập luận chặt chẽ sẽ trở thành những công cụ vô giá cho các nhà toán học, nhà khoa học, kỹ sư và nhà nghiên cứu, giúp chúng ta nâng cao kiến thức của con người trên con đường hướng tới trí tuệ nhân tạo tổng hợp", Google cho biết.
Đầu tuần này, OpenAI, công ty phát triển ChatGPT, cũng tung ra mô hình ngôn ngữ lớn LLM thử nghiệm có khả năng giải đúng 5/ 6 câu hỏi của đề thi IMO 2025, tương đương thí sinh huy chương vàng.
Doãn Hùng