Trí tuệ nhân tạo tạo sinh không có rào chắn có thể gây hại cho việc học: Bằng chứng từ môn Toán trung học
- Giáo dục
Bastani, O. Bastani, A. Sungu, H. Ge, Ö. Kabakcı, & R. Mariman, Generative AI without guardrails can harm learning: Evidence from high school mathematics, Proc. Natl. Acad. Sci. U.S.A. 122 (26) e2422633122, https://doi.org/10.1073/pnas.2422633122 (2025).
Tóm tắt
Nghiên cứu thực địa này phân tích tác động của việc sử dụng các mô hình ngôn ngữ lớn (LLM) đối với kết quả học tập môn Toán của học sinh trung học, đặc biệt nhấn mạnh vào vai trò của các “rào chắn” (guardrails) trong thiết kế hướng dẫn dành cho AI.
1. Giới thiệu (Introduction)
Sự ra đời của AI tạo sinh hứa hẹn khả năng cá nhân hóa giáo dục ở quy mô lớn. Tuy nhiên, ranh giới giữa việc AI hỗ trợ tư duy và AI thay thế tư duy vẫn còn mờ nhạt. Nghiên cứu này tập trung vào việc liệu một hệ thống AI hỗ trợ “quá mức” có tạo ra hiệu ứng “chiếc nạng”, khiến học sinh mất khả năng giải quyết vấn đề độc lập hay không.
2. Thiết kế thực nghiệm (Experimental design)
Các nhà nghiên cứu thực hiện thí nghiệm ngẫu nhiên có đối chứng (RCT) trên gần 1.000 học sinh tại Thổ Nhĩ Kỳ. Điểm cốt lõi của thiết kế nằm ở việc phân tách các đối tượng thành 3 nhóm dựa trên cách thức tiếp cận kiến thức:
- Nhóm Đối chứng (Control group): Học tập theo phương pháp truyền thống với sách giáo khoa.
- Nhóm GPT Base (AI không rào chắn): Sử dụng AI với thiết lập cơ bản, sẵn sàng cung cấp lời giải khi được yêu cầu.
- Nhóm GPT Tutor (AI có rào chắn): Sử dụng AI được cấu hình để hoạt động như một gia sư sư phạm, tuyệt đối không cung cấp đáp án trực tiếp.
3. Cấu trúc câu lệnh và các rào chắn (Prompting and guardrails)
Đây là phần quan trọng nhất lý giải sự khác biệt trong kết quả học tập. Nghiên cứu đã xây dựng hai hệ thống câu lệnh (prompt) đối lập:
3.1. Thiết lập cho GPT Base
Câu lệnh dành cho nhóm này rất ngắn gọn và mang tính phục vụ: “Mục tiêu của bạn là gia sư cho một học sinh, giúp họ vượt qua quy trình giải bài toán. Hãy tuân thủ cẩn thận các hướng dẫn của học sinh”.
Hệ quả: AI hoạt động theo ý muốn của học sinh, cung cấp lời giải ngay khi được yêu cầu, dẫn đến sự thụ động trong tư duy.
3.2. Thiết lập cho GPT Tutor (Hệ thống có rào chắn)
Hệ thống câu lệnh này phức tạp hơn, tập trung vào việc phát triển sự hiểu biết sâu sắc về các khái niệm cốt lõi thông qua các quy tắc:
- Không cung cấp lời giải: AI bị cấm đưa ra kết quả cuối cùng trong mọi tình huống, ngay cả khi học sinh yêu cầu nhập vai (roleplay).
- Chiến lược “Giàn giáo” (Scaffolding): AI chỉ cung cấp lượng thông tin tối thiểu. Nếu học sinh bế tắc, AI phải đặt câu hỏi gợi mở hoặc chỉ ra lỗi sai thay vì làm hộ.
- Xác minh sự hiểu biết: Khi học sinh đưa ra đáp án, AI phải yêu cầu họ giải thích logic đằng sau để đảm bảo học sinh không đoán mò.
- Giới hạn phạm vi: AI không thảo luận bất kỳ chủ đề nào ngoài bài toán đang giải.
4. Ví dụ minh họa thực tế (Illustrative example)
Nghiên cứu sử dụng bài toán hình học giải tích: “Tìm phương trình đường thẳng đi qua A(-2,3) và song song với 2x-3y+5=0”.
- Với GPT Base: Học sinh có thể nhận ngay phương trình 2x-3y+13=0 chỉ sau một yêu cầu. Quá trình học kết thúc tại đó.
- Với GPT Tutor: AI sẽ dẫn dắt học sinh xác định hệ số góc (2/3), nhắc lại kiến thức về đường thẳng song song, và hướng dẫn sử dụng dạng phương trình điểm-hệ số góc. Nếu học sinh nhầm hệ số góc, AI sẽ cảnh báo về dạng phương trình chuẩn mà không tự sửa lỗi.
5. Kết quả (Results)
Kết quả ghi nhận sự tương phản rõ rệt giữa giai đoạn có AI và giai đoạn kiểm tra độc lập:
- Giai đoạn thực hành: Nhóm GPT Tutor và GPT Base có hiệu suất làm bài tốt hơn nhóm đối chứng lần lượt là 127% và 48%. AI thực sự giúp hoàn thành bài tập nhanh hơn.
- Giai đoạn kiểm tra độc lập: Khi không còn AI hỗ trợ, nhóm GPT Base có kết quả tệ hơn 17% so với nhóm đối chứng. Trong khi đó, nhóm GPT Tutor không bị suy giảm hiệu suất đáng kể.
6. Thảo luận và cơ chế gây hại (Discussion and mechanisms)
Nghiên cứu kết luận rằng AI không có rào chắn gây hại thông qua hai cơ chế chính:
- Sự ỷ lại (Dependency): Học sinh sử dụng AI như một “chiếc nạng” (crutch), khiến họ không rèn luyện được kỹ năng vượt qua bế tắc (vulnerability).
- Ảo tưởng về năng lực (Illusion of competence): Việc nhìn thấy AI giải bài quá mượt mà khiến học sinh tin rằng mình đã hiểu bài, dù thực tế não bộ không thực hiện các thao tác xử lý thông tin cần thiết để ghi nhớ dài hạn.
7. Kết luận (Conclusion)
Nghiên cứu khẳng định AI có tiềm năng lớn nhưng cũng mang lại rủi ro đáng kể cho giáo dục nếu không được thiết kế đúng cách. Các rào chắn sư phạm (guardrails) không phải là rào cản công nghệ, mà là yếu tố bắt buộc để đảm bảo AI đóng vai trò là công cụ hỗ trợ tư duy chứ không phải là công cụ thay thế tư duy.