Luận văn Tổng quan về phương pháp trắc nghiệm khách quan

Tài liệu Luận văn Tổng quan về phương pháp trắc nghiệm khách quan: Luận Văn "Tổng quan về phương pháp trắc nghiệm khách quan" Mở đầu Để nâng cao chất lượng giáo dục ở các bậc học thì việc cải tiến hệ thống kiểm tra, đánh giá kết quả của học sinh đóng vai trò hết sức quan trọng. Bên cạnh việc sử dụng phương pháp truyền thống mà từ trước đến nay chúng ta vấn áp dụng để kiểm tra bằng phương pháp tự luận, nhưng thực tế không phải lúc nào nó cũng mang lại kết quả khả quan. Các phương pháp đánh giá kết quả học tập rất đa dạng, mọi phương pháp đều có những ưu điểm, nhược điểm của nó, không có phương pháp đều có những ưu, nhược điểm của nó, không có phương pháp nào là hoàn mỹ với mọi mục tiêu giáo dục. Tuỳ theo mục tiêu cụ thể mà lựa chọn phương pháp đánh giá cho thích hợp. Trên tinh thần hiện nay là chúng ta đang thực hiện chương trình đổi mới phương pháp giảng dạy vì vậy trong bài khoá luận này chúng tôi mạnh dạn đưa một phương pháp đánh giá bài thi đó là đánh giá bằng phương pháp trắc nghiệm khách quan. Đây là một phương pháp h...

pdf57 trang | Chia sẻ: haohao | Lượt xem: 1212 | Lượt tải: 0download
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Tổng quan về phương pháp trắc nghiệm khách quan, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Luận Văn "Tổng quan về phương pháp trắc nghiệm khách quan" Mở đầu Để nâng cao chất lượng giáo dục ở các bậc học thì việc cải tiến hệ thống kiểm tra, đánh giá kết quả của học sinh đóng vai trò hết sức quan trọng. Bên cạnh việc sử dụng phương pháp truyền thống mà từ trước đến nay chúng ta vấn áp dụng để kiểm tra bằng phương pháp tự luận, nhưng thực tế không phải lúc nào nó cũng mang lại kết quả khả quan. Các phương pháp đánh giá kết quả học tập rất đa dạng, mọi phương pháp đều có những ưu điểm, nhược điểm của nó, không có phương pháp đều có những ưu, nhược điểm của nó, không có phương pháp nào là hoàn mỹ với mọi mục tiêu giáo dục. Tuỳ theo mục tiêu cụ thể mà lựa chọn phương pháp đánh giá cho thích hợp. Trên tinh thần hiện nay là chúng ta đang thực hiện chương trình đổi mới phương pháp giảng dạy vì vậy trong bài khoá luận này chúng tôi mạnh dạn đưa một phương pháp đánh giá bài thi đó là đánh giá bằng phương pháp trắc nghiệm khách quan. Đây là một phương pháp hết sức mới mẻ với nền giáo dục nước ta nhưng nó lại đánh giá tương đối chính xác và khách quan. Phương pháp đánh giá bài thi bằng trắc nghiệm tự luận mà chúng ta vẫn đang sử dụng hiện nay đang chiếm ưu thế, nhưng không có nghĩa là nó là phương pháp tối ưu, nó vẫn có những hạn chế nhất định mà phương pháp trắc nghiệm khách quan đã ra đời và khảng định được những ưu thế vượt trội. Tiếc thay một phương pháp hay như vậy được thế giới hiện nay sử dụng rất rộng rãi trong các kỳ thi tuyển sinh đại học mà lại có vẻ rất mơ hồ với cả những chuyên gia về giáo dục nước ta. Đội ngũ cán bộ giảng dậy và những người biết về phương pháp này lại rất mỏng. Vậy vấn đề đặt ra là chúng ta đổi mới phương pháp giảng dạy thì nên chăng đổi mới phương pháp kiểm tra đánh giá bài thi là cần thiết ? Xuất phát từ nhu cầu đó, chúng tôi xin biên soạn chủ đề về việc kiểm tra đánh giá thành quả học tập bằng phương pháp trắc nghiệm khách quan. Mục đích của việc nghiên cứu phương pháp đánh giá bằng trắc nghiệm khách quan đầu tiên giới thiệu cho mọi người cùng biết cơ bản thế nào là phương pháp trắc nghiệm khách quan. Chúng tôi muốn khẳng định ưu thế khi dùng phương pháp trắc nghiệm khách quan so với việc dùng phương pháp tự luận. Cuối cùng chúng tôi sẽ thực hiện thí điểm cho học sinh làm bài thi bằng các câu hỏi dạng trắc nghiệm khách quan. Đối tượng và khách thể nghiên cứu của đề tài là chúng tôi sẽ xây dựng bộ câu hỏi trắc nghiệm trên nền tảng kiến thức bộ môn hoá lớp 10. Đối tượng nghiên cứu là học sinh lớp 10 khối chuyên hoá trường trung học phổ thông Hai Bà Trưng Hà Nội. Nếu việc thử nghiệm cho học sinh làm đề thi bằng trắc nghiệm khách quan của chúng tôi thành công thì qua phân tích kết quả chúng tôi sẽ khẳng định ưu thế của việc dùng phương pháp trắc nghiệm khách quan là hoàn toàn có cơ sở khoa học. Nhiệm vụ khi nghiên cứu về đề tài này của chúng tôi là trước tiên xây dựng được bộ các câu hỏi trắc nghiệm khách quan môn hoá lớp 10, thứ hai là thực hiện thí điểm đề thi bằng trắc nghiệm khách quan và từ đó chúng tôi sẽ phân tích các kết quả như tính độ khó, độ tin cậy … và cuối cùng tổng kết lại liệu phương pháp này có đạt được mục tiêu giáo dục đề ra hay không. Việc xây dựng bộ câu hỏi trắc nghiệm chỉ trong chương trình kiến thức lớp dự định đề thi trong 30 phút và 1 đề thi sẽ gồm khoảng 30 câu. Phạm vi nghiên cứu là học sinh lớp 10 chuyên hoá trường phổ thông trung học Hai Bà Trưng. Phương pháp chúng tôi dùng khi nghiên cứu đề tài đó là phương pháp quan sát, phương pháp điều tra, kiểm tra và cuối cùng là thống kê sau khi đã dùng trắc nghiệm khách quan làm thí điểm trên học sinh. Chúng tôi nghĩ với sự chuẩn bị kỹ lưỡng hệ thống các câu hỏi và việc thử nghiệm thành công thì sẽ khẳng định được những ưu điểm của phương pháp trắc nghiệm khách quan là hoàn toàn có cơ sở khoa học. Cấu trúc của khoá luận nghiên cứu của chúng tôi được cụ thể như sau: -Mục lục -Mở đầu -Chương 1 Tổng quan về phương pháp trắc nghiệm khách quan -Chương 2 các bước xây dựng bài kiểm tra bằng trắc nghiệm khách quan -Chương 3 Phân tích kết quả nghiên cứu đề tài -Chương 4 :kết luận 10.Kế hoạch nghiên cứu -Thảo luận nhóm phản biện về mục tiêu giáo dục, tiến trình và hình thức hoạt động -Chuẩn bị hệ thống câu hỏi và phân công nhiệm vụ trong nhóm -Viết các câu hỏi dạng trắc nghiệm khách quan -Phản biện câu hỏi trong nhóm (có điều chỉnh bổ sung) -Chuẩn bị các dạng câu hỏi trắc nghiệm tương tương để thử nghiệm -Trắc nghiệm thử -Phân tích câu hỏi MỤC LỤC Mở đầu Chương I: Tổng quan về phương pháp trắc nghiệm khách quan I.1 Dại cương về phương pháp trắc nghiệm khách quan 4 I.1.1 Phân loại phương pháp trắc nghiệm 4 I.1.1.1 Phương pháp quan sát 5 I.1.1.2 Phương pháp vấn đáp 5 I.1.1.3 Phương pháp trắc nghiệm viết 5 I.1.2 Các dạng câu hỏi trắc nghiệm khách quan 5 I.1.2.1 Câu mở (Opendended) 5 I.1.2.2 Câu điền khuyết (Supply items) 5 I.1.2.3 Loại câu đúng sai (true flase) 5 I.1.2.4 Loại câu hỏi nhiều lựa chọn (Multiple choice-MCQ) 6 I.1.3 Ưu điểm cơ bản của phương pháp trắc nghiệm khách quan với phương pháp tự luận 6 I.1.3.1 Câu hỏi trắc nghiệm khách quan đánh giá khách quan hơn các câu hỏi tự luận 7 I.1.3.2 Câu hỏi trắc nghiệm khách quan kiểm tra được lượng học sinh lớn hơn câu hỏi tự luận trong một lần thi 7 I.1.3.3 Câu hỏi trắc nghiệm khách quan ít chệch tủ hơn, ít may rủi hơn các câu dạng tự luận 8 I.2 Những yếu tố đặc trưng để đánh giá một bài kiểm tra hay bài thi bằng trắc nghiệm khách quan 8 I.2.1 Độ khó, độ phân biệt của một câu hoặc một bài trắc nghiệm 8 I.2.1.1 Độ khó của câu trắc nghiệm 8 I.2.1.2 Độ phân biệt của câu trắc nghiệm 9 I.2.2 Độ tin cậy và độ giá trị của một bài trắc nghiệm 10 I.2.2.1 Độ tin cậy của bài trắc nghiệm 10 I.2.2.2 Độ giá trị của bài trắc nghiệm 11 I.3 Các loại điểm trắc nghiệm 12 I.3.1 Điểm thô 12 I.3.2 Điểm tiêu chuẩn tuyệt đối 12 I.3.3 Điểm tương đối dựa vào phân bố chuẩn 13 I.3.4 Các loại điểm khác 14 I.3.4.1 Điểm trắc nghiệm tiêu chuẩn hoá của ETS 14 I.3.4.2 Điểm trắc nghiệm trí thông minh 14 I.3.5 Thang điểm được sử dụng ở nước ta 14 I.4 Lý thuyết ứng đáp câu hỏi và mô hình Rasch 14 I.4.1 Lý thuyết ứng dụng câu hỏi 14 I.4.1.1 Khái niệm chung về lý thuyết đáp ứng câu hỏi 14 I.4.1.2 Các thao tác tiến hành để xây dựng thuyết ứng đáp câu hỏi 15 I.4.2 Mô hình Rasch 16 I.4.2.1 Giả thiết của Rasch về việc ứng đáp câu hỏi 16 I.4.2.2 Hàm ứng đáp câu hỏi theo Rasch 16 I.4.2.3 Ứng dụng của mô hình Rasch 17 Chương II : các bước xây dựng bài kiểm tra bằng TNKQ II.1 Các bước xây dựng một bài kiểm tra bằng TNKQ 18 II.1.1 Phân tích nội dung và phác thảo bài trắc nghiệm 18 II.1.2 Viết lại câu hỏi trắc nghiệm 19 II.1.3 Duyệt lại câu hỏi trắc nghiệm 19 II.1.4 Lưu ý chung khi viết câu hỏi khách quan 20 II.2 Bản đặc trưng 2 chiều 21 II.2.1 Sơ lược về kiến thức chương trình hoá 10 21 II.2.1.1 Cấu trúc chương trình 21 II.2.1.1 Nội dung kiến thức 22 II.3 Phương pháp đánh giá bài trắc nghiệm 26 II.3.1 Các mức độ mục tiêu trong lĩnh vực nhận thức 26 II.3.2 Yêu cầu bài thi trắc nghiệm khách quan 29 II.3.2.1 Yêu cầu về nội dung 29 II.3.2.2 Yêu cầu về các mức kỹ năng 30 II.3.2.3 Yêu cầu về cách tổ chức để kiểm tra 31 Chương III: Phân tích kết quả nghiên cứu III.1 Các bước tiến hành thí nghiệm 33 III.2 Phân tích kết quả thực tế 33 III.2.1. Kết quả chung 33 III.2.2. Phân tích câu trắc nghiệm 34 III.3. Xây dựng mô hình Rasch trên số liệu thực 37 III.3.1. Sự phù hợp của các câu hỏi 37 III.3.2. Sự phù hợp của các thí sinh 38 III.3.3. Phân bố khả năng trả lời đúng của thí sinh và độ khó của các câu hỏi 40 III.3.4 Phân tích kết quả từng câu hỏi 41 III.3.5. Sơ đồ biểu diễn năng lực và độ khó của các câu hỏi trên một thang đo 43 Chương IV: Kết luận IV.1. Khoa học đo lường và đánh giá trong giáo dục trên thế giới và nước ta 47 IV.1.1. Trên thế giới 47 IV.1.2. Nước ta 47 IV.2. Giải pháp về phát triển phương hướng khoa học đo lường ở nước ta 48 Tài liệu tham khảo Chương I : TỔNG QUAN VỀ PHƯƠNG PHÁP TRẮC NGHIỆM KHÁCH QUAN I.1. Đại cương về phương pháp trắc nghiệm khách quan I.1.1.Phân loại các phương pháp trắc nghiệm Trắc nghiệm là một phép lượng giá cụ thể mức độ khả năng thể hiện hành vi trong lĩnh vực nào đó của một người cụ thể nào đó (thí sinh).Phương pháp trắc nghiệm có thể được chia ra làm ba loại lớn: loại quan sát, loại vấn đáp và loại viết được minh hoạ qua sơ đồ dưới đây: Các phương pháp TN nghi nghiê cc Quan sát Viết Vấn đáp Trắc nghiệm khách quan Trắc nghiệm tự luận Tiểu luận Cung cấp thông tin Ghép đôi Điền khuyết Trả lời ngắn Đúng sai Nhiều lựa chọn I.1.1.1. Phương pháp quan sát: Là phương pháp giúp các định những thái độ, sự phản ứng vô ý thức, cách giải quyết vấn đề trong một tình huống đang được nghiên cứu. I.1.1.2.Phương pháp vấn đáp: Thường thích hợp với trẻ em, có lợi khi nêu câu hỏi một cách tự phát trong một tình huống cần kiểm tra. I.1.1.3.Phương pháp trắc nghiệm viết: Là phương pháp thường được sử dụng nhiều nhất vì nó có một số ưu điểm cơ bản sau đây : -Kiểm tra được nhiều học sinh trên một lần thi -Cung cấp một bản ghi rõ ràng các câu trả lời của học sinh để dùng cho việc chấm điểm. -Dễ quản lý hơn vì bản thân người chấm không tham gioa vào bối cảnh kiểm tra. I.1.2.Các dạng câu hỏi trắc nghiệm khách quan I.1.2.1.Câu mở (Open endecl): Loại câu này đòi hỏi học sinh phải nhớ lại kiến thức hơn là nhận biết. Ví dụ: “Người vợ thứ ba của Henry VIII là ai ?”. Hoặc có những câu có chỗ trống để điền vào hoặc có sự hướng dẫn để học sinh cung cấp thông tin đáp ứng với câu dẫn như “Bên cạnh tên mỗi nước trong danh mục này, hãy viết tên thủ đô nước đó” I.1.2.2.Câu điền khuyết (Supply items): Học sinh phải nhớ lại kiến thức do đó trả lời bằng một hay một số từ cho một câu hỏi trực tiếp hay một câu nhận định chưa đầy đủ. Các loại câu này còn gọi là loại câu hỏi điền vào chỗ trống (com pletion items).Ví dụ: Tên của một dụng cụ dùng để đo nhiệt độ là gì? Loại câu hỏi này có ưu thế hơn các loại câu hỏi khách quan khác ở chỗ đòi hỏi học sinh phải tìm kiếm câu trả lời đúng hơn là nhận ra câu trả lời đúng bằng các thông tin đã cho. I.1.2.3.Loại câu đúng sai (true False): Đó có thể là những phát biểu được đánh giá là đúng hay là sai hoặc chúng có thể là các câu hỏi trực tiếp để trả lời là “có” hay “không”. Các phương án trả lời là thích hợp để gợi nhớ lại kiến thức và một khối lượng kiến thức đáng kể có thể được kiểm tra một cách nhanh chóng. Tuy nhiên câu dẫn của loại câu hỏi này phải thật hoàn toàn rõ ràng để có thể trả lời dứt khoát là “có” hay “không”. Điều này tạo ra sự khó khăn khi áp dụng loại câu hỏi này để kiểm tra trình độ hiểu biết cao hơn, nó không tạo cơ hội cho học sinh phân biệt những sắc thái tinh tế có ý nghĩa hay nhiều cách trả lời khác ở trình độ cao hơn. I.1.2.4.Loại câu hỏi nhiều lựa chọn (Multiple choice-MCQ): Loại này thường có hình thức của một câu phát biểu không đầy đủ hay một câu hỏi dẫn được nối tiếp bằng một số câu trả lời mà học sinh phải chọn.: - Trả lời đúng rõ rệt -Câu trả lời tốt nhất trong nhiều câu chọn hợp lý, -Câu trả lời kém nhất hay câu trả lời không có liên quan gì nhất, hay có nhiều hơn là một câu trả lời thích hợp. Những câu trả lời không đúng được gọi là các câu nhiễu (distracter). Câu dẫn có thể có dưới dạng sơ đồ hay đồ thị và không nhất thiết thuần tuý bằng lời. Loại câu MCQ cần được xây dựng một cách thận trọng để tránh chỗ không rõ nghĩa, nhưng chúng có thể được dùng để kiểm tra những trình độ cao hơn về nhận thức tiện hơn các loại câu hỏi khách quan khác. I.1.3.Ưu điểm cơ bản của phương pháp trắc nghiệm khách quan với phương pháp tự luận. Loại câu hỏi tự luận thường đòi hỏi học sinh phait viết nhiều câu để trả lời, nó không có một câu trả lời đúng haty một kiểu trả lời. Để đánh giá được một cách chính xác và có chất lượng, một bài tự luận phải được chấm bởi một người có kinh nghiệm và hiểu biết về lĩnh vực của môn học tương ứng. Bài trắc nghiệm tự luận không thể đánh giá một cách tuyệt đối là đúng hay là sai. Như vậy ưu điểm của các câu hỏi khách quan so với dạng câu hỏi tự luận được thể hiện ở bảng sau đây : Ưu thế thuộc về phương pháp Vấn đề Trắc nghiệm Tự luận Ít tốn công ra đề x Đánh giá được khả năng diễn đạt, đặc biệt là diễn đạt tư duy trừu tượng x Việc sáng tạo khi trả lời không bị hạn chế bởi một khung câu hỏi sẵn x Đề thi phru kín nội dung môn học x Ít may rủi do trung tủ, trật tủ x Ít tốn công chấm thi x Khách quan trong chấm thi x Áp dụng được công nghệ mới trong việc nâng cao chất lượng đề thi, giữ bí mật đề thi, hạn chế quay cóp khi thi, hạn chế tiêu cực trong chấm thi và giúp phân tích kết quả thi. x I.1.3.1.Câu hỏi trắc nghiệm khách quan đánh giá khách quan hơn các câu hỏi tự luận Bởi vì các câu hỏi khách quan có đáp án chính xác, rõ ràng nên việc chấm điểm thường rất chính xác. Kể cả những người không hiểu gì về chuyên môn cũng có thể chấm điểm được nếu như cho sẵn đáp án. Việc chấm điểm các câu hỏi loại này có thể được sử dụng vào quét bằng máy tính vừa nhanh mà rất chính xác. Còn việc chấm các câu hỏi tự luận rất phụ thuộc chủ quan vào người chấm. Những yếu tố chủ quan như tình cảm, thời tiết … sẽ ảnh hưởng tới điểm thi. Nên cùng một bài thi nhưng nếu cùng một người chấm có thể sẽ cho số điểm khác nhau ở các thời điểm khác nhau. I.1.3.2.Câu hỏi trắc nghiệm khách quan kiểm tra được lượng học sinh lớn hơn câu hỏi tự luận trong một lần thi. Xuất phát từ một lý do là dạng câu hỏi tự luận chấm điểm dễ dàng hơn, có thể chấm được hàng nghìn bài thi trong khoảng thời gian ngắn bằng cách sử dụng máy chấm nên khi cần kiểm tra một lượng lớn học sinh thì phương pháp dùng câu trắc nghiệm khách quan có ưu thế hơn hẳn vì các câu hỏi dạng tự luận chấm điểm tốn rất nhiều thời gian vì người chấm là chủ quan. I.1.3.3.Câu hỏi trắc nghiệm khách quan ít chệch tủ hơn, ít may rủi hơn các câu tự luận. Thật vậy, do các câu hỏi dạng khách quan bao quát, trải rộng toàn bộ kiến thức, một đề thi lại có rất nhiều câu hỏi nên việc chệch tủ là ít hiếm xảy ra. Học sinh cần phải học bao quát toàn bộ kiến thức không như loại câu hỏi tự luận, học sinh sẽ dễ học tủ vì đề thi dạng này ít câu hỏi không xuyên suốt được toàn bộ kiến thức đã học. Nhiều người rất mơ hồ rằng cứ nghĩ khi khoanh ngẫu nhiên câu trả lời thì có khả năng là đúng vì vậy dễ ăn điểm hơn loại câu tự luận. Nhưng nếu hiểu theo ý đó thì hết sức sai lầm và thực sự người đó chưa hiểu gì về câu hỏi khách quan hết. Ví dụ nếu ta trả lời đại một câu hỏi trắc nghiệm dạng nhiều lựa chọn (5 lựa chọn chẳng hạn) thì xác suất chọn hú hoạ như vậy sẽ là 20%. Mà thường bài thi dùng câu hỏi dạng này quy định nếu xác suất xấp xỉ 20% câu trả lời đúng lấy mốc là điểm không. Như vậy một người chọn hú hoạ cũng chỉ có số điểm lân cận điểm không mà thôi. Tuy nhiên chúng ta không được khẳng định phương pháp đánh giá nào có ưu thế tuyệt đối so với phương pháp kia. Tuỳ vào điều kiện, yếu tố ảnh hưởng và yêu cầu của mục tiêu giáo dục mà lựa chọn phương pháp kiểm tra thích hợp chứ không phải là đo được cái cần đo, trong trường hợp đó thi bài trắc nghiệm có độ tin cậy cao nhưng độ giá trị rất thấp. I.2.Những yếu tố đặc trưng để đánh giá một bài kiểm tra hay bài thi bằng trắc nghiệm khách quan. I.2.1.Độ khó, độ phân biệt của một câu hoặc một bài trắc nghiệm. 1.1.Độ khó của câu trắc nghiệm. Độ khó của câu trắc nghiệm thức được định nghĩa bằng tỷ số của tổng số người trả lời đúng câu trắc nghiệm so với tổng số ngươì làm câu trắc nghiệm ấy. Độ khó P của câu thứ i = Error! Nếu độ khó có giá trị nằm trong khoảng 0,25 đến 0,75 thì câu trắc nghiệm vừa sức với học sinh. Còn nếu giá trị độ khó xa số 0,25 và 0,75 thì câu trắc nghiệm là quá khó hay quá dễ với thí sinh. Khi chọn lựa các câu trắc nghiệm theo độ khó người ta thường phải loại những câu quá khó (không ai làm đúng) hoặc quá dễ (ai cũng làm đúng). Một bài trắc nghiệm tốt khi có nhiều câu ở độ khó trung bình. Ví dụ một câu trắc nghiệm có 50 thí sinh tham gia trả lời thì có 30 thí sinh trả lời đúng, vậy độ khó của câu trắc nghiệm đó sẽ là : P = Error! = 0,6 Giá trị 0,6 nằm trong khoảng (0,25, 0,75) nên đây là câu trắc nghiệm vừa sức với đối tượng dự thi. I.2.Độ phân biệt của câu trắc nghiệm Độ phân biệt của câu trắc nghiệm đo lường mức độ khác nhau giữa các đối tượng khác nhau hay đo được năng lực làm bài giữa học sinh giỏi và học sinh kém. Để tính độ phân biệt của câu trắc nghiệm thường chúng sta làm theo phương pháp cổ điển như sau: Trong một tập hợp thí sinh tham gia trả lời câu hỏi, dựa vào tổng điểm thô của thí sinh người ta sẽ chia thành 2 nhóm khác nhau, một nhóm gồm những học sinh giỏi đạt điểm cao từ trên xuống, còn một nhóm gồm những học sinh kém đạt điểm kém từ dưới lên. Gọi C là số thí sinh làm đúng câu hỏi thuộc nhóm giỏi, T là số thí sinh làm đúng câu hỏi thuộc nhóm kém, S là lượng thí sinh của một trong 2 nhóm trên (đều chiếm số phần trăm về tổng số thí sinh nhất định) độ phân biệt D của câu hỏi được tính theo công thức sau: D = Error! VD:Trong 100 thí sinh tham gia trả lời câu hỏi, chọn mỗi nhóm giỏi và kém là 20 người. Xét một câu hỏi nào đó nhóm giỏi có 15 người trả lời được, nhóm kém có 6 người trả lời được, vậy độ phân biệt của câu trắc nghiệm này là : D = Error! = 0,45 Phương pháp trên để tính độ phân biệt tương đối đơn giản, có thể tính bằng tay, nhưng tính độ phân biệt của câu trắc nghiệm ở mức độ khái quát hơn, đó là hệ số tương quan giữa các điểm của câu trắc nghiệm đó với tổng điểm của bài trắc nghiệm xét trên toàn bộ thí sinh làm bài trắc nghiệm (hay còn gọi là hệ số tương quan nhị phân) thông thường trị số độ phân biệt của câu hỏi có thể chấp nhận được phải lớn hơn 0,2 ứng vớimức ý nghĩa 0,05 trong phép thử. I.2.2. Độ tin cậy và độ giá trị của một bài trắc nghiệm I.2.2.1.Độ tin cậy của bài trắc nghiệm Người ta có thể tính độ tin cậy của bài trắc nghiệm bằng các cách sau: -Phương pháp trắc nghiệm -trắc nghiệm lại. Tức là dùng một bài trắc nghiệm cho một nhóm thí sinh làm hai lần và tính hệ số tương quan giữa hai bộ điểm. -Phương pháp các bài trắc nghiệm tương đương: Cho một nhóm thí sinh làm hai bài trắc nghiệm tương đương nhau, rồi tính độ tương quan giữa hai bộ điểm, nhưng phương pháp này phải tốn rất nhiều công sức để soạn các bài trắc nghiệm thực sự tương đương nhau., -Phương pháp phân đôi bài trắc nghiệm : Tạo 2 bài trắc nghiệm tương đương nhau, mỗi bài là một nửa bài trắc nghiệm. Khi ấy độ tin cậy của nửa bài trắc nghiệm bằng hệ số tương quan giữa hai bộ điểm của 2 nửa bài trắc nghiệm, còn độ tin cậy của toàn bài trắc nghiệm thu được khi hiệu chỉnh việc tăng độ dài gấp đôi. Sự phụ thuộc của độ tin cậy của bài trắc nghiệm vào độ dài của nó được tính theo công thức tổng quát Spear man Baoun Pn = Error! Trong đó Rs là độ tin cậy của bài trắc nghiệm ngắn xuất phát Rn là độ tin cậy của bài trắc nghiệm có độ dài gấp n lần. Như vậy trong trường hợp bài trắc nghiệm có độ dài gấp đôi, ta dùng công thức: R = Error! -Phương pháp Kuoler- Richardson- 20 để tính độ tin cậy bài trắc nghiệm : R = Error! 1 - 2 pq Trong đó: k - Số câu hỏi bài trắc nghiệm p- Tỷ lệ trường hợp trả lời đúng cho 1 câu q- Tỷ lệ trả lời sai cho một câu, q = 1-p 62 - Phương sai của tổng điểm mọi thí sinh đối với toàn bài TNo Trong trường hợp độ khó của các câu không khác nhau nhiều, tính độ tin cậy bởi công thức dễ tính hơn - công thức k - R - 21 R = Error! 1- M là giá trị trung bình của điểm số bài trắc nghiệm I.2.2.2. Độ giá trị của bài trắc nghiệm Độ giá trị của bài trắc nghiệm thành quả học tập thường được phân loại thành các loại sau đây: +Độ giá trị tiên đoán: một bài trắc nghiệm dùng để xét tuyển thường có giá trị tiên đoán, tức là bodfọ điểm số của nó tương đối tốt với một bài trắc nghiệm đánh giá hạc các tiêu chí để đánh giá theo mục tiêu. Ví dụ, bộ điểm bài trắc nghiệm tuyển sinh đại học đối với một nhóm thí sinh nào đó phải tương quan tốt với kết quả học tập cuối giai đoạn 1 học đại học. +Độ giá trị đồng thời: tương tự giá trị tiên đoán, nhưng chỉ khác về thời gian tức là bài trắc nghiệm đánh giá hoặc các tiêu chí để đánh giá xảy ra đồng thơì với bài trắc nghiệm tiên đoán. +Độ giá trị cấu trúc: liên quan đến các loại trí năng và mức kỹ năng cần đo theo các mục tiêu cụ thể của môn học. +Độ giá trị nội dung: phản ánh đầy đủ các mục tiêu xác định cho môn học, bao trùm đầy đủ nội dung của môn học. Để xác định độ giá trị về nội dung không thể chỉ dựa vào các tính toán thống kê như độ giá trị tiên đoán hoặc giá trị đồng thời, mà phải phân tích tỷ mỷ và công phu bài trắc nghiệm đối chiếu với mục tiêu và nôị dung môn học. R chính là độ phân biệt của câu trắc nghiệm hay hệ số tương quan điểm nhị phân mà chúng ta sẽ xét kỹ ở phần sau. Hệ số tương quan là một đại lượng để đo mối quan hệ tuyến tính giữa hai biến ngẫu nhiên, có giá trị phân bố trong khoảng từ -1 đến +1. I.3.Các loại điểm trắc nghiệm. Vì phân bố tần suất năng lực của một tập hợp học sinh về một chuyên môn nào đó thường theo dạng chuẩn nên phân bố tần suất của điểm thi của thí sinh (nếu phản ánh đúng năng lực) cũng tuân theo dạng chuẩn. Chúng ta sẽ xét một số loại điểm sau đây: I.3.1.Điểm thô. Một đề thi TNKQ thường bao gồm nhiều câu hỏi. Mỗi câu hỏi được gán một điểm số nào đó, thường là điểm 1 nếu làm đúng, điểm 0 nếu làm sai. Cộng điểm số của từng thí sinh lại được gọi là điểm thô (rav score) I.3.2.Điểm tiêu chuẩn tuyệt đối:Là cách cho điểm thường được dùng thuộc loại này là điểm phần trăm đúng. Điểm được tính theo tỷ lệ phần trăm số câu làm đúng trên tổng số câu của bài trắc nghiệm X = 100 x Error! Ví dụ một thí sinh làm đúng 35 câu hỏi trong tổng số 50 câu hỏi thì điểm tiêu chuẩn tuyệt đối của thí sinh đó là x = 100 Error! = 70. Tuy nhiên việc cho điểm theo kiểu này thường rơi vào tình trạng tuỳ tiện, không có tính khách quan. I.3.3.Điểm tương đối dựa vào phân bố điểm: Giả sử điểm thô thu được từ kết quả trắc nghiệm trên một nhóm nào đó có phân bố tần suất gần với dạng phân bố chuẩn với giá trị trung bình là Xt và độ lệch tiêu chuẩn là 6s thường thì người ta sẽ biến đổi các điểm thô này sang một thang điểm với giá trị trung bình là Xs và độ lệch chuẩn là 6s.Để thực hiện phép biến đổi này chúng ta phải dãn đường cong phân bố chuẩn ứng với thang điểm thô sao cho độ lệch chuẩn của đường cong đạt giá trị 6s, sau đó dịch chuyển đường cong thu được sao cho điểm gốc của nó dịch chuyển đến vị trí giá trị trung bình Xs trên trục số. Phép co giãn và dịch chuyển đó được thực hiện bằng hệ thức sau: t6 tXXt  = s6 sXXs  Suy ra Xs = Error! Xt - Xt + Xs. Với một phân bố chuẩn có giá trị trung bình được đặt tại 0 và độ lệch chuẩn được chọn bằng 1, thì điểm chuẩn này được gọi là điểm Z. Điểm chuẩn Z được tính với hệ thức sau đây: Z = 6 XX  . Đường cong phân bố chuẩn ứng với điểm Z là tần suất xuất hiện các trường hợp nằm trong khoảng giưã điểm trung bình Z =0 và các điểm Z bằng một số nguyên lần độ lệch chuẩn. Đường cong phân bố chuẩn này được biểu diễn bởi hình 3 dưới đây, thì thấy với một phân bố chuẩn lý thuyết khoảng (- 36, + 36) bao gồm 99,8% các trường hợp của phân bố tức là trên thực tế là bao gồm toàn bộ các trường hợp. 36 -26 -16 0 +16 +26 +36 Các độ lệch tiêu chuẩn Điểm t: -3 -2 -1 0 +1 +2 +3 0,1% 2,1% 13,6% 34,1% 34,1% 13,6% 2,1% 0,1% I.3.4.Các loại điểm khác. I.3.4.1.Điểm trắc nghiệm tiêu chuẩn hoá của ETS ETS (Edu cational testing Services - ETS) “Các dịch vụ trắc nghiệm giáo dục” là công ty tư nhân lớn ở Hoa Kỳ, sản xuất các đề thi và tổ chức các đề thi trắc nghiệm tiêu chuẩn hoá. Ví dụ như trắc nghiệm một số học sinh xác định; trắc nghiệm tuyển sinh sau đại học ngành quản lý, trắc nghiệm ngoại ngữ tiếng Anh (TOEFL…). Các trắc nghiệm này đều sử dụng cùng một loại thang điểm với giá trị trung bình gán vào điểm 500, và độ lệch chuẩn 6 được chọn bằng 100 đơn vị nguyên. Vậy thì khoảng (-36; +36) ứng với khoảng điểm (200, 800) I.3.4.2.Điểm trắc nghiệm trí thông minh IQ (Intclligen  Quotient) Trắc nghiệm IQ sử dụng thang điểm với giá trị trung bình gán vào điểm 100, độ lệch chuẩn được chọn là 15 đơn vị nguyên. Với cách quy định như vậy khoảng (-36, +36) ứng với khoảng điểm (55, 145) I.3.Thang điểm được sử dụng ở nước ta. Thang điểm đang được sử dụng phổ biến ở nước ta là điểm 10, điểm tuyệt đối là 10, điểm tối thiểu là 0, điểm trung bình nằm ở khoảng 5, chứ không phải là điểm tiêu chuẩn dựa vào phân bố chuẩn và độ lệch. Vì vậy đối với kỳ thi tuyển sinh đại học hiện nay người ta xét tuyển dựa vào tổng điểm thô của 3 môn đó, mà thực tế phân bố điểm của 3 môn thường là rất khác nhau, do đó giá trị trung bình và độ lệch chuẩn cũng hoàn toàn khác nhau. Cách tính điểm mà chúng ta đang sử dụng không đánh giá chính xác được chất lượng làm bài của thí sinh vì nó không dựa vào cơ sở khoa học tiến bộ về đo lường đánh giá mà các nước tiên tiến đã sử dụng. Với thang điểm 10 đang được sử dụng phổ biến ở nước ta hiện nay có thể sử dụng thang điểm tiêu chuẩn với điểm trung bình là 5, độ lệch chuẩn bằng 2, khi ấy khoảng (-2,56; +2,56) sẽ ứng với khoảng điểm (0; 10) I.4.Thuyết ứng đáp câu hỏi và mô hình Rasch. I.4.1.Thuyết ứng đáp câu hỏi I.4.1.1.Khái niệm chung về thuyết ứng đáp câu hỏi Muốn đánh giá một loại năng lực nào đó của thí sinh và câu hỏi người ta dựa vào mô hình toán học về phép đo lường trong giáo dục, người ta xét mối tương tác nguyên tố giữa thí sinh và câu hỏi, thuyết đó gọi là thuyết ứng đáp câu hỏi (Item Response thcory - IRT). Để phản ánh quan hệ các mối tương tác nguyên tố TS-CH, người ta xây dựng mô hình toán học dựa trên 2 giả định sau làm cơ sở : +Giả định thứ nhất về tính đơn thứ nguyên (Undimen Sionclity). Nghĩa là chỉ một thuộc tính hoặc một năng lực được đo bởi các câu hỏi tạo nên bài trắc nghiệm. Thực tế lại có rất nhiều yếu tố ảnh hưởng đến chất lượng làm bài trắc nghiệm của thí sinh (sự hồi hộp, khả năng làm nhanh…) ngoài năng lực chính được đo bởi bài trắc nghiệm để đạt được giả định về đơn thứ nguyên cần xây dựng bài trắc nghiệm sao cho gần như các thành phần chính ảnh hưởng lên việc làm bài trắc nghiệm. Điểm số đánh giá năng lực của thí sinh có thể thay đổi theo thời gian do học thêm, quên bớt hay do các yếu tố khác. +Giả định thứ hai là: có một hàm đặc trưng của câu hỏi phản ánh thực giữa các biến không quan sát được (năng lực) và các biến quan sát được (việc trả lời câu hỏi) I.4.2.Các thao tác tiến hành để xây dựng thuyết ứng đáp câu hỏi. Để xây dựng thuyết ứng đáp câu hỏi người ta công nhận 2 giả thuyết : 1-Việc trả lời của một thí sinh đối với một câu hỏi có thẻ dự báo bởi năng lực của thí sinh. 2-Quan hệ giữa việc trả lời câu hỏi bởi thí sinh và năng lực làm cơ sở cho việc trả lời đó có thể được mô tả bằng một hàm tăng đơn điệu được gọi là hàm đặc trưng câu hỏi. Với mô hình IRT, nó có thể chưa một hay nhiều tham số để mô tả câu hỏi cũng như chưá một hay nhiều tham số để mô tả thí sinh. Vấn đề là để ứng dụng IRT thì bước quan trọng đầu tiên là ước lượng các tham số đó của mô hình, thứ hai là đánh giá sự phù hợp giữa mô hình và số liệu thực tế. Trong phạm vi sai số đo lường, các giá trị ước lượng về năng lực thí sinh thì được từ nhiều bài trắc nghiệm khác nhau sẽ như nhau, và các giá trị ước lượng về tham số câu hỏi thu được từ các nhóm đánh giá khác nhau sẽ như nhau. Như vậy, thuyết IRT các tham số của câu hỏi và năng lực thí sinh phải là bất biến. Tính bất biến đó thu được bằng cách kết hợp thông tin về câu hỏi trong quá trình ước lượng năng lực thí sinh và bằng cách kết hợp thông tin về năng lực thí sinh trong quá trình ước lượng tham số của câu hỏi. Hình 3 trên minh hoạ đặc điểm đó. Các thí sinh có cùng năng lực, dù ở nhóm đánh giá 1 hay 2 cũng có xác suất trả lời đúng câu hỏi như nhau, vì xác suất để 1 thí sinh với năng lực đã biết trả lời đúng câu hỏi được xác định bởi các tham số của câu hỏi, nên các tham số của câu hỏi cũng phải như nhau trong 2 nhóm.Ngoài ra IRT còn có thể cho phép ước lượng các sai số chuẩn của các giá trị ước lượng năng lực của mỗi thí sinh, chứ không phải là một ước lượng sai số duy nhất cho mọi thí sinh như trong lý thuyết cổ điển. I.4.2.Mô hình Rasch. I.4.2.1.Giả thiết của Rasch về việc ứng đáp câu hỏi. Nhà toán học người Đan Mạch Georg Rasch đã đưa ra một mô hình “ứng đáp câu hỏi” để mô tả mối tương quan nguyên tố giữa một thí sinh với một câu hỏi của bài trắc nghiệm và dùng mô hình đó để phân tích các dữ liệu của bài trắc nghiệm. Đó là mối quan hệ trong đó thí sinh tài sản vô hình có một mức năng lực v nào đó về lĩnh vực được đo ứng trước CHi có một độ khó đi.Mô hình của Rasch được phát biểu như sau : “Một thí sinh có khả năng hơn thí sinh khác phải có một xác suất lớn hơn để trả lời đung fmột câu hỏi bất kỳ, cũng tương tự như vậy, một câu hỏi khó hơn một câu hỏi khác có nghĩa là đối với bất kỳ thí sinh nào xác suất để trả lời đúng câu hỏi sau là lớn hơn so với câu hỏi trước (1960).Từ đó Rasch đã xây dựng hàm ứng đáp câu hỏi và đường cong ứng đáp câu hỏi tương ứng. Để biểu diễn các mối quan hệ này Rasch đã sử dụng thủ thuật để có thể biểu diễn được năng lực và độ khó trên cùng một thang đo. I.4.2.2.Hàm ứng đáp câu hỏi theo Rasch. Theo Rasch, xác suất của tài sản vô hình trả lời đúng câu hỏi i, phụ thuộc vào độ chênh lệch giữa năng lực v của thí sinh và độ khó i của câu hỏi, tức là hiệu số (v - i). Khi v = i thì xác suất trả lời đúng câu hỏi là 112. Khi v >i thì xác suất trả lời đúng câu hỏi gần bằng 1. Vì vậy hàm ứng đáp câu hỏi tăng đơn điệu từ 0 - 1 khi hiệu (v - i) biến đổi từ -  đến +  hàm, xác suất được Rasch chọn với biểu thức toán học đơn giản nhất có dáng điệu biến đổi như vậy. Pi (v) =Error! (1Trong đó P(v) là xác suất của thí sinh có năng lực v trả lời đúng câu hỏi có độ khó i. I.4.2.3. Ứng dụng của mô hình Rasch Trong các mô hình ứng đáp câu hỏi, mô hình Rasch được sử dụng nhiều nhất vì nó mô tả quá trình ứng đáp câu hỏi tương đối đơn giản mà kết quả khá phù hợp với dữ liệu thực tế. Trên thế giới người ta đã soạn thảo nhiều phàn mềm máy tính để tính toán các phép đo lường trong giáo dục dựa vào các mô hình được xây dựng bởi lý thuyết ứng đáp câu hỏi như các phần mềm: Bigstep, pascal … Việc nghiên cứu và áp dụng lý thuyết ứng đáp câu hỏi, đặc biệt là mô hình Rasch trong những năm qua phát triển rất mạnh mẽ. Thực tế, để đơn giản chúng ta đã hạn chế làm quen với sử dụng mô hình Rasch đối với mô hình các câu hỏi lưỡng phân, tức là kết quả của việc trả lời câu hỏi chỉ là 0 hoặc 1. Người ta đã mở rộng mô hình Rasch cho các loại mô hình câu hỏi với kiểu thang đo (rất không đồng ý, không đồng ý, trung lập, đồng ý, rất đồng ý) và các loại thang đo khác mà câu trả lời có nhiều mức phân cách khác nhau. Sự mở rộng này là rất quan trọng, giúp hoàn thiện nhiều công cụ đo lường của nhiều loại trắc nghiệm và nghiên cứu khác nhau. Nhờ vậy việc ứng dụng lý thuyết ứng đáp câu hỏi và mô hình Rasch, người ta có thể xây dựng ngân hàng câu hỏi trắc nghiệm chứa các câu hỏi được định cỡ chính xác, từ đó lập các đề trắc nghiệm có khả năng đo lường năng lực với đodọ chính xác rất cao. Nhờ vậy mà người ra có thể thiết kế các trắc nghiệm thích ứng nhờ máy tính cho phép đo lường chính xác năng lực với một số lượng không lớn các câu hỏi trắc nghiệm thích hợp. Về việc nghiên cứu và áp dụng khoa học về đo lường trong tâm lý và giáo dục, khoảng cách giữa nước ta với các nước tiên tiến trên thế giới về lĩnh vực này còn quá xa. Để phát triển giáo dục và các khoa học liên quan đến tương tác với con người, việc đầu tư vào nghiên cứu và vận dụng các khoa học nền tảng về tâm lý và giáo dục, trong đó có khoa học về đo lường là một yêu cầu hết sức cấp bách. Nhưng chúng ta hi vọng rằng trong tương lại khoảng cách này sẽ ngày một ngắn lại nếu chúng ta biết tiếp thu và tận dụng các thành tựu khoa học công nghệ mới của thời đại. CHƯƠNG II: CÁCH TIẾN HÀNH THỰC NGHIỆM II.1.Các bước để xây dựng một bài thi TNKQ II.1.1.Phân tích nội dung và phác thảo bài trắc nghiệm Một sự phân tích về nội dung sẽ cung cấp một bản tóm tắt những ý đồ của chương trình giảng dạy được diễn đạt theo một nội dung nhất định. Nội dung nào bao trùm trong khung chương trình học và có những chương nào quan trọng trong nội dung này, những phần nào quan trọng trong các chương trình ấy hay những lĩnh vực nào trong các nội dung ấyđưa vào trong trắc nghiệm đại diện này? Bản phác thảo bài trắc nghiệm định rõ những gì mà nó phải bao hàm hơn là những gì đã có trong chương trình học. Một bài trắc nghiệm thường bao gồm tên bài trắc nghiệm, mục đích cơ bản của bài trắc nghiệm, những khía cạnh nội dung chương trình mà bài trắc nghiệm phải bao hàm và bản chỉ dẫn cho học sinh về cách làm bài thi. Việc so sánh bản phác thảo trắc nghiệm với kết quả phân tích nội dung chương trình đào tạo, phải cho thấy được bài trắc nghiệm là một mẫu tiêu biểu hợp lý của nội dung chương trình đào tạo, hay nó cũng có thể bao hàm cả những khía cạnh khác nữa. Khi bản phác thảo trắc nghiệm có nhiều khía cạnh, có thể xem xét những căn cứ cần thu thập được phối hợp với các khía cạnh khác nhờ một bảng ma trận và mức độ quan trọng của bằng chứng đó phải được đưa vào của bài trắc nghiệm như test nào cho hợp lý. II.1.2.Viết câu hỏi trắc nghiệm Viết câu hỏi là việc chuẩn bị cho những công việc đánh giá, phát hiện kiến thức và kỹ năng của học sinh về các nhiệm vụ được xem xét. Những công việc làm cho học sinh lúng túng sẽ không thu hút được học sinh, làm cho học sinh xao nhãng các công việc đã được định trước. Những công việc được đánh giá hợp lý là những việc mà học sinh muốn tìm cách giải quyết mà nó nêu được một cách rõ ràng những gì đòi hỏi ở học sinh và là những công việc cung cấp bằng chứng về năng lực trí tuệ của học sinh. Một số người khi viết câu hỏi chỉ đo được những gì đề đo hơn là đo được cái cần đo. Điều này cho phép đáp ứng được số lượng hình thức câu hỏi nhưng không đạt được tính chất giá trị. Việc sử dụng các câu hỏi dễ viết hơn là các câu hỏi quan trọng sẽ làm méo mó quá trình đánh giá và do đó sẽ đem lại những thông tin không phù hợp về nội dung chương trình đào tạo đến học sinh, giáo viên và các cộng đồng xã hội xung quanh trường. II.1.3.Duyệt lại câu hỏi Việc soạn thảo các công việc đánh giá sử dụng trong các bài trắc nghiệm đòi hỏi nhiều kỹ năng. Đôi khi câu hỏi có vẻ rõ ràng với người viết nhưng không phải lúc nào cũng rõ ràng đối với người khác. Trước khi tiến hành thử nghiệm, các công việc đánh giá cần phải được xem xét lại do một ban xét duyệt chuyên môn đặt ra các câu hỏi như sau: -Nhiệm vụ có rõ ràng đối với từng câu hỏi không ? liệu người được hỏi có hiểu rõ những gì đang được mong đợi ở họ hay không ? -Mỗi một câu hỏi có phải là câu đúng quy định để đánh giá ở cấp độ giáo dục đó hay không? -Các từ ngữ sử dụng có phù hợp với trình độ thí sinh hay không? -Có những đầu mối hở không chủ tâm để doán câu trả lời hay không? -Có phải rõ ràng một câu trả lời đúng (hoặc tốt nhất) cho từng câu hỏi không? -Loại câu hỏi đó có phù hợp với thông tin cần biết hay không ? -Những nhận định trong các câu hỏi có gì là xúc phạm hay không ? -Có đủ các câu hỏi tiêu biểu để tạo ra được một mẫu thích hợp của các hành vi được đánh giá hay không? Việc xét duyệt các câu hỏi này được đem ra thử nghiệm là để đảm bảo sao cho chúng ta tránh được cách diễn đạt bằng ngôn ngữ quá phức tạp đối với các ý tưởng đang định trắc nghiệm, Tránh các từ thừa, các phủ định kép và các câu nhiễu không hợp lý. Khi xem xét cũng cố gắng tìm ra các câu hỏi không có câu trả lời đúng (hay tốt nhất) cũng như các câu có nhiều phương án trả lời đúng. Các câu hỏi như vậy có thể được loại bỏ hay viết lại. II.1.4.Lưu ý chung khi viết câu hỏi khách quan. +Yêu cầu chung: 1.Sử dụng ngôn ngữ phù hợp với thí sinh 2.Không hỏi ý kiến riêng của thí sinh, chỉ hỏi sự kiện, kiến thức. Loại nhiều lựa chọn: 1.Các phương án sai phải có vẻ hợp lý. 2.Chỉ nên dùng 4 hoặc 5 phương án chọn 3.Đảm bảo cho câu dẫn nối liền với mọi phương án chọn theo đúng ngữ pháp. 4.Chỉ có một phương án chon là đúng 5.Tránh dùng câu phủ định, đặc biệt là phủ định hai lần. 6.Tránh lạm dụng kiểu “không phương án nào trên đây đúng” hoặc “mọi phương án trên đây là đúng” 7.Tránh việc tạo phương án khác biệt so với các phương án khác (dài hơn hoặc ngắn hơn, mô tả tỉ mỉ hơn…) 8.Phải sắp xếp phương án đúng theo thứ tự ngẫu nhiên. II.2.Các đại lượng đặc trưng liên quan đến bài trắc nghiệm II.2.1.Xác suất. Đối với các hiện tượng ngẫu nhiên người ta không thể biết chắc chắn một sự kiện hoặc biến cố gì đó xảy ra, chỉ có thể nói xác suất xẩy ra một biến cố nào đó. Ví dụ xác suất xuất hiện một sự cố như sự xuất hiện “mặt lục” của xúc sắc 6 mặt là 1/6. Xác suất là motọ số không âm, có giá trị từ 0 đến 1, xác suất bằng 0 ứng với sự cố không thể xảy ra, xác suất bằng 1 ứng với sự cố chắc chắn xảy ra. II.2.Bản đặc trưng 2 chiều Khi chúng ta đã có trong tay một đề kiểm tra được xây dựng đúng theo các bước như trên đây nhưng liệu chúng ta đã đảm bảo được chất lượng của đề thi đó là tốt hay xấu chưa. Để trả lời câu hỏi này chúng tôi xin giải thích rõ hơn về bản đặc trưng hai chiều. Vậy bản đặc trưng hai chiều là gì ? bản đặc trưng 2 chiều là khái niệm để đánh giá đề thi mà chúng ta cho kiểm tra đã đạt chưa và đã đạt được đúng mục tiêu giảng dạy chưa. Một đề thi muốn đạt được chất lượng tốt nghĩa là nó phải đo được cái cần đo hay bám sát vào mục tiêu giảng dậy. Về nội dung phải đảm bảo vừa tầm với học sinh, kiến thức bao quát được cả quá trình dạy, các câu được phân bố đồng đều về cấu trúc cũng như nội dung chương trình. Như vậy để đánh giá được cả một đề thi đó ra sao chúng ta phải đánh giá đến từng câu hỏi một. Yêu cầu ở mỗi câu hỏi ở mức kỹ năng nào : nhớ, hiểu hay áp dụng … Để hiểu rõ vấn đề chúng tôi xin phân tích đề thi mà chúng tôi đã tíến hành thử nghiệm về nội dung và các yêu cầu của một đề thi bằng trắc nghiệm KQ qua các phần sau đây: I.2.1.Sơ lược về kiến thức chương trình hoá 10. Đây là yếu tố quan trọng nhất để xây dựng một đề thi bất kỳ nào đó kể cả tự luận hay trắc nghiệm. Chỉ có những người có chuyên môn thật vững kiến thức thì mới có khả năng ra một đề thi tốt được. Mà một đề thi muốn tốt thì người ra đề thực sự phải có chuyên môn sâu vì họ sẽ đánh giá cho câu hỏi về vấn đề gì mà đảm bảo kiến thức xuyên suốt chương trình mà đạt được mức độ nhận thức theo mức độ chương trình chung. II.2.1.1.Cấu trúc chương trình Chương trình hoá lớp 10 gồm 5 chương sau: -Chương I: Cấu tạo nguyên tử -Chương II: liên kết hoá học định luật tuần hoàn Menđelêep -Chương III: Phản ứng Oxi hoá khử -Chương IV: Phân nhóm chính nhóm VII- nhóm halogen -Chương V: Oxi-lưu huỳnh lý thuyết phản ứng hoá học II.2.1.2.Nội dung chính của từng chương *Chương I: Cấu tạo nguyên tử Yêu cầu chính của chương trình là học sinh nắm được các khái niệm cơ bản thuyết cấu tạo nguyên tử. Ví dụ thành phần cấu tạo của nguyê ntử ra sao, hạt nhân nguyên tử là gì, thế nào là nguyên tố hoá học, khái niệm về đồng vị, đặc biệt nắm được cấu tạo của bảng hệ thống tuần hoàn, vì đây là phần đầu của chương trình nên học sinh thường rất bỡ ngỡ và khó hiểu những khái niệm trừu tượng như cấu hình (e) obi tan nguyên tử, electron lớp ngoài cùng. Phần quan trọng của chương này chính là nắm được tính chất chung của bảng HTTH. Ví dụ khi câu hỏi đưa ra một chất cho diện tích bằng bao nhiêu thì thường sẽ hỏi viết cấu hình (e) của nguyên tố đó có mấy (e) lớp ngoài cùng, từ đó suy ra tính chất của nhân tố đó có tính kim loại hay phi kim loại. Khi có trong tay bảng FTTH học sinh tối thiểu phải trả lời được các câu hỏi như thế nào là chu kỳ, phân nhóm (chính, phụ) số electron ngoài cũng có liên quan gì đến tính chất của nguyên tố đó. Nếu số electron ngoài cùng là 1,2,3 thì nó thể hiện tính kim loại, 4,5,6 thể hiện tính phi kim, bằng thể hiện tính chất của khí (khí hiếm)… Như vậy nếu học sinh không hiểu được bản chất thì không thể trả lời được câu hỏi. Chẳng hạn, trong đề kiểm tra thử nghiệm chúng tôi đưa ra 4 câu về chương cấu tạo chất chúng ta phân tích một ví dụ cụ thể trong đề thi đó: VD: Cho một nguyên tố có cấu hình (e) ngoài cùng 3523P5. Vậy nguyên tố ấy sẽ là : A) B) P C) N D) F Rõ ràng với yêu cầu của câu hỏi được đặt ra như vậy thì một học sinh kém hay ở mức trung bình trở xuống sẽ không trả lời được. Để trả lời đúng câu này học sinh phải nắm được khái niệm (e) lớp ngoài cùng có ý nghĩa như thế nào, nắm được obitan nguyên tử và thế nào là điện tích nguyên tố. Khi câu hỏi đưa ra dạng khuyết như vậy đầu tiên chúng ta sẽ phải viết được cấu hình đầy đủ của nguyên tố đó có dạng : 1522522P5. Sau đó tính được điện tích nguyên tố bằng tổng các electron được phân bố trên các obitan, sẽ tính được Z=17, dùng bảng HTTH tra nguyên tố có thứ tự (hay điện tích nguyên tố bằng 17 sẽ là clo). Thực tế có những học sinh kém đến mức không biết xác định nguyên tố tên là gì nếu biết điện tích nguyên tố vì họ không hiểu được khái niệm điện tích nguyên tố là gì và cấu trúc bảng HTTH như thế nào, cách tra ra sao ? *Chương II: Liên kết hoá học định luật tuần hoàn Menđeleev Nội dung chính của chương này đặt ra một số vấnđề như : vì sao các chất lại tồn tại và chúng tồn tại theo một quy luật nhất định nào đó ? từ đó thuyết liên kết hoá học ra đời và giải thích được câu hỏi đó. Yêu cầu đối với học sinh ở chương này nắm được bản chất của liên kết hoá học là gì, có các loại liên kết hoá học nào, bản chất của từng loại liên kết một. Ngoài ra học sinh phải nắm được định luật tuần hoàn của Menđeleev cho phép chúgn ta biết được tính chất hoá học của nguyên tố hoá học bất kỳ và tính chất của chúng biến đổi theo một quy luật nhất định. Vì thời gian và số lượng câu nên chúng tôi không đưa nội dung này vào trong đề kiểm tra của mình. *Chương III: Phản ứng oxi hoá khử Đây là một mảng kiến thức rất quan trọng trong không chỉ trong chương trình lớp 10 mà nó xuyên suốt cả chương trình phổ thông. Yêu cấu tối thiểu đối với học sinh bình thường phải nắm được các khái niệm như : Số ôxi hoá, chất ôxi hoá, chất khử, phản ứng. Và đương nhiên phải hiểu được bản chất của vấn đề ví như cho một phản ứng bất kì học sinh phải chỉ ra được nó có thuộc loại phản ứng ôxy hoá khử hay không, đâu là chất oxy hoá, đâu là chất khử. Khi đã có các khái niệm rồi thì yêu cầu cuối cùng và quan trọng nhất đối với học sinh trong chương này chính là có thể cân bằng (e). Nếu học sinh không cân bằng nổi một phương trình đơn giản thì kiến thức học sinh đó đáng báo động và phải điều chỉnh ngay vì chưa biết cân bằng phương trình coi như không hiểu gì về chương oxi hoá-khử. Trong đề thi của mình chúng tôi đã đưa ra 6 câu hỏi về chương này với các dạng khác nhau với các mức yêu cầu khác nhau, có dạng đơn giản chỉ là xác định số oxi hoá của một nguyên tố bất kỳ trong một hợp chất nào đất, có câu áp dụng bằng phương trình oxi hoá khử hay có dạng cho một phương trình phản kứng yê ucầu học sinh xác định đâu là chất khử, đâu là chất oxi hoá. Ví dụ: cho phản ứng: Fe304 +10 HN03 = 3 Fe (N03)3 + N)2 + 5H20 vậy thì: A) Fe304 và HN03 đều là chất oxi hoá B) Fe304, HN03 đều là chất khử C) Fe304 là chất khử, HN03 chất oxi hoá D) Fe304 chất oxi hoá, HN03 chất khử Như vậy với ví dụ này nếu học sinh biết xác định số oxi hoá của nguyên tố nào thay đổi và hiểu được định nghĩa thế nào là chất khử, chất oxi hoá thì sẽ làm được câu hỏi này một cách dễ dàng. *Chương IV: Phân nhóm chính nhóm VII - Nhóm Haloofen Đây là chương rất quan trọng trong khối lượng kiến thức hoá 10 nên chúng tôi đã xây dựng một số lượng các câu hỏi khá lớn trong đề kiểm tra của mình (8 câu trên 30 câu). Nội dung chính của chương này mà học sinh phải nắm được là các tính chất vật lý hoá học chung của phân nhóm chính nhóm VII, sau đó đi chi tiết tính chất của từng nguyên tố một. Theo như phân bố chương trình sách giáo khoa nguyên tố clo được trình bày kỹ càng và trọng tâm nhất trong các nguyên tố halogen. Học sinh cần phải nắm được các tính chất lí hoá học của nguyên tố clo và tính chất đặc trưng của một số hợp chất chứa oxy cảu clo như : clorua vôi, nước taven, axits clohidric, muối clorua… Ngoài ra các nguyên tố còn lại như Flo, Brem, iDt không chỉ hiểu được các tính chất chung mà phải nắm được một số tính chất riêng của từng nguyên tố là gì. Trong sách ra đề của chúng tôi trong chương này vừa có dạng tổng quát như so sánh mức độ hoạt động của các nguyên tố halogen, so sánh axít của chúng, tính chất của clo là gì, các phương pháp điều chế clo, hay có những bài tập áp dụng có tính bán kết quả. Như vậy mục tiêu khi ra câu hỏi không phải dừng ở mức kỹ năng nhớ, hiểu áp dụng mà nó đòi hỏi kỹ năng tư duy tương đối cao (phân tích, đánh giá) Chúng ta xét một câu hỏi trong bộ đề kiểm tra mà chúng tôi đã tiến hành thử nghiệm. Một dạng câu hỏi áp dụng tính toán nhưng để làm được thì không những học sinh phải sử dụng tính toán đơn thuần mà phải kết hợp được nhiều mức kỹ năng khác nhau. Cho 8,7 gam Mn02 tác dụng với dung dịch H dư thì thể tích khi Cl2 ( ) thu được sẽ là : A)22,4 (l) B)4,48 (l) C)2,24 (l) D)11,2 (l) Để làm được câu hỏi này học sinh phải kết hợp viết và cân bằng được phương trình và tính toán theo phương trình phản ứng mà điều này đối với học sinh kém quả thực không mấy đơn giản chút nào vì làm trong một khoảng thời gian ngắn đòi hỏi sự nhanh nhẹn và kỹ năng làm bài thành thạo. *Chương V: Oxi-lưu huỳnh. Lý thuyết về phản ứng hóa học. Đây cũng là chương được chúng tôi phân bố câu hỏi cũng tương đối nhiều (khoảng 9 câu). Cũng giống như chương Halogen ngoài những tính chất đặc trưng chung của phân nhóm chính. Nhóm VI học sinh phải nắm được tính chất của một số các chất được trình bày riêng một bài. Yêu cầu học sinh phải nắm được tính chất của oxi lưu huỳnh, hidosunfua, các oxits của lưu huỳnh, đặc biệt là axít Sunfuric… Dạng câu hỏi chúng tôi xây dựng về chương này cũng vừa có lý thuyết và có các dạng bài tập tính toán. Có câu đòi hỏi mức độ tư duy rất cao dành cho học sinh giỏi, ví dụ: Cho các chất: O2, S, H2S, SO2 chất tan nhất trong nước là : A) SO2 B) S C) H2S C) O2 Nếu học sinh không nắm được tính chất vật lí của từng bài về lưu huỳnh, Oxi, hidroSunfua, Oxít của lưu huỳnh thì khó có thể trả lời được câu này vì nó đòi hỏi không chỉ nhớ kiến thức qua từng bài mà học sinh phải biết tổng hợp kiến thức qua mỗi bài học để so sánh từng chất với nhau. Vì trong thời gian chúng tôi nghiên cứu đề tài nàyếu tố khi tiến hành thí nghiệm học sinh gần kết thúc chương trình và để đánh giá chính xác thực lực học sinh trong học kỳ 2 nên đề kiểm tra mà chúng tôi biên soạn chủ yếu tập trung vào 3 chương cuối cùng (chương oxi hoá khử, các nguyên tố halogen, các nguyên tố nhóm VIA) nên có thể nội dung chưa xuyên suốt được toàn bộ chương trình lớp 10 nhưng gần như những vấn đề nổi cộm và cốt lõi nhất chúng tôi có đưa vào và với sự đa dạng về các loại câu hy vọng kết quả của chúng tôi làm thử đạt được như mong đợi. II.3.Phương pháp đánh giá bài trắc TN II.3.1.Các mức độ mục tiêu trong lĩnh vực nhận thức. Nói đến mức độ mục tiêu trong lĩnh vực nhận thức chúng ta nghĩ ngay đến Bloom, người đã xây dựng nên các cấp độ của các mục tiêu giáo dục hay gọi là cách phân loại Bloom theo. Bloom trong lĩnh vực nhận thức được chưa thành các mức độ hành vi từ đơn giản đến phức tạp nhất như sau: 1.Nhớ (Knou ledgo): Nghĩa là sự nhớ lại các dữ liệu đã được học trước đây nghĩa là một người có thể nhắc lại một loạt các dữ liêụ từ các sự kiện đơn giản đến các lý thuyết phức tạp, tái hiện trong trí nhớ những thông tin cần thiết. Đây là cấp độ thấp nhất của kết quả học tập trong lĩnh vực nhận thức. Ví dụ trong hoá học học sinh có khả năng nhớ bài học có thể trả lời được câu hỏi như : Nêu các tính chất hoá học của axit clohidric. Nhưng một bài kiểm tra mà ra các câu hỏi kiểu dạng như thế này thì chưa đạt yêu cầu vì nó sẽ kích thích học sinh học thuộc lòng, học vẹt mà thực chất lại không hiểu được vấn đề gì. 2.Hiểu (Comprehention): Nghĩa là khả năng nắm được ý nghĩa của tài liệu. Hay nói cách khác có thể thực hiện bằng việc chuyển tài liệu từ dạng này sang dạng khác bằng cách giải thích tài liệu (hay tóm tắt) và bằng cách ước lượng xu hướng tương lai (dự báo các kết quả hoặc ảnh hưởng). Kết quả học tập được đo ở mức độ này cao hơn so với nhớ, đây là mức độ thấp nhất để hiểu thấu sự vật. Ví dụ: Số electron của một ion Mg2 là: A) 2 B) 12 C) 24 D) 10 Nếu học sinh không hiểu được yêu cầu nội dung câu hỏi mà chỉ học thuộc thôi thì rất dễ mắc bẫy. Muốn trả lời được câu hỏi này, thí sinh phải hiểu được khái niệm thế nào là điện tích ion, thế nào là số electron của nguyên tố từ đó suy ra được số electron của một ion mang điện tích dương hay âm bất kỳ nào đó. Nếu thí sinh chọn phương án có 2 electron có nghe ra cũng có lý nếu hiểu điện tích ion bằng số electron, nếu chọn 12 hay 24 cũng có vẻ không vô lý lắm vì nếu học sinh học thuộc lòng thứ tự điện tích các nguyên tố thì thấy ngay số thứ tự của Mg trong bảng HTTH là 12, còn số 24 là biết đâu do đoán mò lấy số 2 nhân với 12 thì may ra đúng. Như vậy, chúng ta thấy chỉ học thuộc lòng mà không hiểu bản chất thì học sinh sẽ khó có thể trả lời đúng và đáp án đúng ở đay lại là 10 (phương án D) mà con số này nó có vẻ không hợp lý lắm so với kiến thức mà học sinh đã được học. Vì bình thường nguyên tử của nguyên tố magie có 12 electron nhưng ở đây người ta hỏi số electron của ion Mg2+ nghĩa là nguyên tử đã nhường cho 2 electron để được ion dương Mg2+ và chỉ cần làm 1 phép tính đơn giản lấy 12- 2 = 10 (electron) 3.Áp dụng (application): được định nghĩa là khả năng sử dụng các tài liệu đã học vào một hoàn cảnh cụ thể mới. Điều đó bao gồm việc áp dụng các quy tắc, phương pháp, khái niệm, nguyên lý, định luật, lý thuyết. Kết quả học tập trong lĩnh vực nào đó ở cấp độ này đòi hỏi sự thấu hiểu cao hơn so với mức kỹ năng nhớ và hiểu một chút. Thí dụ khi học sinh học kiến thức về chương oxi hoá khử, học sinh đã nắm được các bước để cân bằng một phản ứng oxi hoá khử theo phương pháp thăng bằng electron thì khi gặp bất kỳ một phản ứng nào đều có thể làm được. Bài tập dạng cân bằng như vậy chúng tôi có áp dụng vào trong đề kiểm tra thử nghiệm này, có khoảng 2 câu về cân bằng phương trình ở mức độ trung bình và một bài tương đối phức tạp một chút. Ví dụ: Cho phản ứng: ANH3 + BO2 = CNO + DH2O. Các hệ số A, B, C, D sẽ là A) 5,4,5,4 B) 4,4,5,5 C) 4,5,4,5 D) 4,5,4,6 Chúng ta thấy ngay rằng nếu hiểu và vận dụng đúng các bước cân bằng mà học sinh đã học thì việc cân bằng này rất dễ dàng mà không tốn nhiều thời gian. Ngoài ra nếu học sinh có thể thay đáp án thử lại xem kết quả nào hợp lý sau đó sẽ chọn giá trị tương ứng nhưng cách làm đó rất thủ công và mất nhiều thời gian học sinh phải thử đến 4 phép tính gây cảm giác rất rối và nặng nề. Vì đối với những phương trình đơn giản có thể thử được nhanh nhưng có những phương trình cân bằng với hệ số rất lớn thì công việc tính toán chiếm rất mất nhiều thời gian hơn là cân bằng phương trình đó bình thường theo phương pháp đã học. 4.Phân tích (Analysis): Nghĩa là khả năng phân chia một tài liệu ra thành các phần của nó sao cho có thể hiểu được các cấu trúc tổ chức của nó. Điều đó có thể bao gồm việc chỉ ra đúng các bộ phận phân tích mối quan hệ giữa các bộ phận và nhận biết được các nguyên lý tổ chức được bao hàm. Kết quả học tập ở mớc độ này đòi hỏi học sinh có mức độ trí tuệ cao hơn so với mức hiểu và áp dụng vì nó yêu cầu một sự thấu hiểu cả nội dung và hình thái cấu trúc của tài liệu. Thí dụ: ion X có cấu hình (e) lớp ngoài cùng: 3S23P6. Vậy X là : A) B) S C) P D) N Để trả lời được câu hỏi này học sinh phải phân tích được đề bài, dữ liệu bài toán cho là ion X2 nhưng lại hỏi về nguyên tố X. Đầu tiên ta sẽ chuyển cấu hình ion X2 về cấu hình X, sau đó từ cấu hình (e) lớp ngoài cùng viết cấu hình (e) đầy đủ của X và tính số điện tích nguyên tố sẽ tra được nguyên tố đó dựa vào bảng HTTH. Rõ ràng với một câu hỏi như vậy chúng ta đã chuyển sang các dạng trung gian khác nhau để tìm ra phương án trả lời. 5.Tổng hợp (Syn theis): Được định nghĩa là khả năng sắp xếp các bộ phận lại với nhau để hình thành một tổng thể mới. Điều đó có thể bao gồm việc tạo ra một cuộc giao tiếp đơn nhất, một kế hoạch hành động hoặc một mạng lưới các quan hệ trừu tượng. Kết quả học tập trong lĩnh vực này nhấn mạnh các hành vi sáng tạo, đặc biệt tập trung chủ yếu vào việc hình thành các mô hình hoặc cấu trúc mới. Mức kỹ năng tổng hợp đòi hỏi trình độ, kiến thức học sinh tương đối cao, thường những em học lực khá, giỏi mới có khả năng trả lời đúng câu hỏi. 6.Đánh giá (Evaluation): Là khả năng xác định giá trị cảu tài liệu (tuyên bố, tiểu thuyết, báo cáo …) việc đánh giá dự trên các tiêu chí nhất định được đặt ra sẵn. Đó có thể là các tiêu chí bên trong (cách tổ chức) hoặc các tiêu chí bên ngoài (phù hợp với mục đích), và người đánh giá phải tự xác định hoặc được cung cấp các tiêu chí. Kết quả học tập trong lĩnh vực này là cao nhất trong các cấp bậc nhận thức vì nó chứa các yếu tố của mọi cấp bậc khác.Vậy các cấp độ nhận thức theo Bloom có thể được mô tả bằng sơ đồ sau theo mức độ từ thấp đến cao 6.Đánh giá 5.Tổng hợp 4.Phân tích 3.áp dụng 2. Hiểu 1.Nhớ Sơ đồ các mưc kỹ năng theo Bloom Có những người nghĩ rằng chỉ có đề thi tự luận mới đánh giáđược tư duy ở mức độ cao còn đánh giá bằng TNKQ chỉ đạt ở mức độ tối thiểu nào đó, lối suy nghĩ như vậy là hoàn toàn sai lầm. Theo Bloom một bài kiểm tra có thể đánh giá mức độ tư duy của học sinh tương đối cao, có thể đạt mức độ cao nhất. Thế thì muốn ra được các câu hỏi yêu cầu học sinh ở mức độ nhận thức cao nó tuỳ thuộc rất nhiều vào khả năng người ra đề. Với chương trình lớp 10 thì khả năng tư duy còn nhiều hạn chế chính vì vậy thường thì học sinh học theo kiểu cảm nhận là chính. Vì vậy khi soạn các câu hỏi trắc nghiệm chúng tôi chủ yếu tập trung ở các mức độ 1, 2, 3. Cũng có những câu (nhưng không nhiều) yêu cầu học sinh ở mức độ cao (4, 5, 6) thường dành cho các em khá giỏi. Tuỳ theo mục tiêu đạt ra đối với học sinh cần đạt trình độ như thế nào để người ra đề thi cân nhắc và vận dụng ở mức độ hợp lý đối với học sinh. II.3.2.Yêu cầu đối với một bài thi TNKQ. II.3.2.1.Yêu cầu về nội dung Nội dung là yếu tố quan trọng nhất để đánh giá một bài học hay mọt bài kiểm tra có tốt hay không. Mục đích của mỗi bài học là học sinh cần nắm những phần gì quan trọng nhất, cái gì cần nhớ nhất, đó chính là nội dung của một bài học. Còn đối với một đề kiểm tra cũng vậy, chúng ta phải luôn tự đặt trong đầu các câu hỏi đề thi gồm những nội dung chính gì quan trọng nhất, phần nào bắt buộc đối với mọi học sinh thì phải nhấn sâu cho nhiều câu hỏi vào. Điều quan trọng là nội dung của mỗi câu hỏi có ăn khớp với nội dung học sinh đã được học trên lớp chưa ? Tránh những trường hợp nội dung câu hỏi rất hay nhưng không hề liên quan đến kiến thức cần kiểm tra như vậy sẽ dẫn đến một hậu quả rất nghiêm trọng là chúng ta sẽ không đo được mục tiêu giáo dục đã đề ra. Với thời gian và trong điều kiện cho phép, các câu hỏi mà chúng tôi đã biên soạn gần như bao phủ được toàn bộ chương trình lớp 10 nhưng trọng tâm số câu hỏi rơi vào nhiêù nhất là các chương: oxi hoá khử, phân nhóm chính nhóm VIIA, phân nhóm chính VIA. Ngoài những câu hỏi học sinh học chắc tính chất hoá học, có một số câu đòi hỏi học sinh thuộc cả tính chất vật lý, phương pháp điều chế…. II.3.2.2.Yêu cầu về các mức kỹ năng. Như đã giới thiệu ở trên để đánh giá chất lượng đề thi và đo được mục tiêu giảng dậy chúng ta phải đặt ra những yêu cầu về mức độ nhận thức đối với từng câu hỏi. Với trình độ học sinh lớp 10 chủ yếu các mức kỹ năng cần đạt là mức kỹ năng 1 (nhớ), kỹ năng (hiểu) và mức kỹ năng 3 (áp dụng) là tương đối đạt yêu cầu của chương trình giảng dạy. Nên đa số các cấu hỏi trắc nghiệm đạt ở các mức độ 1,2,3 mà chúng tôi chủ định biên soạn. Nhưng nếu một đề kiểm tra mà chỉ dừng lại ở các mức kỹ năng đó thì chưa đạt được mục tiêu là phân chia sự nhận thức khác nhau giữa học sinh kém và học sinh giỏi. Chính vì vậy đề thi phải có một số các câu hỏi (thường là ít) yêu cầu học sinh ở cấp độ cao hơn. Vì các câu ở mức kỹ năng cao mới đánh giá và phân biệt được khả năng tư duy ở hai trình độ khácnhau thì chất lượng làm bài cũng phân chia rõ ràng. Ngoài ra các câu khó này còn đánh giá được số điểm của từng đối tượng tương ứng với trình độ của học sinh. Thường thì học sinh khá, giỏi sẽ sẽ trả lời được các câu hỏi khó để đạt điểm 9, 10 còn học sinh trung bình đạt số điểm thường là 5,6. Nhưng cũng tránh ra những câu quá khó, hay một đề thi có quá nhiều câu đòi hỏi ở cấp độ cao làm cho hầu hết thí sinh không trả lời được (kể cả thí sinh giỏi) thì đề thi không phân cấp được khả năng làm bài giữa học sinh thuộc nhóm kém và nhóm giỏi. Theo chúng tôi, số lượng các câu hỏi ở mức độ khó nữa phải chiếm khoảng 20-30%, còn số câu ở mức độ khó phải nhỏ hơn 10% thì hợp lý hơn cả. Như vậy các câu hỏi được ra nằm ở các mức độ. Rất dễ (gần như ai cũng làm được ), dễ trung bình, khó, rất khó. Và do đó, chúng ta sẽ nhận thấy rằng để đạt được điểm tốt (9,10) thì học sinh phải thực sự có năng lực để trả lời các câu hỏi khó. II.3.2.3.Yêu câu về cách tổ chức Thường thì kiểm tra bằng TNKQcó thể kiểm tra đồng thời một số lượng học sinh tương đối lớn, nên nếu khâu tổ chức triển khai không tốt, dù bất kỳ một sơ suất nhỏ nào cũng đều có thể dẫn đến hậu quả xuất và những phản ứng xã hội bất lợi. Do đó để triển khai một kỳ thi với quy mô lớn người ta phải chuẩn bị hết sức cẩn thận về đề thi, quy trình thi, thể thức chấm điểm, cách công bố kết quả… Các câu hỏi trong một đề thi là các câu đã được thử nghiệm, phân tích cân nhắc trau chuốt và định cỡ ( xác định độ khó, độ phân biệt, độ tin cậy và độ giá trị của cả bài). Để đạt được một kỳ thi hay bài kiểm tra, theo chúng tôi có thể tiến hành theo các bước sau đây: *Xác định môn thi và nội dung tổng quát với từng môn. Đồng thời định ra yêu cầu về các mức kỹ năng: nhớ, hiểu, biết vận dụng, phân tích, tổng hợp, đánh giá…Để thực hiện khâu này thường người ta lập một ma trận 2 chiều: các dòng phân theo các nội dung chính, các cột phân theo các mức kỹ năng tương ứng trong mỗi ô ghi số câu hỏi cần thiết của phần nội dung và mức kỹ năng đó. *Trao đổi trong tổ chuyên môn, phát hiện và sửa chữa những câu sai mà bản thân người ra đề không cảm thấy. *Biên tập và đưa các câu trắc nghiệm vào ngân hàng câu hỏi lưu trong máy tính phụ trách biên tập phải là người am hiểu cả về chuyên môn lẫn kỹ thuật viết trắc nghiệm. *Lập đề thi và tổ chức thi thử trên một số nhóm thí sinh. *Chấm thi và phân tích thống kê kết quả thi thử từ đó xác định được các đặc trưng của mỗi câu trắc nghiệm như độ khó, độ phân biệt…qua đó có thể xác định được độ tin cậy của bài trắc nghiệm, phân loại chất lượng các câu trắc nghiệm. *Ra đề thi chính thức căn cứ vào dàn bài (phân bố câu theo nội dung và mức độ kỹ năng tương ứng vơí bản đặc trưng hai chiều). Từ một đề thi gốc, nhờ phần mềm tin học có thể tạo ra các đề thi tương ứng có cùng nội dung nhưng khác nhau về hình thức bằng cách đảo lộn thứ tự các câu hỏi và đảo các phương án trả lời A,B.C,D… *In và tổ chức thi: đề thi được in sẵn, mỗi thí sinh một đề riêng *Chấm và phân tích các kết quả thi. *Công bố kết quả Ưu điểm lớn của các kỳ thi đại trà bằng trắc nghiệm khách quan là: Nhờ những thông tin thu được qua việc phân tích thống kê toàn bộ bài làm của thí sinh qua các kỳ thi là những số liệu rất quý báu để đánh giá định lượng về tình hình giáo dục của từng khu vực, từng cộng đồng, từng nhóm thí sinh và đánh giá xu thế phát triển chất lượng giáo dục theo thời gian. CHƯƠNG III: PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU Ở chương I và chương II chúng tôi đã giới thiệu những kiến thức cơ bản để xây dựng một đề thi hay đề kiểm tra bằng các cầu hỏi trăc nghiệm khách quan và lý thuyết về các tài liệu đặc trưng để đánh giá đề thi trắc nghiệm khách quan chúng tôi đã xây dựng để kiểm tra bằng phương pháp trắc nghiệm và đã tiến hành thử nghiệm cho kiểm tra một tiết với học sinh lớp 10. Sau đó đã nhập các đáp án trả lời của học sinh xử lý số liệu trên chương trình Quest. Chúng tôi xin giới thiệu sơ lược về quá trình làm thí nghiệm của mình và kết quả có 4 phương án trả lời: ABCD. Trong đó, có một phương án trả lời trả lời đúng sau khi phân tích được sau đây. III.1. Các bước tiến hành thí nghiệm 1. Xây dựng bộ các câu hỏi dạng trắc nghiệm, mỗi câu hỏi có 4 phương án lựa chọn 2. Xây dựng một đề thi gồm 30 câu hỏi trắc nghiệm lấy từ trong "ngân hàng" câu hỏi 3. Tham khảo về nội dung các câu hỏi với những người cùng chuyên môn, có chỉnh sửa, bổ sung và thay thế những câu chưa đạt yêu cầu. 4. Hình thành một đề gốc sau đó bảo vị trí các câu và vị trí các đáp án trả lời các câu hỏi nhờ phần mềm tin học. 5. In và cho kiểm tra thử trên thực tế khi kiểm tra chúng tôi đã tạo được tâm lý vững chắc cho học sinh để mọi thí sinh đều coi đây là trắc nghiệm thật lấy điểm 1 tiết để học sinh có tinh thần làm nghiêm túc, hết mình để phép thử đạt yêu cầu. 6. Cuối cùng, nhập số liệu xử lý kết quả làm bài của học sinh bằng phần mềm tin học III.2. Phân tích kết quả thực tế III. 2.1. Kết quả chung - Số lượng câu trong một đề thi: 30 câu (30items) - Số thí sinh làm trắc nghiệm: 100 thí sinh (100Cases) - Mỗi câu hỏi nhất. - Đáp án của đề gốc: CCDCCCDBAACCCACACAACCADCADACCA 1. Summary of item Estimates (Tóm lược các năng lực của câu trắc nghiệm ) Mean: .00 SD: 1.01 SD (adjusted): .98 Reliability of estimate: .94 (độ tin cậy của bài trắc nghiệm) Giải thích: Mean: .00 nghĩa là số trung bình là 0.00. SD: 1.01 nghĩa là độ lệch chuẩn so với năng lực. Kết quả xấp xỉ bằng một là tương đối tốt. Độ ổn định của bài trắc nghiệm là 0,94 là một kết quả tương đối tốt và hoàn toàn chấp nhận được. 2. Infit Mean Square Mean: 1.00 SD: .09 Out fit Mean Square Mean: 1.01 SD: .18 3. O items with zero scores and O items with perfect scores: Nghĩa là: không có một câu nào bỏ trống và không có một câu nào thí sinh trả lời đúng hoàn toàn. III.2.2. Phân tích câu trắc nghiệm Để đánh giá chất lượng của bài trắc nghiệm, chúng ta sẽ đánh giá từng câu hỏi một. Mỗi một câu hỏi lại được đánh giá qua các tiêu chí như: độ khó, độ phân biệt, phương án đúng và phương án nhiều của câu hỏi ấy. Sau đây chúng tôi phân tích hai câu trắc nghiệm để minh hoạ: Ví dụ 1: Item 1 (câu số 1) Nội dung câu hỏi: Cho 8, 7 gam MnO2 tác dụng với dung dịch HCl dư thì thể tích khí Cl2 (đktc) thu được sẽ là: A. 2,24 (l) C. 4,48 (l) B. 11,2 (l) D. 22,4 (l) Kết quả phân tích câu 1: Item 1: item 1 (key = C) Categories Count Percent (%) Pt-Biserial P- Value A 11 11,1 -.25 .007 B 12 12,1 - .24 .009 C* 59 59,6 .35 .000 D 17 17,2 -.05 .322 Missing 1 Phân tích: đán án đúng của câu 1 là phương án C trong 4 lựa chọn A, B, C, D. Cout là số thì sinh tham gia trả lời các phương án. Thấy ngay ở phương án A có 11 thí sinh lựa chọn, B có 12, C có 59, D có 17 người lựa chọn, có 1 người không làm câu này (missing). Percent (%) là số phần trăm thí sinh tham gia trả lời các phương án ở phương án C (phương án đúng) có 59,6% thí sinh lựa chọn. Pt - Biserial là tương quan điểm nhị phân hay độ phân biệt của câu hỏi. Với phương án C độ phân biệt là dương (0,35 > 0,2) tương đối lớn còn các phương án nhiễu đều có độ phân biệt âm nên đây có thể nói là một câu hỏi tương đối tốt Ví dụ 2: Item 18 (câu 18) A. Hợp chất với kim loại hoặc với Hiđrô chúng luôn có số ôxi hoá là -1. B. Có số Ôxi hoá duy nhất là + 7 C. Có số Ôxihoa duy nhất là + 1 D. Cả A, B, C đều sai Kết quả câu 18: Item 18: item 18 (key = A) Categories Count Percent (%) Pt-Biserial A* 29 30,9 11 B 5 5,3 -.20 C* 8 8.5 - .18 D 52 55,3 .0,8 Missing 6 Nghĩa là với câu 18 ta thấy số thí sinh lựa chọn phương án đúng là 29 (chiếm 30,9%) nhưng lại chọn phương án nhiễu D là 52 học sinh (55,35) lớn hơn rất nhiều so với phương án đúng. Đối với câu hỏi này phải chăng phương án A chưa phải là phương án đúng nhất nhưng ta đã nhằm gán cho nó là phương án đúng phải chăng phương án D mới là phương án đúng 3 có hai khả năng làm cho học sinh lựa chọn phương án nhiễu D nhiều hơn hẳn so với phương án đúng là thứ nhất do trong quá trình giảng dạy đã tạo nên sự nhầm lẫn nào chăng, thứ hai là do học sinh không hiểu rõ yêu cầu của câu hỏi gây ra nhầm lẫn điều này cần xem lại cách diễn đạt của câu trắc nghiệm. Như vậy đây là một câu không có độ phân biệt thấp (0,11< 0,2) nên cần điều chỉnh phương án nhiễu D hay thay bằng một câu khác III.3. Xây dựng mô hình Rasch trên số liệu thực III.3.1. Sự phù hợp của các câu hỏi Run One: Hoa hoc 10 -------------------------------------------------------------------------- Item Fit 14/ 5/2004 20:29 all on hoa10 (N = 100 L = 30) -------------------------------------------------------------------------- INFIT MNSQ .63 .71 .83 1.00 1.20 1.40 1.60 --------------+---------+---------+---------+---------+---------+--------- 1 item 1 . *| . 2 item 2 . * | . 3 item 3 . | * . 4 item 4 . * | . 5 item 5 . * | . 6 item 6 . * | . 7 item 7 . |* . 8 item 8 . | * . 9 item 9 . *| . 10 item 10 . * . 11 item 11 . * . 12 item 12 . * | . 13 item 13 . | * . 14 item 14 . * | . 15 item 15 . * | . 16 item 16 . | * . 17 item 17 . * | . 18 item 18 . | * . 19 item 19 . |* . 20 item 20 . *| . 21 item 21 . | * . 22 item 22 . * . 23 item 23 . * | . 24 item 24 . |* . 25 item 25 . * | . 26 item 26 . | * . 27 item 27 . * | . 28 item 28 . |* . 29 item 29 . | * . 30 item 30 . * | . Hình 1 Qua hình 1 ta thấy cả 30 câu hỏi trong bài trắc nghiệm thử mà chúng ta đã làm thí nghiệm đều hợp lý, nằm trong ngưỡng cho phép của mô hình Rasch III.3.2. Sự phù hợp của các thí sinh (Hình 2): Run One: Hoa hoc 10 ------------------------------------------------------------------------- Case Fit In input Order 14/ 5/2004 20:29 all on hoa10 (N = 100 L = 30) -------------------------------------------------------------------------- INFIT MNSQ .63 .71 .83 1.00 1.20 1.40 1.60 --------------+---------+---------+---------+---------+---------+-----+--- 1 09 . | * . 2 18 . | * . 3 21 . * | . 4 23 * . | . 5 24 . * | . 6 35 . * | . 7 42 . *| . 8 45 . *| . 9 47 . | * . 10 55 . | * . 11 59 . | * . 12 65 . * | . 13 66 . | * . 14 74 . | * . 15 78 . * | . 16 79 . * | . 17 80 . * | . 18 84 . * | . 19 26 . * | . 20 98 . | * . 21 14 . * . 22 17 . * | . 23 22 * | . 24 28 . | * . 25 30 . | * . 26 34 . | * . 27 37 . | *. 28 50 . * | . 29 51 . * | . 30 54 . | .* 31 56 . | * . 32 57 . | . * 33 64 . | * . 34 69 . | * . 35 75 . | . * 36 76 . | . * 37 77 . | * . 38 81 . | * . 39 90 . | . * 40 99 . * . 41 02 . * | . 42 10 . * | . 43 12 * | . 44 16 . * | . 45 19 . * | . 46 20 . * | . 47 25 . * | . 48 31 . * | . 49 36 . | * . 50 41 . | * . Qua hình 2 đa số thí sinh đều nằm trong ngưỡng cho phép chỉ có một số trường hợp vựot khỏi giới hạn. Như vậy số liệu thực tế tương đối phù hợp với mô hình Rasch . III.3.3. Phân bố khả năng trả lời đúng của thí sinh và độ đó của các câu hỏi Run One: Hoa hoc 10 -------------------------------------------------------------------------------- Item Estimates (Thresholds) 14/ 5/2004 20:29 all on hoa10 (N = 100 L = 30) -------------------------------------------------------------------------------- 4.0 | | X | | | 3.0 X | | | 2.0 | 25 | | XXX | X | | 23 X | X | 13 20 27 1.0 X | 8 18 XXXXXXX | XXX | XXXXXX | 29 XXX | 3 9 19 26 XXXXXXXXXX | 5 16 XXXXXXXXXXX | 2 10 15 .0 XXXXXXX | XXXXXXXX | XXXXXX | 12 24 XXXXXX | 1 30 XXXXXXXXX | 22 28 XXXX | 21 X | XX | -1.0 XX | X | 11 | 4 | 6 XXX | 14 | 17 | X | -2.0 | | X | | -3.0 | -------------------------------------------------------------------------------- Each X represents 1 students Hình 3 Mỗi dấu X đại diện cho một thí sinh tham gia làm trắc nghiệm. Qua hình ta thấy lượng thí sinh tập trung ở mức độ năng lực trung bình tại O là lớn nhất, chiếm số đông trong vùng từ - 1,0 đến + 1,0, số lượng câu khó ở mức độ trung bình tương đối nhiều. Câu 25 là câu khó nhất vì có ít thí sinh làm đúng nhất và câu 7 là câu dễ nhất vì hầu như ai cũng trả lời đúng. Do vậy, mô hình chung cho thấy kết quả thu được là tương đối tốt. III.3.4. Phân tích kết quả của từng câu hỏi một Bảng 1 Run One: Hoa hoc 10 -------------------------------------------------------------------------- Item Estimates (Thresholds) In input Order 14/ 5/2004 20:29 all on hoa10 (N = 100 L = 30) ------------------------------------------------------------------------- ITEM NAME |SCORE MAXSCR| THRSH | INFT OUTFT INFT OUTFT | | 1 | MNSQ MNSQ t t ------------------------------------------------------------------------- 1 item 1 | 59 99 | -.34 | .99 1.24 -.2 1.4 | | .22| | | | 2 item 2 | 42 87 | .15 | .92 .87 -1.3 -.8 | | .23| | | | 3 item 3 | 37 91 | .46 | 1.22 1.20 2.8 1.2 | | .23| | | | 4 item 4 | 77 99 | -1.27 | .85 .71 -1.1 -1.2 | | .25| | | | 5 item 5 | 39 90 | .35 | .84 .78 -2.5 -1.5 | | .23| | | | 6 item 6 | 76 96 | -1.35 | .95 1.20 -.3 .8 | | .26| | | | 7 item 7 | 88 95 | -2.61 | 1.01 .87 .1 -.1 | | .40| | | | 8 item 8 | 27 92 | .99 | 1.10 1.39 .9 1.9 | | .24| | | | 9 item 9 | 42 98 | .40 | .99 .97 -.1 -.1 | | .22| | | | 10 item 10 | 42 91 | .25 | 1.00 .95 .0 -.3 | | .22| | | | 11 item 11 | 73 99 | -1.04 | 1.00 .89 .0 -.4 | | .24| | | | 12 item 12 | 52 94 | -.18 | .89 .85 -1.7 -1.0 | | .22| | | | 13 item 13 | 24 86 | 1.04 | 1.07 1.15 .6 .8 | | .26| | | | 14 item 14 | 81 99 | -1.52 | .96 .98 -.2 .0 | | .27| | | | 15 item 15 | 43 90 | .14 | .94 .90 -1.0 -.6 | | .22| | | | 16 item 16 | 40 91 | .32 | 1.07 1.12 1.0 .8 | | .22| | | | 17 item 17 | 82 100 | -1.55 | .95 1.05 -.2 .3 | | .27| | | | 18 item 18 | 29 94 | .96 | 1.09 1.28 .9 1.5 | | .24| | | | ========================================================================== *****Output Continues**** Run One: Hoa hoc 10 -------------------------------------------------------------------------- Item Estimates (Thresholds) In input Order 14/ 5/2004 20:29 all on hoa10 (N = 100 L = 30) -------------------------------------------------------------------------- ITEM NAME |SCORE MAXSCR| THRSH | INFT OUTFT INFT OUTFT | | 1 | MNSQ MNSQ t t -------------------------------------------------------------------------- 19 item 19 | 37 91 | .46 | 1.01 .95 .2 -.2 | | .23| | | | 20 item 20 | 26 91 | 1.05 | .98 1.12 -.2 .7 | | .25| | | | 21 item 21 | 60 93 | -.59 | 1.08 1.07 1.0 .4 | | .23| | | | 22 item 22 | 58 94 | -.47 | 1.00 .95 .0 -.2 | | .22| | | | 23 item 23 | 22 94 | 1.36 | .93 .82 -.4 -.8 | | .26| | | | 24 item 24 | 54 96 | -.22 | 1.01 1.18 .2 1.1 | | .22| | | | 25 item 25 | 13 89 | 1.98 | .88 .69 -.5 -1.0 | | .32| | | | 26 item 26 | 40 97 | .44 | 1.13 1.24 1.8 1.5 | | .22| | | | 27 item 27 | 28 96 | 1.02 | .93 .88 -.6 -.6 | | .24| | | | 28 item 28 | 61 97 | -.50 | 1.02 1.00 .3 .0 | | .22| | | | 29 item 29 | 33 89 | .61 | 1.09 1.05 1.1 .3 | | .23| | | | 30 item 30 | 54 92 | -.36 | .95 .91 -.7 -.5 | | .22| ------------------------------------------------------------------------- Mean | | .00 | 1.00 1.01 .0 .1 SD | | 1.01 | .09 .18 1.0 .9 ========================================================================== Bảng 1 cho thấy các đại lượng đặc trưng có liên quan đến một câu trắc nghiệm bất kỳ: Score là số thí sinh làm đúng, Maxscr là tổng số thí sinh tham gia trả lời câu hỏi, Infit và Outfit nhận các giá trị xấp xỉ 1 là kết quả tốt. III.3.5. Khả năng trả lời của thí sinh đối với các câu hỏi. Xét một ví dụ cụ thể sau: ------------------------------- K I D M A P---------------------------- Candidate: 09 ability: .68 group: all fit: 1.23 scale: all % score: 63.33 ------------Harder Achieved ----------------------Harder Not Achieved ------ | | | | | | | | | | | | | | | | | | | | | | | | 25 | | | | | | | | | | 23(C) .......................................... | | 20 13 8 | | 18(D) 27(C) | | |XXX| 29 | | 9 | | 3(B) 19(D) 26(B) 16 10 5 ........................... 2 | | 15(D) | | | | 12(D) 24 | | 1(D) 30(B) 28 22 | | 21 | | | | | | 11 | | | | 4 | | 6(B) | | 17 14 | | | | 7 | | | | | | | | ------------Easier Achieved ----------------------Easier Not Achieved ------ ========================================================================== ability: là năng lực của thí sinh fit: sự phù hợp với mô hình Rasch . % Score: Phần trăm trả lời đúng số câu của bài trắc nghiệm với thí sinh 09 này, năng lực là 0,69 sự phụ hợp với mô hình Rasch là 1,23, phần trăm số câu làm đúng là 63,33% nghĩa là bài làm của thí sinh tương đối tốt. Các đặc trưng cho sự trả lời của mỗi thí sinh đối với bài trắc nghiệm được tổng kết ở bảng 2 dưới đây. Run One: Hoa hoc 10 ------------------------------------------------------------------------- Case Estimates In input Order 14/5/2004 20:29 all on hoa10 (N = 100 L = 30) -------------------------------------------------------------------------- NAME |SCORE MAXSCR | ESTIMATE ERROR | INFIT OUTFT INFTOUTFT | | | MNSQ MNSQ t t -------------------------------------------------------------------------- 1 09 | 19 30 | .68 .41 | 1.23 1.27 1.42 .84 2 18 | 17 21 | 1.62 .60 | 1.13 .90 .47 .09 3 21 | 18 30 | .51 .41 | .95 .86 -.29 .37 4 23 | 13 29 | -.26 .41 | .72 .65 -1.88 1.28 5 24 | 13 26 | .02 .44 | .81 .73 -1.15 .84 6 35 | 16 30 | .19 .40 | .82 .74 -1.24 .90 7 42 | 10 30 | -.81 .43 | .98 .84 -.02 .38 8 45 | 22 30 | 1.22 .44 | .98 1.23 -.02 .64 9 47 | 15 30 | .03 .40 | 1.24 1.23 1.58 .85 10 55 | 16 29 | .27 .41 | 1.25 1.67 1.62 1.96 11 59 | 16 28 | .35 .42 | 1.03 .94 .27 .07 12 65 | 10 26 | -.56 .44 | .83 .75 -.91 .72 13 66 | 12 27 | -.22 .43 | 1.06 1.02 .43 .16 14 74 | 7 25 | -1.05 .49 | 1.09 1.13 .43 .44 15 78 | 7 30 | -1.41 .47 | .93 1.21 -.18 .60 16 79 | 10 28 | -.71 .44 | .89 .80 -.54 .53 17 80 | 12 30 | -.46 .41 | .97 .88 -.12 .31 18 84 | 13 29 | -.23 .41 | .87 .78 -.76 .73 19 26 | 15 30 | .03 .40 | .95 .90 -.32 .28 20 98 | 28 30 | 3.00 .75 | 1.18 1.91 .48 1.02 21 14 | 20 30 | .85 .42 | 1.01 .90 .11 .17 22 17 | 14 28 | -.03 .42 | .90 .85 -.61 .46 23 22 | 13 30 | -.29 .41 | .77 .69 -1.54 1.11 24 28 | 17 29 | .44 .41 | 1.16 1.19 1.06 .67 25 30 | 16 30 | .19 .40 | 1.09 1.10 .68 .43 26 34 | 12 29 | -.40 .42 | 1.25 1.24 1.43 .83 27 37 | 11 30 | -.63 .42 | 1.27 1.27 1.45 .90 28 50 | 12 30 | -.46 .41 | .93 .91 -.35 .21 29 51 | 16 30 | .19 .40 | .90 .81 -.69 .60 30 54 | 18 30 | .51 .41 | 1.32 1.31 2.00 1.00 31 56 | 10 29 | -.77 .43 | 1.14 1.12 .75 .46 32 57 | 12 30 | -.46 .41 | 1.41 1.41 2.20 1.33 33 64 | 13 20 | .45 .51 | 1.07 .93 .39 .03 34 69 | 16 25 | .59 .46 | 1.12 1.04 .72 .23 35 75 | 10 19 | .22 .50 | 1.64 1.90 3.08 2.26 36 76 | 12 17 | .79 .58 | 1.61 2.13 2.11 1.75 37 77 | 14 30 | -.13 .40 | 1.11 1.06 .75 .31 38 81 | 7 30 | -1.41 .47 | 1.04 1.21 .26 .58 39 90 | 13 29 | -.23 .41 | 1.36 1.54 2.07 1.68 40 99 | 29 30 | 3.76 1.03 | 1.00 .56 .31 .22 41 02 | 20 30 | .85 .42 | .94 .82 -.28 .39 42 10 | 19 30 | .68 .41 | .88 .78 -.74 .60 43 12 | 16 30 | .19 .40 | .77 .69 -1.66 1.11 44 16 | 11 24 | -.38 .45 | .92 .93 -.44 .14 45 19 | 17 30 | .35 .40 | .84 .76 -1.13 .75 46 20 | 17 30 | .35 .40 | .91 .83 -.58 .50 47 25 | 17 30 | .35 .40 | .88 .80 -.84 .61 48 31 | 17 30 | .35 .40 | .85 .84 -1.03 .46 49 36 | 14 30 | -.13 .40 | 1.11 1.11 .72 .48 50 41 | 16 30 | .19 .40 | 1.04 1.00 .34 .09 51 58 | 14 23 | .34 .47 | .96 .86 -.19 .30 52 71 | 16 30 | .19 .40 | .88 .80 -.85 .64 53 72 | 16 30 | .19 .40 | .88 .80 -.83 .64 54 73 | 20 30 | .85 .42 | .85 .75 -.90 .61 55 83 | 12 30 | -.46 .41 | .95 .95 -.24 .07 56 93 | 14 30 | -.13 .40 | .86 .84 -.91 .50 ============================================================================ *****Output Continues**** Run One: Hoa hoc 10 --------------------------------------------------------------------------- Case Estimates In input Order 14/5/2004 20:29 all on hoa10 (N = 100 L = 30) ---------------------------------------------------------------------------- NAME |SCORE MAXSCR | ESTIMATE ERROR | INFIT OUTFT INFT OUTFT | | | MNSQ MNSQ t t ---------------------------------------------------------------------------- 57 95 | 11 30 | -.63 .42 | .97 .93 -.08 .13 58 96 | 13 30 | -.29 .41 | .97 .96 -.12 .06 59 97 | 12 30 | -.46 .41 | .99 .99 .02 .06 60 100 | 4 30 | -2.21 .58 | .96 1.28 .03 .60 61 01 | 24 30 | 1.64 .48 | .97 1.27 -.03 .64 62 04 | 23 30 | 1.42 .46 | 1.05 1.36 .31 .82 63 05 | 14 27 | .12 .43 | .85 .78 -.96 .65 64 15 | 23 29 | 1.56 .49 | 1.11 1.50 .48 .98 65 32 | 15 30 | .03 .40 | .95 .90 -.30 .26 66 33 | 15 30 | .03 .40 | .95 .90 -.28 .25 67 40 | 14 30 | -.13 .40 | .97 .92 -.12 .21 68 43 | 16 30 | .19 .40 | .97 .91 -.18 .21 69 44 | 13 30 | -.29 .41 | .93 .90 -.37 .26 70 48 | 14 30 | -.13 .40 | .93 .89 -.42 .32 71 49 | 13 30 | -.29 .41 | 1.12 1.31 .80 1.09 72 52 | 13 18 | .81 .56 | .81 .66 -.74 .55 73 53 | 8 17 | -.22 .54 | 1.27 1.26 1.22 .77 74 60 | 14 19 | .94 .56 | .80 .60 -.73 .66 75 62 | 13 18 | .74 .56 | .78 .64 -.86 .62 76 63 | 8 14 | .00 .59 | 1.13 1.11 .61 .40 77 67 | 12 30 | -.46 .41 | 1.27 1.43 1.53 1.37 78 70 | 7 10 | .41 .74 | .92 .75 -.12 .29 79 86 | 14 30 | -.13 .40 | 1.03 1.24 .23 .89 80 88 | 14 30 | -.13 .40 | 1.22 1.48 1.39 1.57 81 03 | 21 30 | 1.03 .43 | .97 1.06 -.13 .27 82 06 | 12 30 | -.46 .41 | .80 .72 -1.19 .96 83 07 | 15 30 | .03 .40 | 1.01 .98 .15 .01 84 08 | 20 30 | .85 .42 | .78 .65 -1.34 .97 85 11 | 18 30 | .51 .41 | .85 .77 -1.04 .67 86 13 | 16 30 | .19 .40 | .75 .76 -1.84 .80 87 27 | 20 30 | .85 .42 | .78 .65 -1.35 .97 88 29 | 16 29 | .30 .41 | .75 .75 -1.79 .80 89 38 | 13 28 | -.16 .42 | .74 .67 -1.69 1.14 90 39 | 17 30 | .35 .40 | .93 .96 -.44 .04 91 46 | 18 30 | .51 .41 | .92 .87 -.48 .34 92 61 | 12 30 | -.46 .41 | 1.07 1.02 .44 .17 93 68 | 11 30 | -.63 .42 | .83 .79 -.96 .63 94 82 | 9 30 | -1.00 .44 | 1.09 1.06 .46 .27 95 85 | 18 30 | .51 .41 | .93 .87 -.42 .93 97 89 | 7 30 | -1.41 .47 | 1.09 1.19 .42 .55 98 91 | 13 23 | .31 .45 | 1.16 1.20 1.03 .73 99 92 | 9 30 | -1.00 .44 | 1.06 1.07 .35 .30 100 94 | 5 30 | -1.91 .53 | 1.45 1.78 1.31 1.29 ---------------------------------------------------------------------------- Mean | | .10 | 1.01 1.01 .00 .05 SD | | .84 | .18 .30 1.00 .76 ============================================================================ Bảng 2 Trong đó Esimate là năng lực của thí sinh, error là độ khó của bài trắc nghiệm CHƯƠNG IV: KẾT LUẬN IV. Khoa học đo lường và đánh giá trong giáo dục trên thế giới và nước ta. IV.1. Trên thế giới, khoa học đo lường đã có một lịch sử ra đời (khoảng một thế kỷ) và phát triển hết sức mạnh mẽ. ở Châu Âu và đặc biệt là Mỹ, lĩnh vực khoa học này phát triển mạnh từ thời kỳ trước và sau chiến tranh thế giới thứ 2. Việc chấm bài trắc nghiệm bằng máy của IBM năm 1935, việc thành lập NCME vào thập niên 1950 và ra đời ETS (dịch vụ trắc nghiệm giáo dục) năm 1947 ngành công nghiệp trắc nghiệm đã hình thành ở Mỹ. Từ đó đến nay khoa học về đo lường tâm lý và giáo dục đã phát triển liên tục tự phê bình chỉ trích và tự điều chỉnh phát triển ngày một mạnh mẽ hơn thường xuyên hơn. Tương ứng với ngành công nghiệp trắc nghiệm đồ sộ và sự phát triển như vũ bão của ngành công nghệ thông tin, lý thuyết về đo lường trong tâm lý trong giáo dục cũng phát triển rất nhanh. Đặc biệt là với sự ra đời của thuyết ứng đáp câu hỏi đã đạt được những thành tựu quan trọng nâng cao độ chính xác của phương phaps trắc nhiệm .Ngoài ra ,trên những thành tựu của IRT và ngôn ngữ học máy tính công nghệ E- RATE chấm tự động các bài luận tiếng anh nhờ máy tính của ETS đã được triển khai nhờ mạng Internet trong năm vùa qua. Trong các kỳ thi tuyển sinh đại học mà dựa vào kết quả của các kỳ thi do các công ty ngoài Nhà nước tổ chức để xét tuyển. Có hai dịch vụ hỗ trợ TTĐH ở Hoa Kỳ là SAT (Scholastic Achievement Test) do công ty ETS (Educational Testing Services) tổ chức, và ACT (American College Test) do chương trình ACT American College Testing Program triển khai. Cả SAT và ACT thường tổ chức thi mỗi năm 4 lần, cho các học sinh ở những năm cuối bậc phổ thông trung học. Hiện naz hàng năm có khoảng 1,8 triệu thí sinh thi SAT và 1,6 triệu thí sinh thi ACT. IV.1.2. Ở Việt Nam Chúng ta đã tổ chức một mùa tuyển sinh đại học bằng trắc nghiệm khách quan và đạt được kết quả ngoài sức tưởng tượng. Ban đầu khi chúng ta tiến hành kỳ thi thửa đầu tiên tại Đà Nẵng tưởng chừng như học sinh không chấp nhận và gây nhiều dư luận cho xã hội, nhưng khi tiến hành chúng ta làm song song cả đề thi tiểu luận và đề thi trắc nghiệm cho thí sinh lựa chọn. Kết quả là có 70% số thí sinh tham dự đã chọn đề thi bằng trắc nghiệm khách quan là con số ngoài dự đoán và mong đợi của những nhà tổ chức. Lý do mà các thí sinh lựa chọn đề thi trắc nghiệm là việc chấm điểm bằng máy tính tạo sự tin tưởng và độ chính xác điểm vì khi tự luận đôi khi điểm chấm phụ thuộc vào rất nhiều các yếu tố chủ quan khác nhau. Rõ ràng tuy mới được đưa vào thử nghiệm đầu tiên nhưng trắc nghiệm khách quan đã thể hiện được ưu thế vượt trội của mình so với sử dụng phương pháp tự luận truyền thống. Và kết quả chúng ta đã lựa chọn tương đối khách quan và chính xác những người có khả năng vào đại học, trường hợp may rủi xảy ra là rất ít. Từ mùa thi tại Đà Nẵng 1996 đó tới nay chúng ta đã mở rộng ra tại nhiều tỉnh và đã áp dụng thi tuyển bằng trắc nghiệm cả trong Nam và ngoài Bắc. Đến nay phương pháp trắc nghiệm được dùng ngay trong kỳ kiểm tra học kỳ về một số môi thi học kỳ trong đại học. IV.3. Giải pháp về phướng phát triển khoa học đo lường trong giáo dục ở nước ta Chúng tôi xin đề xuất những phương hướng sau: - Tất cả giáo chức của các trường đại học cần được bồi dưỡng những hiểu biết sơ đẳng về khoa học này. - Mọi trường đại học đều nên tổ chức bộ phận nghiên cứu triển khai để áp dụng khoa học về đo lường trong giáo dục vào các hoạt động kiểm tra đánh giá kết quả học tập của sinh viên, hoạt động giảng dạy và phục vụ của giáo chức và viên chức. - Các trường đại học và viện nghiên cứu chuyên về giáo dục cần đẩy mạnh việc nghiên cứu về khoa học đo lường trong giáo dục để thấu hiểu nó, từ đó hướng dẫn áp dụng nó trong toàn hệ thống giáo dục từ mâu giáo đến sau đại học. - Tiếp đến, cần trước khai áp dụng khoa học đo lường trong giáo dục ra mọi hoạt động xã hội bên ngoài hệ thống giáo dục, vì rằng trong lương lai, với sụ phát triển của kinh tế xã hội, tất yếu việc áp dụng khoa học đó sẽ trở thành một ngành công nghiệp lớn. TÀI LIỆU THAM KHẢO 1. Lâm Quang Thiệp 2000 Đo lường và đánh giá chất lượng giáo dục 2. Lâm Quang Thiệp 1994. Những cơ sở của kỹ thuật trắc nghiệm. Bộ giáo dục và đào tạo vụ đại học 3.Dương Thiệu Tống: Trắc nghiệm và đo lường thành quả học tập (Tập 1) Trường ĐHTH Thành Phố Hồ Chí Minh xuất bản năm 1995 4. Dương Thiệu Tống: Trắc nghiệm và đo lường thành quả học tập (Tập 2) Trường ĐHTH Thành Phố Hồ Chí Minh xuất bản năm 1995 5. Cơ sở của Kỹ thuật trắc nghiệm (Trích các bài giảng của P.Griffin- Vụ Đại học, 19994) 6. Nguyễn Phụng Hoàng và Võ Ngọc Lan: Phương pháp trắc nghiệm trong kiểm tra và đánh giá thành quả học tập NXBGD.1996 7. Trần Trọng Thuỷ, Khoa học Chẩn đoán Tâm lý,NXBGD,Hà Nội, 1994. 8. Thorndike,E.L.I trodution to the Thẻoy of Meantal and Social Maesanure . New Yhork:Teacher College,Clumbia University,1904.

Các file đính kèm theo tài liệu này:

  • pdfLuận Văn- Tổng quan về phương pháp trắc nghiệm khách quan.pdf
Tài liệu liên quan