Đề tài Một số sai sót thống kê thường gặp trong trình bày kết quả và phiên giải kết quả nghiên cứu

Tài liệu Đề tài Một số sai sót thống kê thường gặp trong trình bày kết quả và phiên giải kết quả nghiên cứu – Hoàng Thị Hải Vân: 166 TCNCYH 117 (1) - 2019 TẠP CHÍ NGHIÊN CỨU Y HỌC MỘT SỐ SAI SÓT THỐNG KÊ THƯỜNG GẶP TRONG TRÌNH BÀY KẾT QUẢ VÀ PHIÊN GIẢI KẾT QUẢ NGHIÊN CỨU Hoàng Thị Hải Vân Viện Đào tạo Y học Dự phòng và Y tế công cộng, Trường Đại học Y Hà Nội Mặc dù đã có nhiều nỗ lực của các nhà nghiên cứu, các nhà biên tập đưa ra các khuyến cáo cũng như các hướng dẫn, hienj nay nhiều kết quả nghiên cứu trong lĩnh vực y học đăng tải vẫn gây ra những hiểu lầm và có chất lượng thấp. Mục tiêu của nghiên cứu này nhằm mô tả các sai sót thống kê thường gặp trong các nghiên cứu y học trong trình bày và phiên giải kết quả nghiên cứu. Kết quả cho thấy nhà nghiên cứu thường gặp một số sai sót như: mô tả số liệu và biểu diễn số liệu không hợp lý (lựa chọn tham số không phù hợp), trình bày kết quả không tốt hoặc hình thức trình bày không phù hợp; các kết quả nghiên cứu bị phiên giải sai hoặc không phù hợp (như tính toán và hiểu sai giá trị p-value). Tất cả các sai sót đó đều có thể dẫn đến những k...

9 trang | Chia sẻ: Đình Chiến | Lượt xem: 952 | Lượt tải: 0Free

Bạn đang xem nội dung tài liệu Đề tài Một số sai sót thống kê thường gặp trong trình bày kết quả và phiên giải kết quả nghiên cứu – Hoàng Thị Hải Vân, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

166 TCNCYH 117 (1) - 2019 TẠP CHÍ NGHIÊN CỨU Y HỌC MỘT SỐ SAI SĨT THỐNG KÊ THƯỜNG GẶP TRONG TRÌNH BÀY KẾT QUẢ VÀ PHIÊN GIẢI KẾT QUẢ NGHIÊN CỨU Hồng Thị Hải Vân Viện Đào tạo Y học Dự phịng và Y tế cơng cộng, Trường Đại học Y Hà Nội Mặc dù đã cĩ nhiều nỗ lực của các nhà nghiên cứu, các nhà biên tập đưa ra các khuyến cáo cũng như các hướng dẫn, hienj nay nhiều kết quả nghiên cứu trong lĩnh vực y học đăng tải vẫn gây ra những hiểu lầm và cĩ chất lượng thấp. Mục tiêu của nghiên cứu này nhằm mơ tả các sai sĩt thống kê thường gặp trong các nghiên cứu y học trong trình bày và phiên giải kết quả nghiên cứu. Kết quả cho thấy nhà nghiên cứu thường gặp một số sai sĩt như: mơ tả số liệu và biểu diễn số liệu khơng hợp lý (lựa chọn tham số khơng phù hợp), trình bày kết quả khơng tốt hoặc hình thức trình bày khơng phù hợp; các kết quả nghiên cứu bị phiên giải sai hoặc khơng phù hợp (như tính tốn và hiểu sai giá trị p-value). Tất cả các sai sĩt đĩ đều cĩ thể dẫn đến những kết luận sai lầm của nghiên cứu ảnh hưởng đến việc sử dụng, tham khảo kết quả nghiên cứu như một cơ sở hay một bằng chứng khoa học. Từ khĩa: sai sĩt thống kê, nghiên cứu y học, trình bày kết quả nghiên cứu, phiên giải kết quả nghiên cứu I. ĐẶT VẤN ĐỀ Các nghiên cứu khoa học nĩi chung và nghiên cứu y học nĩi riêng ngày càng trở nên quan trọng trong đời sống cũng như trong lĩnh vực chăm sĩc sức khỏe khi liên tục cập nhật những kiến thức mới và những bằng chứng mới cho các nhà khoa học cũng như cho các nhà hoạch định chính sách thơng qua các kết quả nghiên cứu được cơng bố, qua đĩ sức khỏe của từng cá nhân và cộng đồng ngày càng được nâng cao [1; 2]. Bên cạnh đĩ, các bài báo đăng tải trên các tạp chí y học được xem như một cơ sở dữ liệu đào tạo và chia sẻ thơng tin nhiều hơn cả các nguồn khác như sách giáo khoa, bản tin và tài liệu chuyên khảo và việc đọc các bài báo y học được xem như là phương pháp chuẩn phục vụ cho đào tạo liên tục trong y học cho các bác sỹ, gĩp phần nâng cao kiến thức cho các bác sĩ trên tồn thế giới [3]. Tuy nhiên, bất chấp những nỗ lực chỉ ra những sai sĩt trong nhiều thập niên qua, các sai sĩt về thiết kế nghiên cứu và ứng dụng thống kê trong nghiên cứu y học như một căn bệnh mạn tính cho đến nay vẫn “rất bê bối” và các hành vi sai trái trong nghiên cứu bao gồm chế tạo, giả mạo hoặc đạo văn trong báo cáo kết quả nghiên cứu vẫn là một thách thức với tỷ lệ khơng chính thức khoảng 1 - 2% các nhà khoa học [4 - 10]. Sai số và các kết quả khơng thể sử dụng được là một trong những nguyên nhân dẫn tới 85% các nghiên cứu y sinh học bị lãng phí. Nhằm giúp các nhà nghiên cứu tránh được những sai lầm về thống kê phổ biến trong trình bày và phiên giải kết quả nghiên cứu của các nghiên cứu y học, tiếp nối nghiên cứu tổng quan các sai sĩt thống kê thường gặp trong thiết kế nghiên cứu và phân tích số liệu, chúng tơi tiến hành nghiên cứu này này nhằm mục tiêu mơ tả các sai sĩt thống kê thường gặp trong các nghiên cứu y học trong trình bày kết quả và phiên giải kết quả nghiên cứu. Địa chỉ liên hệ: Hồng Thị Hải Vân, Viện Đào tạo Y học Dự phịng và Y tế cơng cộng, Trường Đại học Y Hà Nội Email: [email protected] Ngày nhận: 111/2018 Ngày được chấp thuận: 07/12/2018 TCNCYH 117 (1) - 2019 167 TẠP CHÍ NGHIÊN CỨU Y HỌC II. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP - Thiết kế nghiên cứu: Tổng quan mơ tả. + Tiêu chí lựa chọn các bài báo Các bài báo đăng tải trên các tạp chí trong lĩnh vực y học cĩ peer review. Các bài báo cĩ chủ đề về phương pháp nghiên cứu, chất lượng nghiên cứu. + Chúng tơi trích xuất dữ liệu từ các bài báo được đăng tải trên các tạp chí cĩ phản biện. Để xác định các ấn phẩm, chúng tơi đã sử dụng tìm kiếm PubMed trên cơ sở các từ khĩa: statistical use, statistical errors, statisti- cal bias, medical research, quality of medical resaerch tập trung vào 4 nội dung: - Vị trí trong tiêu đề và tĩm tắt và trong bất kỳ trường nào cho. - Chủ đề thống kê. - Lĩnh vực nghiên cứu y sinh học. - Chất lượng nghiên cứu. Dựa trên các tiêu đề kiểm tra 116 bài báo đủ điều kiện đưa vào nghiên cứu, chúng tơi thu hẹp tới 25 ấn phẩm liên quan tập trung vào các sai sĩt thống kê ở giai đoạn thiết kế và phân tích số liệu. Từ đĩ chúng tơi tổng hợp kết quả từ 25 bài báo đăng tải kết quả nghiên cứu về các sai sĩt thống kê thường gặp trong nghiên cứu y học đăng tải trên các tạp chí cĩ phản biện quốc tế đã được lựa chọn ở trên. III. KẾT QUẢ 1. Sai sĩt trong trình bày kết quả nghiên cứu Áp dụng thống kê trong phân tích xử lý số liệu (lựa chọn phương pháp thống kê phân tích, xử lý phù hợp và đầy đủ) là rất quan trong song nếu kết quả nghiên cứu khơng được trình bày và phiên giải một cách đầy đủ rõ ràng thì sẽ làm giảm giá trị kết quả đã được phân tích. Điều đĩ cho thấy trình bày và phiên giải kết quả thống kê cũng đĩng vai trị quan trọng khơng kém gì thiết kế nghiên cứu và phân tích xử lý số liệu. Trình bày và phiên giải kết quả thống kê khơng chỉ cho các độc giả và đồng nghiệp tin tưởng vào kết quả nghiên cứu của mình mà quan trọng hơn là phải mang tính thuyết phục rằng kết quả phân tích xử lý số liệu của mình là phù hợp và chính xác. Trên thực tế ngay cả các bài báo đăng tải trên các tạp chí hàng đầu về nghiên cứu y học là Nature và BMJ cũng khơng tránh khỏi thiếu sĩt trong trình bày và phiên giải kết quả nghiên cứu với tỷ lệ cĩ ít nhất một sai sĩt tương ứng là 38,0% và 25,0% [11; 12]. Các sai sĩt gặp trong trình bày và phiên giải kết quả nghiên cứu là những sai sĩt phổ biến nhất trong các báo cáo nghiên cứu [13]. Trước hết phải kể đến sai sĩt diễn đạt các nội dung liên quan đến thống kê trong phần trình bày kết quả nghiên cứu. Trong vơ số các kết quả cĩ thể tính tốn được từ bộ số liệu, việc chọn giá trị nào để trình bày là rất quan trọng, vừa thể hiện được hiểu biết của nhà nghiên cứu về thống kê, vừa nâng được giá trị, tầm quan trọng của nghiên cứu thơng qua các kết quả thu được. Một số nhà nghiên cứu thậm chí khơng đề cập đến ý nghĩa của những con số mà họ trình bày, một số khác khơng biết họ nên viết gì, nên trình bày những nội dung gì khi phiên giải kết quả do đĩ dẫn đến sử dụng các giá trị mơ tả bộ số liệu khơng đúng. Một ví dụ điển hình hay gặp trong các nghiên cứu là sự nhầm lẫn giữa sai số chuẩn và độ lệch chuẩn [14]. Rất nhiều nhà nghiên cứu khơng phân biệt được sự khác biệt giữa sai số chuẩn và độ lệch chuẩn [15]. Đối với sai số chuẩn (SE), mặc dù được sử dụng khá phổ biến nhưng khơng sử dụng trong mơ tả bộ số liệu mà sử dụng trong các ước lượng thống kê. Do đĩ giá trị này khơng 168 TCNCYH 117 (1) - 2019 TẠP CHÍ NGHIÊN CỨU Y HỌC mơ tả bộ số liệu cĩ thể khơng phù hợp. Trong trường hợp áp dụng các test thống kê phi tham số, số liệu khơng thể được mơ tả bằng giá trị trung bình và độ lệch chuẩn vì các test thống kê phi tham số chỉ áp dụng cho các số liệu phân bố khơng chuẩn. Trong trình bày kết quả nghiên cứu, các con số đĩng vai trị quan trọng. Tuy nhiên, nhiều tác giả báo cáo các con số với độ chính xác khơng cần thiết [17]. Với các con số cĩ một hoặc hai chữ số sau dấu phẩy sẽ khiến cho người đọc hiểu con số đĩ nhanh hơn và dễ dàng hơn so với các số liệu cĩ đến ba, bốn chữ số sau dấu phẩy. Do đĩ việc làm trịn số sau dấu phẩy cũng địi hỏi nhà nghiên cứu phải cân nhắc khi báo cáo. Thậm chí cĩ những số liệu báo cáo khơng cần đến số thập phân ví dụ như nên báo cáo rằng bệnh nhân đĩ nặng khoảng 70kg thay vì 70,16kg. Làm trịn số khơng chính xác, sai sĩt do sao chép, sai sĩt đánh máy cịn gặp ở cả những tạp chí uy tín nhất trong lĩnh vực y học như Nature, BMJ với tỷ lệ là 11,6% và 11,1% theo một nghiên cứu của tác giả Emili Garcia-Berthou. Tỷ lệ xuất hiện ít nhất một trong các sai sĩt này ở tạp chí Nature là 38% và tạp chí BMJ là 25% [18]. thể đi kèm với giá trị trung bình cùng với dấu “±” như nhiều tác giả áp dụng mà cách trình bày đúng nhất là biểu diễn trong biểu đồ cột sai số [15]. Trong nhiều nghiên cứu, thậm chí kết quả nghiên cứu được trình bày dưới dạng trung bình mẫu “±” thêm một giá trị nhưng tác giả khơng giải thích xem giá trị đĩ là độ lệch chuẩn, sai số chuẩn hay một giá trị nào đo lường độ tập trung của bộ số liệu [16]. Một điểm quan trọng khi sử dụng các giá trị đo lường trong mơ tả và trình bày độ tập trung hay độ phân tán của số liệu cần phải lưu ý đĩ là nếu sử dụng giá trị trung bình và độ lệch chuẩn thì bộ số liệu phải cĩ phân bố chuẩn (phân bố Gaussian) hoặc phân bố khơng lệch. Khi trình bày giá trị trung bình và độ lệch chuẩn thì nên để độ lệch chuẩn trong ngoặc đơn thay vì dấu cộng trừ giúp cho người đọc khơng bị nhầm lẫn với 95% khoảng tin cậy. Đối với các số liệu phân bố lệch (khơng chuẩn) thay vì giá trị trung bình và độ lệch chuẩn khi mơ tả độ tập trung và độ phân tán phải sử dụng giá trị trung vị, khoảng tứ phân vị và khoảng giá trị. Tuy nhiên, khoảng giá trị chịu ảnh hưởng của các giá trị ngoại lai nên đơi khi sử dụng để Bảng 1. Một số sai sĩt cĩ thể gặp trong trình bày kết quả nghiên cứu STT Các sai sĩt thường gặp 1 Mơ tả số liệu và biểu diễn số liệu khơng hợp lý - Sử dụng giá trị trung bình nhưng khơng chỉ ra độ biến thiên của số liệu - Sử dụng SE thay vì SD - Sử dụng SD để mơ tả số liệu phân bố khơng chuẩn - Sai sĩt trong sự dụng dấu ± để mơ tả độ biến thiên hay sử dụng biểu đồ cột sai số mà khơng cĩ giải thích - Báo cáo các con số với độ chính xác khơng cần thiết (quá nhiều số sau dấu phẩy) 2 Trình bày kết quả khơng tốt hoặc khơng phù hợp - Chỉ báo cáo giá trị p mà khơng báo cáo khoảng tin cậy - Khơng đưa ra giá trị chính xác của p mà chỉ đưa ra ngưỡng - Thơng tin định lượng được trình bày với độ chính xác khơng thực tế TCNCYH 117 (1) - 2019 169 TẠP CHÍ NGHIÊN CỨU Y HỌC Trong trình bày kết quả nghiên cứu, bảng và biểu đồ/đồ thị là hai cơng cụ phổ biến, đĩng vai trị quan trọng trong việc truyền tải kết quả nghiên cứu đến người đọc và khơng phải khơng cĩ sai sĩt trong việc lựa chọn hình thức cũng như cách trình bày bảng và biểu đồ. Sai sĩt trong trình bày số liệu bằng bảng và biểu đồ/đồ thị cĩ thể dẫn tới phiên giải sai số liệu [19]. Trên thực tế, sử dụng biểu đồ/đồ thị sẽ gây ấn tượng cho người đọc về mặt hình ảnh nên dễ dàng truyền tải thơng điệp mà số liệu mang tới, đồng thời cũng cĩ thể so sánh dễ dàng. Sử dụng bảng biểu diễn số liệu thường sẽ cho các số liệu chi tiết theo cột và cĩ thể so sánh giữa các cột với nhau. Cĩ một số sai sĩt cĩ thể gặp phải trong trình bày số liệu bằng bảng và biểu đồ/đồ thị [19] đĩ là: thay đổi hình ảnh về mối tương quan giữa các cột trong trường hợp gốc của trục y khơng được bắt đầu từ giá trị 0; thay đổi hình ảnh mối tương quan giữa số liệu do thay đổi thang đo giữa trục x và trục y; hình ảnh làm cho người đọc nhầm lẫn về giá trị thực sự của cột biểu diễn khi sử dụng hình ảnh 3 chiều; biểu diễn hai biến trên cùng một biểu đồ sử dụng 2 trục y với 2 thang đo khác nhau dẫn đến cĩ thể hiểu nhầm về mối tương quan giữa các biến ; sử dụng bảng như một cơng cụ lưu trữ số liệu thay vì cung cấp thơng tin. Trong trường hợp số liệu được biểu diễn bằng biểu đồ cột với gốc của trục y khơng bắt đầu từ giá trị 0, nếu tác giả khơng giải thích trước, khi đọc biểu đồ người đọc sẽ chỉ nhìn vào đỉnh của các cột được biểu diễn và so sánh chiều cao của các cột với nhau. Do chiều cao của các cột khơng tương xứng với giá trị mà nĩ biểu diễn dẫn đến người đọc ngộ nhận về tương quan giá trị giữa các cột mà tác giả biểu diễn. Ví dụ khi nhìn vào hình dưới đây, hai biểu đồ cùng biểu diễn một bộ số liệu nhưng gốc trục y bắt đầu bằng 2 giá trị khác nhau cho người đọc hình ảnh về tương quan giữa các cột khác nhau. Hình 1. Hai biểu đồ biểu diễn cùng 1 bộ số liệu với giá trị gốc trục y khác nhau (số liệu giả định) Trong trường hợp thang chia của 2 trục x và y khác nhau quá nhỏ hoặc cĩ lớn cũng ảnh hưởng đến đường biểu diễn của số liệu như thay đổi quá đột ngột hoặc thay đổi từ từ. Trường hợp này đơi khi khĩ tránh khỏi do phụ thuộc vào số liệu, nhưng tác giả cĩ thể hạn chế bằng cách thu hẹp hoặc nới rộng khoảng chia để hạn chế tối đa sự khác biệt quá lớn hoặc quá nhỏ trong khi biểu diễn số liệu. 170 TCNCYH 117 (1) - 2019 TẠP CHÍ NGHIÊN CỨU Y HỌC Hình 2. Ba biểu đồ biểu diễn cùng một bộ số liệu với thang chia trục x, y khácnhau (số liệu giả định) Rất nhiều tác giả vì muốn cĩ một biểu đồ đẹp và sinh động thay vì dùng hình ảnh 2 chiều đã lựa chọn hình ảnh 3 chiều, tuy nhiên sẽ làm khĩ cho người đọc xác định giá trị chính xác mà cột đĩ biểu thị, người đọc cĩ thể lúng túng vì khơng biết đọc giá trị ở mặt phẳng trước hay mặt phẳng phía sau như hình dưới đây: Hình 3. Sử dụng biểu đồ gian 3 chiều để biểu diễn số liệu (Số liệu giả định) 2. Sai sĩt trong phiên giải kết quả nghiên cứu Giai đoạn cuối của một cơng trình nghiên cứu khoa học là phiên giải kết quả phân tích số liệu, từ đĩ đưa ra các kết luận của nghiên cứu. Một sai sĩt rất phổ biến là báo cáo giá trị p xác suất, các tác giả thường chỉ đưa ra các ngưỡng của giá trị p như “p 0,05” hay “p = ns” thay vì báo cáo giá trị p chính xác [20; 16]. Trong khi khoảng tin cậy cung cấp nhiều thơng tin hơn là giá trị p bởi giá trị p phụ thuộc vào cả độ lớn sự khác biệt giữa các nhĩm lẫn độ chính xác [20 - 22]. Các nghiên cứu càng lớn với độ chính xác càng cao sẽ cho giá trị p càng nhỏ mặc dù sự khác biệt cĩ thể khơng quan trọng đối với lâm sàng [17]. Các nghiên cứu nhỏ với độ chính xác nhỏ nhưng sự khác biệt giữa các nhĩm lớn cũng sẽ cho giá trị p nhỏ[20]. Do đĩ giá trị p khơng cho chúng ta biết là sự khác biệt cĩ ý nghĩa thống kê là do mức độ ảnh hưởng hay do cỡ mẫu. Tuy nhiên, với khoảng tin cậy thì ước lượng độ chính xác và độ lớn sự khác biệt TCNCYH 117 (1) - 2019 171 TẠP CHÍ NGHIÊN CỨU Y HỌC giữa các nhĩm đều được thể hiện. Mặt khác thơng qua khoảng tin cậy cĩ thể đánh giá được hiệu quả của một can thiệp trong lâm sàng, nếu tất cả các giá trị trong khoảng tin cậy đều cĩ ý nghĩa lâm sàng cho thấy nghiên cứu can thiệp này hiệu quả; nếu chỉ một số giá trị nằm trong khoảng tin cậy cĩ giá trị lâm sàng cĩ thể nghiên cứu này cĩ cỡ mẫu chưa đủ lớn; nếu tất cả các giá trị nằm trong khoảng tin cậy khơng cĩ giá trị lâm sàng thì nghiên cứu an thiệp này dường như khơng cĩ hiệu quả [17]. Một sai lầm trong phiên giải giá trị p nữa là khi kết quả phân tích của máy tính cho ra kết quả giá trị p là 0.000, cĩ tác giả hiểu lầm rằng giá trị p bằng 0, trong khi giá trị p này phải được báo cáo là p < 0,001 [14]. Nhiều nghiên cứu báo cáo cĩ sự khác biệt cĩ ý nghĩa thống kê trong kết quả nghiên cứu nhưng lại khơng đưa ra test thống kê đã sử dụng. Tác giả cần phải mơ tả loại test nào mình đã sử dụng, độ lớn sự khác biệt, giá trị đo lường ý nghĩa thống kê (giá trị p hoặc khoảng tin cậy). Khơng cần thiết phải báo cáo các kết quả so sánh sự khác biệt về các đặc điểm trước khi nhận can thiệp của nhĩm chứng và nhĩm nhận can thiệp bởi trong số 1,076 phép so sánh sự khác biệt về các đặc điểm giữa hai nhĩm được tiến hành trong 125 nghiên cứu thử nghiệm chỉ cĩ 2% cĩ ý nghĩa thống kê ở mức 0,05 [23]. Trong các nghiên cứu thử nghiệm lâm sàng, việc thực hiện các test chẩn đốn là rất phổ biến và sai sĩt thường gặp khi báo cáo kết quả các test chẩn đốn là các tác giả khơng đưa ra định nghĩa thế nào là “bình thường” và thế nào là “khơng bình thường” Một điểm cần lưu ý trong quá trình phiên giải số liệu là nếu đưa ra nhận xét rằng sự khác biệt hay mối liên quan cĩ ý nghĩa thống kê thì phải đảm bảo rằng trong quá trình phân tích tác giả cĩ áp dụng test thống kê [24]. Liên quan đến phiên giải ý nghĩa của test thống kê, một số nhà nghiên cứu thấy rằng kết quả phân tích khơng cĩ ý nghĩa thống kê, và họ báo cáo rằng “kết quả phân tích khơng cĩ ý nghĩa thống kê nhưng giá trị trung bình của x lớn hơn giá trị trung bình của y” [14]. Điều này phản ánh khơng đúng bản chất của test kiểm định ý nghĩa thống kê bởi test kiểm định giúp nhà nghiên cứu đưa ra nhận định cĩ hay khơng sự khác biệt cĩ ý nghĩa thống kê giữa các giá trị được so sánh. Bên cạnh đĩ phải hết sức thận trọng khi đưa ra kết luận nếu kết quả phân tích cho thấy sự khác biệt hay mối liên quan cĩ ý nghĩa thống kê [25]. Ví dụ trong trường hợp cỡ mẫu quá nhỏ để đảm bảo ý nghĩa thống kê mặc dù kết quả cĩ thể rất cĩ giá trị về mặt lâm sang [6]. Trong trường hợp cỡ mẫu nghiên cứu nhỏ và kết quả test kiểm định khơng cĩ ý nghĩa thống kê, phần bàn luận cần đề cập đến sai lầm loại II (chấp nhận giả thuyết Ho khi giả thuyết Ho sai). Nếu nghiên cứu khơng hiệu chỉnh để kiểm sốt các yếu tố nhiễu và các sai số cũng cần được trình bày và bàn luận khi phiên giải kết quả nghiên cứu [16]. Một sai lầm khi phiên giải kết quả đặc biệt quan trọng trong các nghiên cứu lâm sàng đĩ là tác giả cĩ thể nhầm lẫn giữa ý nghĩa thống kê và ý nghĩa lâm sàng [17]. Theo tác giả Lang trích dẫn từ tác giả Ellenbaas và Cuddy, trong thống kê, sự khác biệt nhỏ giữa các nhĩm lớn cĩ thể cĩ ý nghĩa thống kê nhưng cĩ thể lại khơng cĩ ý nghĩa về mặt lâm sàng [17]. Và theo tác giả Lang, trên thực tế sự khác biệt lớn giữa các nhĩm nhỏ cĩ thể quan trọng về mặt lâm sàng nhưng lại khơng cĩ ý nghĩa thống kê. Một ví dụ được tác giả đưa ra là trong một mẫu nhỏ bệnh nhân tham gia 172 TCNCYH 117 (1) - 2019 TẠP CHÍ NGHIÊN CỨU Y HỌC nghiên cứu trong tình trạng bệnh rất nặng ở giai đoạn cuối, nếu chỉ cĩ một bệnh nhân trong nhĩm điều trị được cứu sống thì sự sống sĩt này rất cĩ ý nghĩa về mặt lâm sàng trong khi tỷ lệ sống sĩt khơng cĩ sự khác biệt cĩ ý nghĩa thống kê so với nhĩm chứng [17] Bảng 2. Một số sai sĩt thường gặp trong quá trình phiên giải kết quả nghiên cứu STT Các sai sĩt thường gặp 1 Phiên giải sai kết quả: - “Khơng cĩ ý nghĩa thống kê” phiên giải thành “khơng ảnh hưởng” hoặc “khơng cĩ sự khác biệt” - Kết luận khơng dựa trên số liệu - Đưa ra nhận xét cĩ ý nghĩa nhưng khơng phân tích số liệu hoặc khơng đề cập đến test áp dụng 2 Phiên giải kết quả khơng tốt: - Khơng để ý đến sai lầm loại II khi báo cáo kết quả khơng cĩ ý nghĩa thống kê - Thiếu bàn luận về vấn đề của kiểm định ý nghĩa thống kê đa biến - Thiếu sĩt trong bàn luận về các nguồn sai số và các yếu tố nhiễu IV. KẾT LUẬN Trong quá trình nghiên cứu, sai sĩt về thống kê cĩ thể gặp ở bất cứ giai đoạn nào trong đĩ cĩ phần trình bày và phiên giải kết quả nghiên cứu. - Các sai sĩt trong trình bày kết quả nghiên cứu bao gồm: Mơ tả số liệu và biểu diễn số liệu khơng hợp lý, trình bày kết quả khơng tốt hoặc khơng phù hợp. - Các sai sĩt trong phiên giải kết quả nghiên cứu bao gồm: phiên giải sai kết quả, phiên giải kết quả chưa đầy đủ, thiếu nội dung V. KHUYẾN NGHỊ Bên cạnh việc áp dụng các bảng kiểm dành cho báo cáo chung của từng loại thiết kế nghiên cứu như STROBE, CONSORT, để kiểm tra các ứng dụng thống kê trong nghiên cứu các nhà nghiên cứu cần tham khảo bảng kiểm SAMPLE cho các ứng dụng thống kê của mình. Đồng thời cần cĩ sự tham khảo các nhà thống kê trong quá trình phân tích xử lý số liệu. Cần cĩ sự hỗ trợ, tư vấn của các nhà thống kê trong quá trình xử lý, phân tích số liệu và viết báo cáo nghiên cứu trước khi cơng bố hay đăng tải. TÀI LIỆU THAM KHẢO 1. Masic, I., Miokovic, M., & Muhameda- gic, B (2008). Evidence Based Medicine – New Approaches and Challenges. Acta Infor- matica Medica, 16(4), 219 - 225. doi:10.5455/ aim.2008.16.219-225 2. Andermann, A., Pang, T., Newton, J. N., Davis, A., & Panisset, U. (2016). Evi- dence for Health II: Overcoming barriers to using evidence in policy and practice. Health Research Policy and Systems, 14, doi:10.1186/ s12961-016-0086-3. TCNCYH 117 (1) - 2019 173 TẠP CHÍ NGHIÊN CỨU Y HỌC 3. Garba, S., Ahmed, A., Mai, A., Makama, G., & Odigie, V (2010). Prolifera- tions of Scientific Medical Journals: A Burden or A Blessing. Oman Medical Journal, 25(4), 311 - 314. doi:10.5001/omj.2010.89 4. Fernandes-Taylor, S., Hyun, J. K., Reeder, R. N., & Harris, A. H. (2011). Com- mon statistical and research design problems in manuscripts submitted to high-impact medi- cal journals. BMC Research Notes, 4, 304. doi:10.1186/1756-0500-4-304 5. Altman, D. G (1982). Statistics in medi- cal journals. Statistics in Medicine, 1(1), 59 - 71. 6. Young, J. (2007). Statistical errors in medical research--a chronic disease? Swiss Medical Weekly, 137(3–4), 41–43. doi:2007/03/smw-11794 7. Richard Smith (2014). Medical re- search—still a scandal.. The BMJ. Retrieved October 19, 2018, from https://blogs.bmj.com/ bmj/2014/01/31/richard-smith-medical-research -still-a-scandal/ 8. Bauchner H., Fontanarosa PB., Flanagin A., & Thornton J.. (2018). Scientific misconduct and medical journals. JAMA. doi:10.1001/jama.2018.14350 9. Fanelli, D (2009). How Many Scientists Fabricate and Falsify Research? A Systematic Review and Meta-Analysis of Survey Data. PLOS ONE, 4(5), e5738. doi:10.1371/ journal.pone.0005738 10. Ranstam, J., Buyse, M., George, S. L et al (2000). Fraud in Medical Research: An International Survey of Biostatisticians. Con- trolled Clinical Trials, 21(5), 415 - 427. doi: 10.1016/S0197-2456(00)00069-6 11. García-Berthou, E., & Alcaraz, C. (2004). Incongruence between test statistics and P values in medical papers. BMC Medical Research Methodology, 4(1), 13. doi:10. 1186/1471-2288-4-13 12. Lang, T (2004). Twenty statistical er- rors even you can find in biomedical research articles. Croatia Medical Journal, 45(4), 361 - 370. 13. Jin, Z., Yu, D., Zhang, L., Meng, H et al (2010). A Retrospective Survey of Research Design and Statistical Analyses in Selected Chinese Medical Journals in 1998 and 2008. PLoS ONE, 5(5), e10822. doi:10.1371/ journal.pone.0010822 14. Ilker Ercan., Berna Yazici., Yaning Yang et al (2007). Misusage of statistics in medical research. Eur J Gen Med, 4(3), 128 - 134. 15. Nagele P (2003). Misuse of standard error of the mean (SEM) when reporting vari- ability of a sample. A critical evaluation of four anaesthesia journals. Bristish Journal of An- aesth, 90(4), 514 - 516. 16. Strasak, A. M., Zaman, Q., Pfeiffer, K. P et al (2007). Statistical errors in medical research-a review of common pitfalls. Swiss medical weekly, 137(3/4), 44. 17. Lang, T (2004). Twenty statistical er- rors even you can find in biomedical research articles. 18. Garcia Berthou E., Alcaraz C (2004). Incongruence between test statistics and P values in medical papers. BMC medical re- search methodology, 28, 4 - 13. 19. Tom Lang (2004). Common statistical errors even you can find part 3: Errors in data display. AMWA J, 19, 9 - 11. 20. Nyirongo, V. B., Mukaka, M. M., & Kalilani-Phiri, L (2008). Statistical Pitfalls in Medical Research. Malawi Medical Journal, 20 (1), 15 - 18. 21. Mathews JNS., Altman D.G (1996). Interaction 2: Compare efect sizes not P val- ues. BMJ, 313(7060), 808. 22. Royall RM (1986). The Effects of Sam- ple Size on the Meaning of the Significance 174 TCNCYH 117 (1) - 2019 TẠP CHÍ NGHIÊN CỨU Y HỌC Tests. The American Statistician, 40(6), 313 - 315. 23. Altman D.G., & Dore C.J. (n.d.). Ran- domisation and baseline comparisions in clini- cal trials. Lancet, 335, 149 - 153. 24. Strasak, A. M., Zaman, Q., Pfeiffer, K. P., Gưbel, G., & Ulmer, H (2007). Statistical errors in medical research--a review of com- mon pitfalls. Swiss Medical Weekly, 137(3-4), 44 - 49. doi:2007/03/smw-11587. 25. Olsen, C. H (2003). Review of the Use of Statistics in Infection and Immunity. Infec- tion and Immunity, 71(12), 6689 - 6692. doi: 10.1128/IAI.71.12.6689-6692.2003 Summary STATISTICAL ERRORS IN RESULTS PRESENTATION AND RESULTS INTERPRETATION Although the efforts of researchers and editors to make recommendations and guidelines have been plentiful, many of the results of these endeavors in the field of medicine have been mislead- ing and of low quality. The purpose of this study is to describe the statistical errors common in medical research in the presentation and interpretation of research results. The results showed that the researcher often encountered some errors such as inappropriate data description and representation (inappropriate parameter selection), poor presentation, interpreted or incorrectly interpreted research results (such as p-value estimation and misconceptions). All of these errors can lead to erroneous conclusions of the study that affect the use of, reference to research results as a basis or scientific evidence. Key words: statistical errors, scientific research, result presentation, results interpretation

Các file đính kèm theo tài liệu này:

de_tai_mot_so_sai_sot_thong_ke_thuong_gap_trong_trinh_bay_ke.pdf