Cách thực hiện một chủ đề thẩm định kĩ lưỡng: bước 4 – thẩm định tài liệu cấp hai

How to Perform a Critically Appraised Topic

AJR November 2011 vol. 197 no. 5 1048-1055

————————————————-

 

Bước 4: Thẩm định – Thẩm định tài liệu cấp hai

Để thẩm định tài liệu cấp hai (secondary literature) như là phân tích hệ thống (meta-analysis) hoặc tổng quan hệ thống (systematic review), chúng ta nên đặt 3 câu hỏi: Những kết quả đó có hợp lý không? Những kết quả đó là gì? Những kết quả đó có giúp ta trong chăm sóc/chẩn đoán bệnh nhân không? (Are the results valid? What are the results? Will these results help me in caring for my patient?). Để tìm được những kết quả hợp lý chúng ta cần đánh giá một vài tiêu chuẩn cụ thể [21].

Bài tổng quan phải giải quyết câu hỏi lâm sàng cụ thể [21]. Câu hỏi nghiên cứu cần rõ ràng và có những thành phần sau: bệnh nhân hoặc vấn đề (P), can thiệp hoặc phương tiện chẩn đoán (I), so sánh can thiệp hoặc phương tiện chẩn đoán (C), các kết quả (O). Nếu câu hỏi (của nghiên cứu) không rõ ràng thì nghiên cứu đó thường là yếu và chúng ta nên thận trọng khi áp dụng nghiên cứu đó.

Các tiêu chuẩn lựa chọn và loại trừ thích hợp được dùng để chọn lọc những bài báo nghiên cứu phân tích hệ thống (meta-analysis) hoặc tổng quan hệ thống. Những tiêu chuẩn này phải xác định rõ bệnh nhân, phơi nhiễm, và các kết quả quan tâm [21]. Về phần những nghiên cứu nguyên thuỷ, những tiêu chuẩn phương pháp dùng để chọn lọc các nghiên cứu cũng cần được tuyên bố.

Để đảm bảo rằng những nghiên cứu liên quan quan trọng được chọn lọc, các tác giả thực hiện thẩm định nên tìm kiếm toàn bộ những tiêu chuẩn đáp ứng các tiêu chuẩn lựa chọn [21]. Nên tìm kiếm tất cả các các cơ sở dữ liệu điện tử và thư mục liên quan, gồm có PubMed [22], MEDLINE [23], ISI Web of Science [24], và MD Consult [25]. Nên sử dụng các thuật ngữ tìm kiếm thích hợp, và mô tả việc tìm kiếm một cách chi tiết, đầy đủ cho phép người khác làm lại được. Ngoài ra, nên kiểm tra trích dẫn bổ sung và tiếp xúc cá nhân với các chuyên gia trong lĩnh vực để tìm thêm những nghiên cứu vẫn còn trên báo chí, chưa được lập thư mục hoặc tham khảo. Tương tự, cũng nên lấy những nghiên cứu không được công bố để làm giảm sai lệch xuất bản – publication bias (tức là những nghiên cứu không có hiệu quả tích cực nên không được công bố). Các bài tổng quan hệ thống dựa trên số lượng ít các nghiên cứu có hiệu quả tích cực yếu thì dễ bị sai lệch xuất bản [21]. Sơ đồ chi tiết việc tìm tài liệu, con số tổng lượng trích dẫn được rút ra, các tóm tắt được xét duyệt, điểm lại các bài nghiên cứu chi tiết hơn, và những lý do loại trừ các bài báo cũng được nêu lên.

Nên đánh giá rõ tính hợp lý của các nghiên cứu cấp một được chọn lọc [21]. Bình duyệt (peer review) không bảo đảm tính hợp lý. Các khác biệt về phương pháp nghiên cứu có thể giải thích các khác biệt của kết quả. Các nghiên cứu ít chặt chẽ có xu hướng đánh giá quá cao các hiệu quả của can thiệp. Ngay cả khi những kết quả là phù hợp thì biết tính hợp lý của những nghiên cứu đó cũng quan trọng. Hiện có sẵn nhiều công cụ đánh giá chất lượng nghiên cứu, các nhà phê bình tóm tắt (abstract reviewers) nên dùng một hệ thống đánh giá hợp lệ như Delphi List [26], QUADAS (Quality Assessment Diagnostic Accuracy Studies) [27], QUORUM (Quality of Reporting of Meta-Analysis) [28], hoặc PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) [29] thay thế cho QUOROM.

Các tác giả của bài phân tích hệ thống hoặc tổng quan hệ thống phải quyết định những nghiên cứu nào được lựa chọn và chúng hợp lý như thế nào, và trích số liệu nào. Mỗi bước này đòi hỏi các nhà phê bình (reviewer) đánh giá bởi chúng dễ bị sai sót ngẫu nhiên và sai lệch (bias = sai sót hệ thống [21]. Có hai hoặc nhiều hơn các nhà phê bình sẽ chống lại những sai lệch này, và nếu họ đồng thuận thì chúng ta có thể tin cậy hơn vào các kết quả. Điều quan trọng đối với những thẩm định này là có thể lặp lại.

Trong thẩm định tài liệu cấp hai, xác định các nghiên cứu có tương tự nhau không rất quan trọng. Cho dù các tiêu chuẩn lựa chọn và loại trừ chặt chẽ, nhưng phần lớn các tổng quan hệ thống (systematic reviews) bộc lộ những khác biệt quan trọng về bệnh nhân, phơi nhiễm, các phương pháp nghiên cứu, và các kết cục [21]. Trong các phân tích hệ thống (meta-analyses), các nhà điều tra có thể đánh giá mức độ những khác biệt trong các nghiên cứu (đo hiệu quả giống nhau) là lớn hơn sự khác biệt do tình cờ. Những đánh giá được thực hiện bằng cách sử dụng các kiểm định tính hỗn tạp, như I2 và meta-regression (tạm dịch: hồi qui tổng hợp) [30,31]. I2 có giá trị giữa 0% và 100%. Giá trị I2 bằng 0 cho biết không có sự hỗn tạp, giá trị lớn hơn 50% cho biết sự hỗn tạp đáng kể [31]. Thuận lợi của I2 so với meta-regression là I2 không phụ thuộc vào số lượng nghiên cứu trong phân tích tổng hợp.

Sau khi thấy các phương pháp là hợp lý, việc tiếp theo là diễn giải kết quả [21]. Bước này liên quan đến đánh giá các kết quả chung như làm với nghiên cứu gốc (tỉ lệ bệnh lưu hành, độ nhạy và độ đặc hiệu, các tỉ số khả dĩ (LR), và các độ tin cậy (CI)) [14]. Không phải tất cả các nghiên cứu là bằng nhau, vì vậy chúng không nhận được những trọng số bằng nhau trong phân tích định lượng tổng quan. Nói chung, những nghiên cứu lớn có trọng số lớn hơn những nghiên cứu nhỏ. Đôi khi các nghiên cứu được cho trọng số lớn hơn nếu chúng có chất lượng cao hơn, còn các nghiên cứu có chất lượng kém thì hoặc bị loại lúc bắt đầu hoặc bị bỏ ra khi phân tích độ nhạy để xem liệu chúng có ảnh hưởng đến kết quả chung không. Khi gộp số liệu, nhiều tác giả sử dụng đường cong ROC tổng hợp (summary receiver operating characteristic curves) hoặc mô hình ảnh hưởng ngẫu nhiên hai biến (bivariate random effects model) bởi vì những phương pháp này tin cậy hơn phương pháp bình phương bé nhất (least-squares) hoặc hồi qui tuyến tính (linear regression) [32,33]. Xem các khoảng tin cậy (CI) để đánh giá mức độ chính xác của các kết quả cũng rất quan trọng.

Nếu kết quả của nghiên cứu đã biết và hợp lý, bước tiếp theo là xác định chúng có ích trong chăm sóc bệnh nhân không [14]. Quần thể bệnh nhân nghiên cứu không nên khác với quần thể bệnh nhân của bạn về tỉ lệ bệnh lưu hành hoặc giai đoạn bệnh. Một số nghiên cứu sẽ xem xét toàn bộ các loại bệnh nhân và sẽ thực hiện các phân tích phân nhóm đối với từng nhóm cụ thể. Điều quan trọng phải đảm bảo là các người điều tra quyết định phân tích phân nhóm trước khi nghiên cứu bắt đầu. Phân tích nhóm nhỏ đáng tin cậy hơn nếu mức độ khác biệt hiệu quả lớn và ý nghĩa thống kê cao [21]. Một nghiên cứu lớn có nhiều khả năng hơn cho thấy khác biệt hiệu quả có ý nghĩa thống kê hơn một nghiên cứu nhỏ. Một sự khác biệt có ý nghĩa thống kê không phải luôn luôn có ý nghĩa lâm sàng (thi dụ, chênh lệch 3mmHg trong các lần đo huyết áp giữa hai nhóm bệnh nhân là không có ý nghĩa lâm sàng). Cần thiết đánh giá không chỉ tất cả các kết cụ quan trọng về lâm sàng, như các lợi ích của điều trị hoặc xét nghiệm, mà còn đánh gả cả các hiệu quả phụ. Cuối cùng, các lợi ích kỳ vọng phải được cân nhắc cẩn thận với các tác hại tiềm tàng.

Tham khảo

14. Jaeschke R, Guyatt GH, Sackett DL. Users’ guides to the medical literature. III. How to use an article about a diagnostic test. B. What are the results and will they help me in caring for my patients? The Evidence-Based Medicine Working Group. JAMA 1994; 271:703707

21. Oxman AD, Cook DJ, Guyatt GH. Users’ guides to the medical literature. VI. How to use an overview. Evidence-Based Medicine Working Group. JAMA 1994; 272:13671371

22. U.S. National Library of Medicine, National Institutes of Health. PubMed. www.ncbi.nlm.nih.gov/pubmed/. Accessed June 29, 2009

23. Wolters Kluwer OvidSP. MEDLINE. gateway.ovid.com/. Accessed June 29, 2009

24. ISI Web of Knowledge. <apps.isiknowledge.com/UA_GeneralSearch_input.do?product=UA&search_mode=GeneralSearch&SID=4BKm4mOcfDnofbKjHBI&preferencesSaved=. Accessed June 30, 2009

25.MD Consult. www.mdconsult.com/php/120885574-2/homepage. Accessed June 30, 2009

26. Verhagen AP, de Vet HC, de Bie RA, et al. The Delphi list: a criteria list for quality assessment of randomized clinical trials for conducting systematic reviews developed by Delphi consensus. J Clin Epidemiol 1998; 51:12351241

27. Honest H, Khan KS. Reporting of measures of accuracy in systematic reviews of diagnostic literature. BMC Health Serv Res 2002; 2:4

28. Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF. Improving the quality of reports of meta-analyses of randomised controlled trials: the QUOROM Statement. Quality of Reporting of Meta-Analyses. Lancet 1999; 354:18961900

29. Liberati A, Altman DG, Tetzlaff J, et al. The PRISMA statement for reporting systematic reviews and meta-analyses of studies that evaluate health care interventions: explanation and elaboration. PLoS Med 2009; 6:e1000100

30. Higgins JP, Thompson SG. Quantifying heterogeneity in a meta-analysis. Stat Med 2002; 21: 15391558

31. Dwamena BA. Evidence-based radiology: step 3—diagnostic systematic review and meta-analysis (critical appraisal). Semin Roentgenol 2009; 44:170179

32. Moses LE, Shapiro D, Littenberg B. Combining independent studies of a diagnostic test into a summary ROC curve: data-analytic approaches and some additional considerations. Stat Med 1993; 12:12931316

33. Van Houwelingen HC, Zwinderman KH, Stijnen T. A bivariate approach to meta-analysis. Stat Med 1993; 12:22732284

Để lại bình luận

Gửi phản hồi

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s

%d bloggers like this: