Cách thực hiện một chủ đề thẩm định kĩ lưỡng: bước 567-đánh giá-lập biểu đồ-kết luận và khuyến cáo

How to Perform a Critically  Appraised Topic: Evaluate, Generate, and
Recommend

Aine Marie Kelly
Paul Cronin

AJR:197, November 2011

—————————————–

Bước 5:  Đánh giá – Đánh giá độ mạnh của bằng chứng trong y văn

Khi tìm thấy các kết quả thuyết phục từ các nghiên cứu gốc hoặc tổng quan hệ thống, bước tiếp theo là đánh giá lực của bằng chứng trong y văn. Nhóm đặc nhiệm về dịch vụ phòng bệnh của Mỹ (US Preventive Services Task Force, viết tắt USPSTF) là một bộ phận của Cơ quan Chất lượng và Nghiên cứu chăm sóc sức khoẻ (Agency for Healthcare Research and Quality, viết tắt AHRQ), và Trung tâm Y học thực chứng (CEBM) ở University of Oxford (Anh) đã chia độ mạnh của các khuyến cáo dựa trên bằng chứng sẵn có cho điều trị, xét nghiệm chẩn đoán, hoặc can thiệp [34,35]. Những mức độ đó dựa trên độ mạnh của bằng chứng và độ lớn của lợi ích ròng (tức là các lợi ích trừ đi các tác hại) và xếp từ A tới D và I [34], như trình bày trong Bảng 2.

Bảng 2. USPSTF phân độ khuyến cáo từ một đến năm theo phân loại phản ánh lực của bằng chứng và độ lớn của lợi ích ròng*

Độ

Định nghĩa

Lý do phân độ

A

USPSTF khuyến cáo mạnh mẽ các nhà lâm sàng cung cấp dịc vụ đó cho các bệnh nhân thích hợp

USPSTF thấy bằng chứng tốt rằng dịch đó vụ cải thiện kết quả sức khoẻ quan trọng và kết luận rằng lợi ích lớn hơn tác hại rất nhiều

B

USPSTF khuyến cáo các nhà lâm sàng cung cấp dịc vụ đó cho các bệnh nhân thích hợp USPSTF thấy bằng chứng thấp nhất cũng ở mức khá và dịch vụ đó cải thiện kết quả sức khoẻ quan trọng, kết luận rằng lợi ích lớn hơn tác hại

C

USPFTF không khuyến cáo ủng hộ hoặc chống lại vị cung cấp thường lệ những dịch vụ đó USPSTF thấy rằng bằng chứng thấp nhất cũng ở mức khá và dịch vụ đó cải thiện kết quả sức khoẻ quan trọng, nhưng kết luận rằng sự cân bằng giữa các lợi ích và tác hại quá gần nhau để biện minh cho sự khuyến cáo chung

D

USPFTF khuyến cáo chống lại việc cung cấp thường lệ dịch vụ đó cho các bệnh nhân không có triệu chứng USPSTF thấy bằng chứng thấp nhất cũng ở mức khá và dịch vụ đó không hiệu quả hoặc nhiều tác hại hơn lợi ích

I

USPFTF kết luận là bằng chứng không đủ để khuyến cáo ủng hộ hoặc chống việc cung cấp thường lệ dịch vụ đó Bằng chứng dịch vụ đó có hiệu quả là không có, chất lượng kém, hoặc có xung đột và sự cân bằng giữa lợi ích và tác hại không thể xác định được

* Lợi ích ròng = (các) lợi ích – (các) tác hại

Đối với mức A, các nghiên cứu tốt mức 1 được định nghĩa như sau: “USPSTF thấy bằng chứng tốt rằng dịch đó vụ cải thiện kết quả sức khoẻ quan trọng và kết luận rằng lợi ích lớn hơn tác hại rất nhiều”. AHRQ USPFTF “khuyến cáo mạnh mẽ các nhà lâm sàng cung cấp những dịch vụ đó cho những bệnh nhân thích hợp có đủ điều kiện” [34].

Đối với mức B, các nghiên cứu mức 2 và 3 phù hợp hoặc ngoại suy từ các nghiên cứu mức 1, “USPSTF thấy bằng chứng thấp nhất cũng ở mức khá và dịch vụ đó cải thiện kết quả sức khoẻ quan trọng, kết luận rằng lợi ích lớn hơn tác hại” [34,35]. AHRQ USPFTF “khuyến cáo các nhà lâm sàng cung cấp những dịch vụ đó cho những bệnh nhân thích hợp có đủ điều kiện” [34].

Đối với mức C, các nghiên cứu mức 4 hoặc ngoại suy từ các nghiên cứu mức 2 hoặc 3, “USPSTF thấy rằng bằng chứng thấp nhất cũng ở mức khá và dịch vụ đó cải thiện kết quả sức khoẻ quan trọng, nhưng kết luận rằng sự cân bằng giữa các lợi ích và tác hại quá gần nhau để biện minh cho sự khuyến cáo chung” [33,34]. AHRQ USPFTF “không khuyến cáo ủng hộ hoặc chống lại vị cung cấp thường lệ những dịch vụ đó” [33,34].

AHRQ USPFTF và Trung tâm y học thực chứng Oxford còn có hai khuyến cáo nữa (mức D và I) [34]. Đối với mức D, hay các nghiên cứu mức 5, “USPSTF thấy bằng chứng thấp nhất cũng ở mức khá và dịch vụ đó không hiệu quả hoặc nhiều tác hại hơn lợi ích” [34]. AHRQ USPFTF “khuyến cáo chống lại việc cung cấp thường lệ dịch vụ đó cho các bệnh nhân không triệu chứng” [34]. Đối với mức I, “Bằng chứng dịch vụ đó có hiệu quả là không có, chất lượng kém, hoặc có xung đột và sự cân bằng giữa lợi ích và tác hại không thể xác định được” [34]. AHRQ USPFTF “kết luận là bằng chứng không đủ để khuyến cáo ủng hộ hoặc chống việc cung cấp thường lệ dịch vụ đó” [34].

Chất lượng của bằng chứng cũng được AHRQ USPFTF đánh giá là tốt, khá, hoặc kém [34]. Bằng chứng tốt bao gồm các kết quả phù hợp từ các nghiên cứu được thiết kế tốt, tiến hành tốt ở các quần thể đại diện đánh giá trực tiếp các tác động đối với tình trạng sức khoẻ quan tâm [34]. Bằng chứng khá do bị hạn chế bởi số lượng, chất lượng, hoặc tính nhất quán của từng nghiên cứu; tính khái quát hoá đối với thực hành thường lệ; hoặc tính chất gián tiếp của bằng chứng với các tình trạng sức khoẻ quan tâm; tuy nhiên, độ mạnh của bằng chứng đủ để xác định các tác động tới những tình trạng sức khoẻ quan tâm [34]. Bằng chứng kém thì không đủ để đánh giá các tác động tới những tình trạng sức khoẻ quan tâm bởi vì số lượng hoặc lực của nghiên cứu bị hạn chế, có các sai lầm nghiêm trọng trong thiết kế hoặc tiến hành nghiên cứu, các khoảng trống trong chuỗi bằng chứng, hoặc thiếu thông tin về các kết quả sức khoẻ quan trọng cần quan tâm.

Hội X quang Mỹ (American College of Radiology, ACR) và Trường đại học X quang hoàng gia (Royal College of Radiologists, RCR) ở Anh đã phát triển các hướng dẫn và khuyến cáo sử dụng chẩn đoán hình ảnh cho tất cả các chuyên khoa [36, 37]. ACR Appropriateness Criteria (tiêu chẩn phù hợp của ACR) là các hướng dẫn dựa trên bằng chứng cho việc sử dụng các phương thức chẩn đoán hình ảnh khác nhau do Uỷ ban về các Tiêu chuẩn Phù hợp của ACR xây dựng lên [38]. Những hướng dẫn này được phát triển theo đúng các hướng dẫn thực hành y tế và được AHRQ sử dụng (AHRQ là một bộ phận của Bộ y tế và Dịch vụ nhân sinh- the Department of Health & Human Services (HHS)), và các hướng dẫn đó được đăng trên trang web của AHRQ cũng như trên trang web của ACR [38-40]. Nhiều cuộc hội thảo đồng thuận riêng biệt của các chuyên khoa X quang khác nhau đã chọn các điều kiện lâm sàng dựa trên cơ sở tính phổ biến, tính biến đổi hiện thời trong thực hành, chi phí tương đối, tỉ lệ bệnh và tử vong hiện thời, và tiềm năng để cải thiện chăm sóc sức khoẻ. Các chuyên gia của hội thảo được chọn là những người có tri thức chuyên môn cao về các phương thức chẩn đoán hình ảnh và X quang lâm sàng. Uỷ ban cũng bao gồm những thành viên từ các chuyên khoa y khác. Các chuyên gia tìm kiếm trong MEDLINE sử dụng các từ khoá thống nhất để gộp cả các điều kiện lâm sàng và các phương thức chẩn đoán hình ảnh. Tìm kiếm thường giới hạn ở năm trước khi cập nhật chủ đề lần cuối cùng hoặc trong vòng 5 năm qua nếu là một chủ đề mới. Các bài báo rút ra được sắp xếp vào các bảng bằng chứng và được đánh giá độ mạnh (lực) của bằng chứng theo các tiêu chuẩn khác nhau [41,42]. Uỷ ban các chuyên gia này đánh giá mức độ thích hợp của mỗi thử nghiệm chẩn đoán hay xét nghiệm cho từng tình huống lâm sàng theo thang điểm từ 1 đến 9, với 1 là kém thích hợp nhất và 9 là thích hợp nhất.

Tương tự, RCR xây dựng các hướng dẫn bác sỹ đa khoa có tên là “Publications and Guidance: Making the Best Use of Clinical Radiology Services” (tạm dịch là ấn phẩm và hướng dẫn: lập chỉ định tốt nhất cho các dịch vụ X quang lâm sàng) [43]. Các nhóm chuyên gia từ 6 – 16 thành viên tập trung bằng chứng từ MEDLINE, EMBASE, Cochrane Library, National Institute for Health and Clinical Excellence (NICE), Scottish Intercollegiate Guidelines Network (SIGN), và ACR Appropriateness Criteria, tăng cường bằng tìm trên Google Scholar và tìm kiếm tay/thủ công điện tử (electronic hand search) ở 7 tạp chí. Các khuyến cáo được tổng hợp và nhất trí theo qui trình Delphi [44,45]. Ngoài ra, vài trăm Bác sỹ X quang và các chuyên gia ở Anh và nước ngoài đóng góp tự do cho qui trình này. Việc tư vấn diễn ra với nhiều hiệp hội chuyên gia, các tổ chức chuyên nghiệp, Royal Colleges, và các cơ quan chuyên môn khác ở châu Âu. Sắp xếp các mức bằng chứng cho các nghiên cứu chẩn đoán được phỏng theo tài liệu gốc [46]. Các khuyến cáo được phân cấp theo mức bằng chứng sử dụng hệ thống của AHRQ [34].

Mức A bao gồm các nghiên cứu chẩn đoán chất lượng cao trong đó một xét nghiệm (thử nghiệm) mới được so sánh mù và độc lập với chuẩn tham chiếu ở trong một phổi bệnh nhân phù hợp, tổng quan hệ thống (systematic review) và phân tích tổng hợp của chính các nghiên cứu chất lượng cao (như trên), các hướng dẫn chẩn đoán lâm sàng và các quytắc quyết định lâm sàng được xác nhận trong một tập hợp thử nghiệm [43].

Mức B bao gồm các nghiên cứu có so sánh mù và độc lập một thử nghiệm (xét nghiệm) mới với chuẩn tham chiếu trong một tập hợp các bệnh nhân tuyển chọn không liên tiếp hoặc giới hạn với một phổ hẹp các bệnh nhân, các nghiên cứu trong đó tiêu chuẩn tham chiếu không đặc áp dụng với tất cả bệnh nhân, các tổng quan hệ thống của chính các nghiên cứu như vậy, các hướng dẫn thực hành chẩn đoán lâm sàng và các quy tắc quyết định lâm sàng không được xác nhận trong một tập hợp thử nghiệm [43].

Mức C bao gồm các nghiên cứu có tiêu chuẩn tham chiếu không khác quan, các nghiên cứu có so sánh giửa thử nghiệm (xét nghiệm) mới và tiêu chuẩn tham chiếu không được làm mù cũng không độc lập, các nghiên cứu có kết quả thử nghiệm âm tính hoặc dương tính được xác định bằng các tiêu chuẩn tham chiếu khác nhau, các nghiên cứu thực hiện ở một tập hợp bệnh nhân không thích hợp, cuối cùng là các ý kiến của chuyên gia [43]. Cả ACR Appropriateness Criteria (tiêu chuẩn phù hợp) và các tài liệu của RCR kết hợp những thế mạnh của các khuyến cáo và các mức của bằng chứng [38,43].

Bước 6: Tạo lập – Tạo các biểu đồ xác suất có điều kiện

Bước tiếp theo trong quá trình thẩm định kỹ lưỡng là tạo ra các đồ thị xác suất lâm sàng (Hình 1 và 2). Đồ thị xác suất lâm sàng là đồ thị của xác suất tiên nghiệm (pretest) so với xác xuất hậu nghiệm (posttest) (có mức từ 0 đến 1 hoặc 100%) đối với LR (tỉ số khả dĩ) dương tĩnh và âm tính. Đồ thị xác xuất lâm sàng mô tả trực quan sự hữu dụng của xét nghiệm chẩn đoán; các chương trình này sẵn có trên trang web để tải xuống tự do [47,48]. Thông tin thiết cần để lập đồ thị xác suất lâm sàng từ Web Microsoft Excel bao gồm tỉ lệ bệnh lưu hành (xác suất tiên nghiệm), độ nhạy, và độ đặc hiệu [48]. Thông tin này có thể dùng để tính các LR (tỉ số khả dĩ) và lập đồ thị xác suất lâm sàng. Đồ thị xác suất có hai đường cong tương ứng với tác động của các LR âm tính và dương tính của xét nghiệm chẩn đoán đối với xác xuất tiên nghiệm [48].

Hình 1.- Đồ thị xác xuất có điều kiện của xét nghiện chẩn đoán A (giả thuyết). Đối với xác suất bệnh nhân tiên nghiệm là 0.5, xác xuất hậu nghiệm sau xét nghiệm chẩn đoán A dương tính là 0.9 hay 90%. Đối với xác suất bệnh nhân tiên nghiệm là 0.5, xác suất hậu nghiệm sau xét nghiệm A âm tính là 0.35 hay 35%. Do đó xét nghiệm chẩn đoán A cho thông tin hữu ích khi kết quả dương tính, nhưng không hữu ích khi kết quả âm tính. Xét nghiệm chẩn đoán A có độ đặc hiệu cao nhưng độ nhạy thấp. Xét nghiệm chẩn đoán A có ích để qui bệnh khi kết quả dương tính. Khi kết quả xét nghiệm chẩn đoán A âm tính, bệnh không bị loại trừ.

Hình 2.- Đồ thị xác xuất có điều kiện của xét nghiện chẩn đoán B (giả thuyết). Đối với xác suất bệnh nhân tiên nghiệm là 0.5, xác xuất hậu nghiệm sau xét nghiệm chẩn đoán B dương tính là 0.65 hay 65%. Đối với xác suất bệnh nhân tiên nghiệm là 0.5, xác suất hậu nghiệm sau xét nghiệm B âm tính là 0.1 hay 10%. Do đó xét nghiệm chẩn đoán B cho thông tin hữu ích khi kết quả âm tính, nhưng không hữu ích khi kết quả dương tính. Xét nghiệm chẩn đoán B có độ nhạy cao nhưng độ đặc hiệu thấp. Xét nghiệm chẩn đoán B có ích để loại trừ bệnh khi kết quả âm tính. Khi kết quả xét nghiệm chẩn đoán B dương tính, không qui được bệnh cho người có kết quả dương tính.

 

Bước 7: Khuyến cáo – Rút ra các Kết luận và viết Khuyến cáo

Bước cuối cùng của quá trình thẩm định kỹ lưỡng là rút ra các kết luận và viết các khuyến cáo. Người ta quyết định bằng chứng là mạnh hoặc yếu, liệu thiết kế và chất lượng của nghiên cứu là tốt, liệu các phát hiện của nghiên cứu có thích hợp không. Nếu bằng chứng mà mạnh, người ta phải xác định mức độ bệnh nhân nghiên cứu, các can thiệp hoặc các kết quả nghiên cứu chuyển sang thực hành hoặc bệnh nhân cụ thể của họ [49].

Bằng chứng có thể mạnh nhưng các nghiên cứu có thể đã lạc hậu, vì vậy có thể lập khuyến cáo để áp dụng bằng chứng đó nhưng nên chờ nghiên cứu trong lĩnh vực này. Nếu bằng chứng yếu, mâu thuẫn, hoặc không tồn tại, người ta có thể phải chờ tích luỹ cho đủ bằng chứng. Có những hướng dẫn công bố kết hợp nhiều yếu tố này vào một phân bố chung của một bậc bằng chứng và giúp chuyển bằng chứng về các xét nghiệm chẩn đoán thành các khuyến cáo [42,49].

Kết luận

Chủ đề thẩm định kỹ lưỡng là công cụ dựa trên bằng chứng bệnh nhân cụ thể để học tập và áp dụng các kỹ năng đánh giá phê bình. Một chủ đề thẩm định kỹ lưỡng có vài thành phần, bắt đầu từ những vấn đề lâm sàng khi gặp bệnh nhân. Những vấn đề này dẫn đến tìm kiếm các tài liệu nghiên cứu để trả lời vấn đề, và các nghiên cứu từ y văn có thể xếp bậc theo mức độ của thang bằng chứng để các bài nghiên cứu hợp lệ và thích hợp nhất được chọn và được thẩm định. Trong các bước từ 4 – 7 đã được bàn luận trong bài này thì các kết quả nghiên cứu chính được tóm tắt và chuyển thành các số đo lâm sàng hữu ích về độ chính xác, hiệu quả, hoặc nguy cơ. Một chủ đề thẩm định kỹ lưỡng có thể được thực hiện trong một khoảng thời gian tương đối ngắn, do đó các nhà X quang bận rộn có thể làm để trả lời một câu hỏi lâm sàng cấp bách hoặc lặp đi lặp lại.

 

Tham khảo

  34. Agency for Healthcare Research and Quality (AHRQ). U.S. Preventive Services Taskforce (USPFTF) recommendations based on strength of evidence. http://www.ahrq.gov/clinic/3rduspstf/ratings.htm. Accessed July 10, 2009

  35. Centre for Evidence Based Medicine: CEBM Website. Levels of evidence. http://www.cebm.net/index.aspx?o=1025. Published March 2009. Accessed March 2, 2010

  36. American College of Radiology Website. http://www.acr.org. Accessed December 17, 2010

 37. The Royal College of Radiologists Website. http://www.rcr.ac.uk/. Accessed December 17, 2010

  38. American College of Radiology Website. ACR Appropriateness Criteria, 2008 version. http://www.acr. org/SecondaryMainMenuCategories/quality_safety/app_criteria.aspx. Accessed December 17, 2010

 39. Agency for Healthcare Research and Quality. Clinical practice guidelines online. http://www.ahrq.gov/clinic/cpgonline.htm. Accessed December 17, 2010

  40. National Guideline Clearinghouse (NGC) Website. http://www.guideline.gov/. Accessed December 17, 2010

 41. American College of Radiology Website. ACR Appropriateness Criteria: evidence table development. http://www.acr.org/SecondaryMainMenuCategories/quality_safety/app_criteria/Evidencetabledevelopment.aspx. Accessed December 24, 2009

  42. Schunemann HJ, Oxman AD, Brozek J, et al. Grading quality of evidence and strength of recommendations for diagnostic tests and strategies. BMJ 2008; 336:1106–1110

  43. The Royal College of Radiologists Website. Publications and guidance: making the best use of clinical radiology services, 6th ed. Published 2007. Accessed December 17, 2008

  44. Amis ES Jr. American College of Radiology standards, accreditation programs, and appropriateness criteria. AJR 2000; 174:307–310

  45. Remedios D, McCoubrie P; The Royal College of Radiologists Guidelines Working Party. Making the best use of clinical radiology services: a new approach to referral guidelines. The Royal College of Radiologists Guidelines Working Party. Clin Radiol 2007; 62:919–920

  46. The Journal of Bone and Joint Surgery Website. Instructions for authors: levels of evidence for primary research question. www2.ejbjs.org/misc/instrux.dtl#levels. Accessed December 24, 2009

 47. MacEneaney PM, Malone DE. The meaning of diagnostic test results: a spreadsheet for swift data analysis. Clin Radiol 2000; 55:227–235

  48. The meaning of diagnostic test results: a spread-sheet for swift data analysis—Excel module to generate graphs of conditional probability. radiography.com/pub/Rad-data99.xls. Accessed July 13, 2009

 49. Atkins D, Best D, Briss PA, et al. Grading quality of evidence and strength of recommendations. BMJ 2004; 328:1490

Để lại bình luận

Gửi phản hồi

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s

%d bloggers like this: