REVISÃO
GRADE:
um sistema para graduar qualidade de evidência e força da recomendação e as
implicações para a prática fisioterapêutica
GRADE: a system to graduate quality of evidence and strength of
recommendation and the implications to the physical therapy practice
Andrea Lemos, Ft., D.Sc.
Docente
do Departamento de Fisioterapia da Universidade Federal de Pernambuco (UFPE)
Recebido em 15 de
maio de 2017; aceito em 8 de outubro de 2017.
Endereço
de correspondência:
Andrea Lemos, Departamento de Fisioterapia, Av. Professor Morais Rego, 1235,
Cidade Universitária, 50670-901 Recife PE, E-mail: andrealemos4@gmail.com
Resumo
Introdução: O sistema de
graduação de qualidade de evidência e força de recomendação, denominado Grading of Recommendations, Assessment,
Development and Evaluation (GRADE), tem sido adotado por organizações para
o desenvolvimento de diretrizes e por revisores sistemáticos para análise da
qualidade da evidência. Esse artigo tem como objetivo descrever os princípios e
a abordagem do sistema GRADE. Métodos:
Revisão de literatura utilizando as bases de dados Medline, CINAHL e Web of
Science. Resultados: O sistema
classifica a qualidade da evidência em alta, moderada, baixa e muito baixa, de
acordo com fatores que consideram: a metodologia dos estudos, a consistência e
a precisão dos resultados, o direcionamento da evidência e o viés de
publicação. A força da recomendação é graduada em forte ou fraca e baseia-se
não apenas na qualidade da evidência, mas no equilíbrio entre benefício e
malefício da intervenção, valores e preferências do paciente e utilização dos
recursos e custos. Os achados apresentados por esse sistema refletem a extensão
da confiabilidade de que as estimativas dos efeitos encontradas estão corretas.
Conclusão: O entendimento do sistema
GRADE facilita a interpretação crítica de revisões sistemáticas e diretrizes
que o utilizam e espera-se que haja um aumento da sua incorporação na produção
desses estudos na área da fisioterapia.
Palavras-chave: prática clínica
baseada em evidências, revisão, guia de prática clínica.
Abstract
Introduction: The grading system of quality of evidence and strength of recommendation,
called Grading of Recommendations, Assessment, Development and Evaluation
(GRADE) has been adopted by organizations to develop guidelines and by
systematic reviewers to analyze the quality of evidence. Methods: Literature review using Medline, CINAHL e Web of Science
databases. This paper aimed to describe the principles and objectives of the
GRADE system. Results: The system
classifies quality of evidence as high, moderate, low and very low, according
to factors that consider: the study’s methodology, consistency and precision of
the results, directness of the evidence and publication bias. The strength of
recommendation is graduated in strong or weak and it is based not only on the
quality of evidence, but on the balance between benefit and harm of the
intervention, values and preferences of the patients and resources and costs
use. The findings presented by this system reflect the extent of the confidence
that the effect estimates are correct. Conclusion:
Understanding the GRADE system facilitates the critical interpretation of
systematic reviews and guidelines that use it and it is expected that its
incorporation in the production of these studies in the area of physical
therapy increases.
Key-words:
evidence-based practice, review, practice guideline.
O sistema GRADE (Grades of Recommendation, Assessment,
Development and Evaluation) surgiu em 2000, através de uma colaboração de
pesquisadores, epidemiologistas e estatísticos que tinham como objetivo
uniformizar os sistemas de graduação dos níveis de evidência e recomendações
existentes. Esse sistema apresenta como proposta graduar a qualidade de
evidência em revisões sistemáticas e diretrizes e graduar a força das
recomendações nas diretrizes [1].
O primeiro artigo
publicado pelo grupo, intitulado: Grading
quality of evidence and strength of recommendations, surge em 2004, no British Medical Journal (BMJ). Nesta
publicação é apresentada a proposta inicial do GRADE
quanto às definições de qualidade de evidência, força da recomendação e o
diferencial em relação aos outros sistemas de avaliação de níveis de evidência
vigentes [2]. Em 2006 o British Medical
Journal (BMJ) dispõe como requisito, nas instruções aos autores, o uso do
sistema GRADE para graduar a evidência dos Guidelines
submetidos à revista [3]. Dois anos mais tarde, em 2008, o grupo lança uma
série de seis artigos apresentando a proposta do GRADE
[4-9] e entre 2011 e 2013 é publicada outra série de 15 artigos, pelo Journal of Clinical Epidemiology,
esmiuçando toda a abordagem proposta pelo sistema em detalhes [10,11].
Atualmente o sistema
GRADE vem sendo utilizado por mais de 60 organizações e Sociedades
internacionais, entre elas: a Organização Mundial de Saúde, colaboração
Cochrane, Sociedade Torácica Americana, Sociedade Endócrina Americana,
Sociedade Respiratória Européia, Colégio Americano de Médicos Torácicos,
Sociedade de doença infecciosa da América e Agency
for Health Care Research and Quality (AHRQ) dos Estados Unidos. Importantes
Institutos de Diretrizes internacionais também incorporaram esse sistema como,
por exemplo, o National Institutes of
Health and Clinical Excellence (NICE) e o Scottish Intercollegiate Guideline Network (SIGN)
e ele vem sendo
instituído, de maneira crescente, em diversas revisões
sistemáticas
recentemente publicadas [12-15]. Mais de 200 membros compõe o
quadro atual e
estão envolvidos no constante aprimoramento dessa abordagem
[10]. Além das
publicações existentes, é possível
também adquirir informações através de um
site organizado pelo grupo de trabalho, além de um Handbook disponível na internet [12,14].
No cenário da
Fisioterapia, algumas iniciativas foram dadas, tanto para introduzir os
conceitos desta abordagem como para encorajar o seu uso no desenvolvimento de
diretrizes e revisões sistemáticas, em revistas importantes na área como a Physical Therapy e o Journal of Physiotherapy [15,16]. Diante
deste contexto, o presente artigo tem como objetivo descrever os princípios do
sistema GRADE e sua abordagem para graduar a qualidade de evidência e formular
as recomendações para a prática clínica, com o intuito de atualizar os
fisioterapeutas na leitura crítica da produção científica usuária do GRADE.
Foi realizada uma
revisão da literatura nas bases de dados Medline
(via PUBMED), CINHAL (via EBSCO) e Web of
Science, no período entre 2000 (ano em que o sistema foi criado) e 2016.
Além da consulta no site oficial do sistema GRADE
(http://www.gradeworkinggroup.org/) [12] e no seu Handbook [14]. Procurou-se por artigos metodológicos relacionados
ao desenvolvimento e operacionalização do sistema GRADE e não houve restrição
linguística.
Definições
O
GRADE
corresponde a um sistema de graduação para qualidade de evidência em revisões
sistemáticas e diretrizes e recomendações nas diretrizes. Esse sistema oferece
um processo estruturado e transparente na apresentação sumária da evidência
[17].
O sistema GRADE
apresenta duas definições para “qualidade de evidência”. Uma para a revisão
sistemática e outra para o contexto das diretrizes. Para revisão sistemática,
“qualidade de evidência” reflete a extensão da nossa confiabilidade de que as
estimativas do efeito estão corretas. Para as diretrizes reflete a extensão da
nossa confiabilidade que as estimativas do efeito estão adequadas para suportar
uma decisão particular ou recomendação [17]. Esse sistema defende a confiança
na estimativa do efeito. Portanto, a utilidade da estimativa da magnitude da
intervenção ou efeito depende na confiabilidade desta estimativa [4].
O
GRADE
apresenta uma mudança no raciocínio, uma vez que separa qualidade de evidência
e graus de recomendação, ou seja, alto nível de evidência não necessariamente
implica forte recomendação e uma forte recomendação pode surgir de um nível de
evidência baixo [4]. Desta forma, estudos observacionais rigorosos podem
proporcionar uma evidência mais forte do que uma série de casos não controlada.
Desde que o GRADE foi
proposto, o grupo de trabalho vem demonstrando as
vantagens em relação aos outros sistemas como a separação clara entre a
qualidade de evidência e a força da recomendação; a transparência nos critérios
de graduação na qualidade da evidência; a ênfase na escolha dos desfechos; o
reconhecimento dos valores e preferências do paciente nas recomendações; a
apresentação dos resultados da evidência através de tabelas e a facilidade na
interpretação dos termos utilizados na recomendação [2,10].
Classificação
da qualidade da evidência
O
GRADE
classifica a qualidade da evidência em quatro níveis: alto, moderado, baixo e
muito baixo (Figura 1 ). A evidência baseada em ensaios clínicos randomizados e
controlados inicia como alta qualidade, podendo diminuir, enquanto que os
estudos observacionais iniciam com uma classificação baixa, podendo aumentar o
nível da qualidade [17].
Figura
1 - Classificação da qualidade da evidência de
acordo com o Sistema Grading of Recommendations, Assessment, Development and
Evaluation (GRADE) e a confiança na estimativa do efeito encontrado.
Cinco são os fatores
que podem diminuir a evidência nos ensaios clínicos: limitação do estudo (study
limitation), inconsistência (inconsistency), imprecisão (imprecision),
direcionamento (indirectness) e viés de publicação (publication bias). É
importante destacar a semântica dos termos utilizados. O uso do prefixo latino
“in, im”, indicando negação/sentido contrário, mostra que está sendo mensurado
o grau de imperfeição dos estudos. Confia-se, portanto, no estudo menos
inconsistente, menos impreciso, menos indireto, deixando de qualificar os
estudos em boa e má qualidade, como preconizava as primeiras escalas utilizadas
para avaliar a qualidade dos estudos em revisões sistemáticas [5].
Desta forma, uma
determinada evidência pode ser proveniente de limitações em mais de um dos
fatores descritos acima e, desta forma, quanto mais sérias forem essas
limitações menor será a qualidade de evidência (Tabela I).
Em relação aos
estudos observacionais, o GRADE considera-os como
baixo nível, podendo aumentar se houver uma grande magnitude de efeito do
tratamento ou evidência de uma gradiente dose-resposta ou ainda se todos os
vieses plausíveis diminuiria ou aumentaria a magnitude de um efeito demonstrada
se nenhum efeito fosse observado [23] (Tabela I).
Tabela
I - Fatores que influenciam a qualidade de
evidencia nos estudos (experimental versus observacional) e a graduação da
evidência de acordo com o Sistema Grading of Recommendations, Assessment,
Development and Evaluation (GRADE).
Qualidade
de evidência global
O
Grade
propõe uma avaliação da qualidade de evidência por desfecho. Desta forma, cada
desfecho investigado é avaliado separadamente em relação aos fatores acima
descritos, dependendo do tipo de estudo, podendo diminuir ou aumentar a
qualidade da evidência em um ou dois níveis se houver um comprometimento sério
ou muito sério [26].
Esse sistema não fornece uma
classificação quantitativa de risco de viés. A fonte de viés pode causar
diferentes repercussões dependendo do desfecho. Assim, a qualidade de evidência
pode mudar entre os desfechos de um mesmo estudo [26]. Exemplo: suponha que um
determinado ensaio clínico objetivou avaliar a eficácia de uma intervenção
fisioterapêutica em pacientes com esclerose múltipla. Este estudo apresentou
como desfechos: “marcadores inflamatórios”, através de uma análise sanguínea, e
a “função muscular” (mensurada por uma escala) e não houve mascaramento. Para o
desfecho: “marcadores inflamatórios” a ausência do mascaramento interferirá
pouco, mas para a análise da “função muscular” haverá maior influência, pois se
trata de um desfecho subjetivo e o fato de o avaliador ter conhecimento do
grupo tratado poderá influenciar no processo avaliativo.
É importante
ressaltar que o julgamento do GRADE não se refere à
avaliação individual de cada estudo, através da validade interna (qualidade
metodológica) como era proposto pelos outros instrumentos de avaliação da
evidência. De acordo com o GRADE, o corpo da evidência
transcende o risco de viés e, como está relacionada à confiança na estimativa
do efeito observado, considera outros fatores: imprecisão, inconsistência,
direcionamento e viés de publicação. Desta forma, para que esse raciocínio seja
eficiente, o sistema propõe aos revisores sistemáticos e aos organizadores de
diretrizes a escolha de desfechos potencialmente importantes para o paciente
para serem apresentados como a evidência da intervenção. O sistema propõe
categorizar os desfechos em críticos, importantes, mas não críticos e de
limitada importância [26]. Por exemplo, desfechos como mortalidade, qualidade
de vida e funcionalidade podem ser considerados críticos, enquanto que força
muscular, importante, mas não crítico e dados eletromiográficos de limitada
importância para uma recomendação.
A escolha de
desfechos críticos e importantes centrados no paciente desempenha um papel
essencial para que a abordagem do GRADE seja aplicada
e interpretada. Como a análise da evidência deixa de focar o estudo de forma
global e passa para os desfechos, a evidência global é fornecida pelo desfecho
crítico e importante clinicamente para o paciente. Deste modo, se o desfecho
crítico e importante for classificado como de alta qualidade e os demais não se
enquadrarem nesse nível, a qualidade de evidência global será de alta
qualidade. Caso ocorra o oposto, ou seja, se o desfecho crítico e importante
for considerado de baixa qualidade e os demais de alta qualidade, a evidência
global será de baixa qualidade [26].
O
GRADE
proporciona o sumário da evidência através de tabelas denominadas perfil de
evidência (Evidence profile- EP) e
sumário de achados (summary of findings
- SoFs). Essas tabelas apresentam diferentes propósitos. As tabelas “sumário de
achados” – SoFs- apresentam a mesma informação das
tabelas “perfil de evidência”, com exceção dos detalhes da qualidade da
evidência e com adição de uma coluna de comentários [28-30].
Tabela
II -
Exemplo da tabela de perfil de evidência
(Evidence profile-EP) do Sistema Grading of Recommendations, Assessment,
Development and Evaluation (GRADE) gerada pelo software GRADEpro. (ver tabelas em PDF em anexo).
A sugestão do sistema
GRADE é que sejam apresentados apenas 7 desfechos nas
tabelas. Além disso, é possível observar que ambas as tabelas disponibilizam
notas de rodapé com o motivo pelo qual o nível de evidência foi rebaixado ou
aumentado, permitindo desta forma transparência no julgamento da evidência apresentada
[28-29]. Essas tabelas podem ser geradas através de um site denominado GRADEpro GDT [33] e para as questões envolvendo testes
diagnósticos há uma adaptação.
Recomendação
A força da
Recomendação, preconizada pelo GRADE, reflete a
extensão da nossa confiabilidade de que a estimativa do efeito está adequada
para suportar uma decisão particular ou recomendação. É utilizada nas
diretrizes e considera o equilíbrio entre os benefícios e danos de uma
intervenção, variabilidade nos valores e preferências do paciente e o uso dos
recursos (custos) da intervenção [4,6].
O
GRADE
apresenta apenas duas categorias de recomendação: ‘Forte” ou “Fraca”. A
Recomendação é forte quando os efeitos desejáveis da intervenção claramente
superam os efeitos indesejáveis ou claramente não superam. Uma Recomendação
Fraca resulta de resultados incertos, devido à qualidade da evidência ou quando
os efeitos desejáveis e indesejáveis da intervenção estão balanceados [4,6].
Além disso, o GRADE considera que a força da recomendação também pode
ser influenciada pelos valores e preferências do paciente e pelo uso dos
recursos da intervenção. Quanto mais variável for a
escolha do paciente quanto à intervenção proposta, maior a probabilidade de uma
Fraca Recomendação. Neste espectro consideram-se as perspectivas, expectativas,
crenças e objetivos do paciente em relação à saúde e à vida. Da mesma forma um
custo mais alto enfraquecerá a recomendação [4,6] (Figura 2). Os custos aqui
apresentados transcendem os custos monetários e são consideradas também outras
unidades de custos diretos e indiretos como, por exemplo, dias de
hospitalização, tempo e duração da terapia.
Figura 2 - Determinantes
da Força de Recomendação pelo sistema Grading
of Recommendations, Assessment, Development and Evaluation (GRADE).
O
GRADE
também prevê recomendações para o uso apenas no contexto da pesquisa quando há
intervenções promissoras com prejuízos ou grandes custos detectados, mas com
evidência insuficiente. O objetivo desta proposição é encorajar a pesquisa para
responder questões clínicas ainda não elucidadas [34].
É importante apontar
que o sistema GRADE não proporciona concordância na interpretação dos
resultados. Embora todo o julgamento seja transparente e sistemático, não
elimina discordâncias na interpretação desse julgamento. Não é objetivo do GRADE determinar uma avaliação objetiva da qualidade da
evidência, processo, este, subjetivo e julgamento-dependente. O mérito desse
sistema é permitir uma estrutura clara para guiar a interpretação dos pontos
críticos julgados [17].
Implicações
para a prática fisioterapêutica
O crescente uso de
revisões sistemáticas e diretrizes para a prática clínica tem permitido ao
fisioterapeuta embasar com evidência suas escolhas. Desta forma, com o intuito
de aumentar a segurança na tomada de decisão, é importante que os
fisioterapeutas entendam como o modelo vigente de avaliação da qualidade de
evidência, em diretrizes e revisões sistemáticas, tem sido empregado e
discutido.
A proposta do GRADE surge inserida em um modelo de raciocínio complexo,
porém pragmático que ultrapassa a avaliação da evidência apenas nas
considerações metodológicas intrínsecas dos estudos. O sistema aponta outros
fatores que precisam ser considerados para uma análise global da evidência.
Deixa de focar no risco de viés dos estudos, para averiguar também a
variabilidade, a precisão e o direcionamento do resultado, além dos possíveis
vieses provocados pela publicação. Em uma perspectiva filosófica permite um
veredito que confronta o achado disponível e transparentemente julgado com um
possível efeito verdadeiro. Permite avaliar quão confiante se está no efeito
estimado, como reflexo da apreensão da realidade. Desconstrói, portanto, a
tentativa dicotômica de classificar a evidência através de estudos de boa e má
qualidade, além de desconsiderar uma relação direta entre nível de evidência e
grau de recomendação, até então difundida por vários outros sistemas. Desta
forma, proporciona uma tradução mais compatível com o mundo real e permite que
o profissional de saúde transponha o conhecimento existente no seu espectro
clínico de atuação.
Quando preconiza o
foco em desfechos críticos e importantes para o paciente e considera seus
valores e preferências, permite sobressair a imprescindível e irrestrita
participação direta do paciente no paradigma da saúde baseada em evidência que
orienta a inclusão dos contextos individuais na interpretação da evidência.
Desta forma, o conhecimento da abordagem do sistema GRADE permite ao
fisioterapeuta respaldar-se em escolhas clínicas informadas para que possa
atuar no modelo de atuação prática centrada no paciente.
O sistema GRADE
propõe uma metodologia compreensiva e sistemática para graduar e sumarizar a
qualidade de evidência nas revisões sistemáticas e diretrizes e fornecer um
suporte para o manejo das recomendações clínicas nas diretrizes. Classifica a
qualidade da evidência em alta, moderada, baixa e muito baixa e a força da
recomendação em forte e fraca. Através de julgamentos transparentes em cada
etapa do processo permite o entendimento da evidência disponível fornecendo um
suporte adequado para análise da confiança nos resultados encontrados. Está
cada vez mais sendo incorporado nas revisões sistemáticas e diretrizes e,
portanto, faz-se necessário o seu entendimento para facilitar a análise crítica
da evidência e para que possa ser introduzido nas revisões sistemáticas em
Fisioterapia.