El Dr. Chad Cook ya ha protagonizado alguna entrada en este blog, como ya sabemos es todo un referente a nivel mundial en Fisioterapia. Por fin llegó a España donde le vamos a poder disfrutar en varios Congresos y seminarios. Debido a mi reciente paternidad no pude asistir a su esperadísimo curso del fin de semana pasado pero me considero muy afortunado de tener tan buenos compañeros que comparten la información. Un compañero y buen amigo que tuvo la suerte de poder asistir, Salvador Santacruz (@SantacruzSalva), se prestó voluntario a escribir una entrada con un resumen del curso para este blog. Muchas gracias Salva.
Os dejo con la entrada de Salva, buena lectura…
El curso Pruebas clínicas para el diagnóstico diferencial impartido por el Dr. Chad Cook se celebró el pasado fin de semana (21-22 de Febrero de 2015) en Valencia. Es de justicia decir que estaba organizado por INSTEMA y que se ha celebrado en la Facultad de Fisioterapia de la Universidad de Valencia. Las instalaciones me han parecido más que adecuadas para tal y como se ha celebrado el curso que a priori parecía que era 50% práctico pero al final se ha visto que la carga teórica ocupaba no menos del 70% del tiempo del mismo. Puede ser que para un curso que se basa en pruebas clínicas un 30% de práctica sea escaso –y ciertamente lo es- pero desde mi punto de vista creo que el profesor Cook no ha diseñado este curso para que la gente aprenda a hacer los tests, sino para que aprenda cuándo y por qué hacerlos. Pero vayamos por partes.
El objetivo de la primera parte del curso, fue explicar los parámetros que se iban a utilizar cuando se hablaba de las pruebas clínicas –o tests-, determinar para qué pueden servir estos tests, cuándo –en qué fase de la exploración- deben utilizarse según su utilidad (para descartar o confirmar patologías) y si el estudio que los pone a prueba es de calidad (QUADAS) y por lo tanto “de fiar”. Según el Dr Cook lo que hace un test clínico “uno de los mejores” es que sea fiable, que tenga una utilidad clínica, que los hallazgos que encuentre se hallen validados y que tenga una alta fiabilidad diagnóstica (la habilidad de la prueba –incluso las de laboratorio y de imagen- para diferenciar entre la patología objetivo y la salud). Para saber si un test es bueno y en qué es bueno vamos a contar con las siguientes medidas:
- Fiabilidad: La medida en que esta prueba puede ser hecha por otros con resultados similares (un mismo paciente testado por dos clínicos usando la misma prueba será más probable que dé el mismo resultado si la fiabilidad es elevada).
- Sensibilidad: El porcentaje de gente que dará positivo para una particular enfermedad entre un grupo de gente que sí tiene esa enfermedad.
- Especificidad: El porcentaje de gente que dará negativo para una particular enfermedad entre un grupo de gente que no tiene esa enfermedad.
- Valores predictivos positivo y negativo: La probabilidad de que personas que dan/no dan positivo en un test tengan/no tengan realmente esa enfermedad.
- Coeficientes de probabilidad positivo y negativo: El positivo es la probabilidad de que un test positivo signifique que realmente hay un hallazgo positivo (un valor > 1 confirma un diagnóstico. El coeficiente de probabilidad positivo (LR+) obtiene valores que van de 1 a infinito). El negativo es la probabilidad de que un test que da negativo signifique que realmente hay un hallazgo negativo (un valor cercano al 0 excluye un diagnóstico. El coeficiente de probabilidad negativo (LR-) obtiene valores que van de 0 a 1-). Pero en la práctica se recomienda un LR+ de no menos de 5 para confirmar diagnóstico y un LR- de 0.2 a 0 para descartarlo (Cook, 2007). Siendo la formula LR+= (sensibilidad/1-especificidad) y LR-= (1-sensibilidad/especificidad).
Cabe decir que conocer al dedillo estos índices de medida es crucial para entender la verdadera razón del curso que no es otra que ofrecer los mejores test para diferentes regiones y dar la oportunidad al fisioterapeuta de valerse de la investigación para determinar si dicho test le va a ser útil en su práctica clínica. Un último apunte de los LR es que cuando un test sea altamente sensible y el LR- esté ente 0.2 y 0, será mejor que se realice justo después de la anamnesis y la observación pero, antes, proceder con la examinación pues nos ayudará a descartar patologías que de estar presentes constituyen una Bandera Roja que nos indica que hay que derivar al paciente al especialista adecuado. Si por el contrario un test demuestra tener una elevada especificidad y un LR+ mayor de 5 es mejor incluirlo al final de la exploración como prueba confirmatoria ya que en este caso necesitamos una herramienta que corrobore nuestra hipótesis de diagnóstico. Si alguien se pregunta si no hay alguna prueba clínica que sirva tanto para confirmar como descartar patologías, enhorabuena, según el Dr. Cook las hay pero no es lo habitual (una sería el test de aprensión ósea para húmero, bony apprehension test). Así pues, como hemos visto el orden de ejecución de las pruebas es importante ya que si no hacemos los test en el orden correcto “nuestros resultados estarán sesgados”.
Una vez sabemos esto, nos daremos cuenta de que un test con un LR- adecuado que evalúe una Bandera Roja va a ser lo que necesitaremos para descartar esa contraindicación y seguir con la exploración. Pero, ¿qué ocurre si no hay ninguno que por sí mismo sea tan robusto? Ocurre que para ello están las guías de predicción clínica donde se agrupan varios tests para una misma enfermedad. Pero hagamos un alto en el camino. Estamos continuamente hablando de tests, pruebas, o más bien de cómo se miden estos tests, pero no debemos olvidar algo que el Dr. Cook nos marcó como importante en esta primera parte del curso. Macher realizó una tabla en que incluía dos puntos para valorar un test más que los puramente métricos, la habilidad de un test para dirigir el manejo clínico y mejorar la evolución del paciente y la habilidad de un test para beneficiar a la sociedad en conjunto.
Para acabar con todos estos índices de medición aprendimos la importancia del Quality Assessment of Diagnostic Accuracy Studies (QUADAS) cuya puntuación máxima es 14. El QUADAS sirve para medir la calidad de los estudios de precisión diagnóstica y según Chad Cook todo estudio con un QUADAS inferior a 10 ya empezaba a flojear y era “caca” si no llegaba al 8. Esta medición nos va a avisar de los estudios que, a pesar de los buenos resultados de los tests que miden, pueden tener algún sesgo o incluso resultar invalidados por su baja calidad metodológica (para mayor información, véase esta entrada del blog).

Una vez sentadas las bases empezamos a ver pruebas clínicas, o mejor dicho, las guías de predicción clínica que podemos aplicar y medir desde el examen subjetivo o historial del paciente. Estas son para condiciones cardiacas (a destacar* la Marburg Heart Score) o problemas músculo-esqueléticos (*Canadian C-Spine Rules, *Pittsburg Knee Rules, Otawa Knee & Ankle Rules). Antes de presentarlos las pruebas o las guías de predicción clínica podíamos ver un cuadro resumen de las mismas agrupadas por niveles de calidad, siendo el nivel 1 el de mayor calidad. En algunos casos el nivel 1 se hallaba desocupado, no había prueba o guía que lo alcanzara. Entre paréntesis solos pondremos los de nivel 1.
Pasado el examen subjetivo llega el momento de descartar patologías y Banderas Rojas antes de proseguir con la exploración del movimiento (como dice Louis Gifford, «hay que sacarse el carnet de conducir antes de manejar a un paciente»). Las pruebas y guías para descartar que vimos eran para la gripe (3), riesgo de caídas, cardiacas y pulmonares, pruebas viscerales (*palpación mamaria) –aquí empezamos a practicar en camilla-, Banderas Rojas para el esqueleto axial y la pelvis (*Canadian C-Spine Rules). En este punto pude corroborar que el test para la disfunción de la arteria vertebral (masivamente usado como prueba cuyo negativo permitía proceder con una manipulación cervical) era de nivel C (o 3) y en consecuencia el Dr. Cook nos advirtió que servía de bien poco pues era como lanzar una moneda al aire y ver si sale cara o cruz. Siguieron Banderas Rojas para la extremidad superior, Banderas Rojas para la extremidad inferior (*Test de percusión rotulo-pubiana, *Reglas de Rodilla de Ottawa, *Reglas de Rodilla de Pittsburg, *Reglas de Tobillo de Ottawa, *Criterio de Wells para la trombosis venosa profunda, *Auscultación del peroné, *índice tobillo-braquial). Tras estos test terminamos la parte de detección de Banderas Rojas con los mejores tests para descartar problemas neurológicos (*SLR).
A continuación, entrando en la segunda parte del curso vimos los tests ortopédicos para las distintas regiones corporales. Una parte más práctica, aunque no exenta de teoría, que por problemas de tiempo no pudimos desarrollar en su vertiente práctica al máximo. De cualquier modo el Dr. Cook se quedó una hora y media después de la última clase para aclarar dudas y practicar los tests que se le pidieran. Como podéis ver al principio aprendimos a leer las pruebas pero después no nos quedamos atrás viendo más y más tests.
A modo de cierre, me gustaría citar brevemente mis conclusiones acerca del curso.
En primer lugar, de lo que se da cuenta uno tras hacer este curso es la importancia de practicar las pruebas y aprender a hacerlas bien (y a diferenciar unas de otras). Es innegable lo importante que es tener acceso a estudios que nos hablen de los tests que ya sabemos hacer –o que nos interese aprender a hacer-, leer esos estudios activamente (S2 mediante) y saber leer esos estudios de modo que seamos conscientes de sus puntos fuertes, sus sesgos y de cuando es «caca–palabra» bastante gráfica de lo malo que es el test o el estudio que lo evalúa que mencionó en más de una ocasión el Dr. Cook.
En segundo lugar, no veo el curso como algo 50% práctico. ¿Estaría bien que fuera la mitad práctico? Sí, sin ningún tipo de duda sí. Pero para lo que es –un curso de 17 horas condensado en un fin de semana- me pareció perfecto que la carga de horas sea mayor en el lado teórico. Considero que la práctica es tan necesaria como la teoría e imprescindible para desarrollar una buena clínica pero veo este curso como una oportunidad para dar el primer paso en un camino en que nos sirvamos de los tests de un modo consciente para dirigir nuestra exploración consciente y no como algo que usamos para afirmarnos en un diagnóstico que hemos decidido previamente porque estamos seguros de que es así. En cierto modo quiero decir que hay que seguir estudiando y practicando mucho con criterio y consciencia.
Gracias al Dr. Cook por su maravilloso curso, a María por su traducción y a todos con los que compartí el curso, dentro y fuera de las instalaciones.
Salvador Santacruz Zaragozá
Fisioterapeuta
Artículos recomendados:
Hegedus EJ, Cook C, Park JY et Al. Combining orthopedic special tests to improve diagnosis of shoulder pathology.PhysTher Sport.2014 Aug 10.pii: S1466-853X(14)00065-0. doi: 10.1016/j.ptsp.2014.08.001.
Schneider GM, Jull G, Salo P et Al. Derivation of a clinical decision guide in the diagnosis of cervical facet joint pain. Arch Phys Med Rehabil. 2014 Sep;95(9):1695-701. doi: 10.1016/j.apmr.2014.02.026. Epub 2014 Mar 21.
Hegedus EJ, Goode AP, Wright AA et Al. Which physical examination tests provide clinicians with the most value when examining the shoulder? Update of a systematic review with meta-analysis of individual tests. Br J Sports Med. 2012 Nov;46(14):964-78. doi: 10.1136/bjsports-2012-091066. Epub 2012 Jul 7.
Myer CA, Hegedus EJ, Tarara DT, Myer DM. A user’s guide to performance of the best shoulder physical examination tests.Br J SportsMed. 2013 Sep;47(14):903-7. doi: 10.1136/bjsports-2012-091870. Epub 2013 Jan 15.
Reiman MP, Goode AP, Wright AA et Al. Diagnostic accuracy of clinical tests of the hip: a systematic review with meta-analysis. Br J SportsMed. 2013 Sep;47(14):893-902. doi: 10.1136/bjsports-2012-091035. Epub 2012 Jul 7.
24 febrero, 2015 at 6:56 pm
Jesús, lo primero enhorabuena por tu reciente paternidad. Lo segundo, Salva ha hecho un resumen que ni a Chad Cook le hubiese salido mejor. Acabo de condensar 18 horas de mi vida en 10 minutos. Gracias.
Te sigo de cerca. Necesito del conocimiento que hay en este blog para poder ir mejorando cada día en mi trabajo. Gracias otra vez. Si vas a algún curso internacional de Instema este año nos veremos.
Atte: María (la intérprete).
Me gustaLe gusta a 2 personas
25 febrero, 2015 at 12:14 pm
Hola María, por suerte nos veremos en alguno de esos cursos porque me resultan de interés. Me alegro de que los contenidos del blog te aporten conocimiento porque para eso se hace, gracias.
Saludos!!
Me gustaLe gusta a 1 persona
24 febrero, 2015 at 11:37 pm
Hola,
Primero dar mi enhorabuena a Jesús por su paternidad y a Salva por su capacidad de resumir el curso de este fin de semana.
Solo una cosa… cuando relacionas el LR+ y especificidad para confirmar diagnostico y realizar al final de la exploración, ¿no te querrias referir a la sensibilidad? Y al reves: LR- y sensibilidad para descartar diagnostico y realizarlo al principio, ¿no se referia a la especificidad?
Por lo menos eso creí entender 😉
Un saludo y gracias!
Tino
Me gustaLe gusta a 2 personas
25 febrero, 2015 at 12:17 pm
Gracias por pasarte y comentar Tino. Dejaremos que Salva aclare lo que comentas y yo mismo lo corregiré en la entrada si es necesario. Gracias!!
Me gustaLe gusta a 1 persona
25 febrero, 2015 at 3:12 pm
Gracias a María y a Tino por comentar.
Respondiendo a tu pregunta ,Tino, me gustaría darte la referencia exacta de qué parte de los apuntes lo he sacado pero no lo encuentro. De todos modos te explico como creo que lo entiendo.
Si queremos descartar una patología necesitamos que el test que realizamos sea altamente sensible para estar seguros de que el test tiene la capacidad de identificar los positivos como tales pero al mismo tiempo necesitaremos un coeficiente de probabilidad negativo adecuado para que la probabilidad de que esa sea la enfermedad objetivo post test disminuya (esto ha de ver con el normograma de Fage que no he comentado en este post). Como ejemplo pongo las reglas de Ottawa de la rodilla, su sensibilidad es 100 (especificidad 49) y su LR- 0`11. Su LR- nos dice que es mejor descartando, pero es extremadamente sensible!
Por lo contrario el Finger Rolling test es muy bueno en confirmar un tumor cerebral monohemisférico consu LR+ infinito(!) y su especificidad de 100, si nos fiaramos de su sensibilidad mal íbamos pues es 16.
Lamento no poder explicarlo mejor, pero espero que se entienda el porqué de cruzar sensibilidad con descarte y especificidad con confirmación.
Me gustaMe gusta