Búsqueda de potenciales dianas terapéuticas mediante análisis de redes de interacción proteína-proteína y técnicas estadísticas de clasificación

  1. Cacheiro Martínez, Pilar
Supervised by:
  1. Ángel Carracedo Álvarez Director
  2. Carmen María Cadarso Suárez Co-director

Defence university: Universidade de Santiago de Compostela

Fecha de defensa: 19 July 2017

Committee:
  1. M. Isabel Loza García Chair
  2. Joaquín Dopazo Blázquez Secretary
  3. María Luz Calle Rosingana Committee member

Type: Thesis

Teseo: 492553 DIALNET

Abstract

La identificación y validación de nuevas dianas terapéuticas es una de las principales áreas de interés en el campo del descubrimiento de fármacos. Las dianas terapéuticas son aquellas estructuras moleculares susceptibles de ser moduladas por la acción de un fármaco. Como resultado de la interacción entre la diana y el fármaco se produce un efecto terapéutico. La determinación y caracterización de propiedades distintivas tanto de los genes que constituyen dianas terapéuticas como de aquellos otros asociados a enfermedades o implicados en la respuesta a fármacos es de vital importancia en este contexto, ya que constituye el punto de partida para poder predecir nuevas entidades potenciales. Las herramientas in silico – bioinformáticas y bioestadísticas – constituyen un recurso muy útil para la caracterización de estos genes y la predicción de potenciales dianas. Así, en este trabajo de tesis, empleando algunas de estas herramientas e información disponible en bases de datos públicas, se han llevado a cabo distintos análisis para investigar en profundidad diversos atributos de los genes codificantes de proteínas que constituyen dianas terapéuticas. En primer lugar se ha realizado un estudio comparativo de ratios de variantes no-sinónimas y sinónimas (NS/S) en varias categorías de genes asociados a enfermedades y fármacos. Del mismo modo se ha investigado la existencia de posibles diferencias entre poblaciones. En segundo lugar se han explorado las propiedades topológicas de las dianas terapéuticas en el contexto de redes de interacción proteína-proteína con el propósito de identificar atributos comunes a las dianas terapéuticas y a su vez identificar nuevas dianas potenciales. Para ello se han estudiado las relaciones entre los nodos correspondientes a proteínas que constituyen dianas para fármacos aprobados y los nodos correspondientes a proteínas asociadas a la indicación de dichos fármacos. Por último se han empleado los modelos aditivos generalizados (GAM) para construir un clasificador binario que permita evaluar la capacidad predictiva de diferentes tipos de propiedades para predecir nuevas dianas potenciales y al mismo tiempo explorar la relación de estos atributos con la respuesta. Para ello se ha introducido un método exhaustivo de selección de variables basado en el Área bajo la Curva (AUC) e intervalos de confianza bootstrap. De los resultados obtenidos de este trabajo de investigación se extraen una serie de conclusiones tanto metodológicas como aplicadas. Respecto al primer trabajo, destacamos la validación del ratio NS/S como atributo asociado a las dianas terapéuticas y su utilidad para inferir la presión selectiva a la que está sometido un grupo de genes. Mientras que los genes asociados a enfermedades y que constituyen dianas terapéuticas presentan un ratio significativamente inferior al del conjunto total de genes codificantes de proteínas, los genes implicados en la respuesta a fármacos presentan un ratio más alto, particularmente en el caso de variantes raras. Asimismo, la implementación de contrastes de hipótesis basados en remuestreo nos ha permitido controlar el efecto de diferentes factores que pueden afectar a las diferencias observadas entre diferentes categorías de genes. Las distintas aproximaciones empleadas para el cálculo de los ratios presentan un alto grado de correlación con otras metodologías más habituales empleadas en este contexto. En relación al segundo estudio, se han determinado una serie de nodos de interés dentro de la red de interacción proteína-proteína para ser explorados en profundidad como candidatos para posibles ensayos de actividad farmacológica. Respecto al uso de grafos para el análisis de redes de interacciones proteína-proteína, el cómputo de diferentes parámetros a partir de la matriz de distancias nos ha permitido explorar las relaciones fármaco -indicación para diferentes tipos de dianas. Por último, mediante el uso de modelos GAM, hemos identificado un conjunto de nuevas dianas potenciales y hemos podido interpretar biológicamente la relación de cada una de las variables predictoras que forman parte del modelo con la respuesta. El empleo de metodología GAM en el contexto de la predicción de dianas terapéuticas nos ha permitido obtener modelos con una elevada capacidad predictiva. La introducción de un método exhaustivo de selección de variables nos ha permitido a su vez obtener modelos más sencillos y fácilmente interpretables.