Estudio de la variabilidad genética en poblaciones urbanas y nativas de Argentina, estratificación poblacional e implicaciones genético-forenses

Toscanini, Ulises Faustino

Estudio de la variabilidad genética en poblaciones urbanas y nativas de Argentina, estratificación poblacional e implicaciones genético-forenses

Toscanini, Ulises Faustino

Dirigida por:

Leonor Gusmâo Director/a
Antonio Salas Ellacuriaga Director

Universidad de defensa: Universidade de Santiago de Compostela

Fecha de defensa: 19 de mayo de 2011

Tribunal:

Ángel Carracedo Álvarez Presidente
María Victoria Lareu Huidobro Secretaria
Thore Egeland Vocal
Lourdes Prieto Solla Vocal
L. Roewer Vocal

Tipo: Tesis

Teseo: 307528 DIALNET

Resumen

Argentina, como todos los pueblos del continente americano, ha experimentado cambios demográficos importantes a lo largo de su historia. De especial relevancia es el impacto de la llegada de los europeos y el tráfico de esclavos en épocas coloniales. La composición genética de las poblaciones ha cambiado de forma radical después de estos eventos demográficos, y de manera diferente dependiendo del país o la región. La sub-estructuración poblacional juega un papel importante en la valoración de la prueba forense. Existen motivos para pensar que la composición del acervo genético general de la población Argentina podría ser diferente en distintas regiones del país (v. gr. Martínez¿Marignac et al. 2004; Martínez¿Sarasola 2005). Desde una perspectiva forense resulta importante conocer si existen diferencias significativas entre poblaciones urbanas de diferentes regiones del país que puedan tener implicaciones en los análisis de casos de criminalística y de paternidad. El conocimiento de la composición genética de poblaciones nativas es también importante desde la perspectiva antropológica y socio¿cultural. Desde los comienzos de la utilización en genética forense de polimorfismos de ADN se ha ido acumulando gran cantidad de información sobre diferentes marcadores autosómicos para distintas regiones de Argentina (Sala et al. 1997, 1998, 1999; Tourret et al. 1999; Berardi et al. 2003; Martínez et al. 2003; Miozzo et al. 2003; Toscanini et al. 2003; Tenaglia et al. 2004; Jaime et al. 2004; Martínez¿Marignac et al. 2004), principalmente publicados como datos de frecuencias de poblaciones individuales, con información referida al equilibrio de Hardy¿Weinberg y otros parámetros de interés en el campo forense. La mayoría de los trabajos realizados sobre comparación de datos poblacionales se basan en un número limitado de marcadores genéticos, y se enfocan principalmente desde el punto de vista antropológico tendiente a determinar la contribución nativa americana al pool genético de las poblaciones estudiadas (Sala et al. 1997, 1998; Martínez¿Marignac et al. 2004). Solo en algunos trabajos (además de los presentados en el presente documento de tesis) se ha pretendido analizar el nivel de subestructuración poblacional en Argentina y las implicaciones que esto puede tener en genética forense (v. gr. Marino et al. 2008). Con respecto a los marcadores de herencia uniparental ¿ADN mitocondrial y cromosoma Y¿, debido al enorme número de haplotipos posibles existe una necesidad lógica de contar con bases de datos extensas. Por otro lado, el menor efectivo poblacional para estos marcadores induce a una mayor susceptibilidad a deriva génica y consecuentemente a mayor diferenciación poblacional, por lo que es necesario que las bases de datos abarquen diferentes poblaciones. En este sentido, adquieren interés especial las poblaciones indígenas y aquéllas localizadas en regiones geográficas de difícil acceso, que aún no han sido genéticamente caracterizadas, y en donde existe una dificultad logística en la recolección de las muestras. Además de los trabajos publicados como parte de este proyecto de tesis, tan solo algún estudio ha conseguido ir cubriendo pequeñas parcelas de interés forense y genético poblacional en relación a poblaciones Argentinas, tanto Nativo Americanas (e.g. Bobillo et al. 2008, Álvarez-Iglesias et al. 2007, Ginther et al. 1993) como rurales y urbanas (Bobillo et al. 2008, Salas et al. 2008) Esta tesis tiene como objetivo principal determinar si los marcadores genéticos presentes en el ADN nuclear de uso común en estudios de identificación humana son sensibles al nivel de estratificación poblacional existente actualmente en Argentina, y si dicho grado de estratificación puede tener efectos relevantes en la valoración estadística de las pruebas de paternidad y forenses. A partir de los estudios realizados como parte de esta tesis se obtuvieron distribuciones de frecuencia poblacional para los marcadores en estudio, se estudió cada población para comprobar el equilibrio de Hardy¿Weinberg, se estimaron parámetros forenses, y se obtuvieron datos de tasa de mutación de cromosoma Y ¿de utilidad en estudios de paternidad¿ que han contribuido a incrementar la información ya existente. Con estos resultados se pretendió en segundo lugar relacionar las características genéticas de distintas poblacionales con la historia demográfica de Argentina. Y desde esta óptica, el enfoque final del trabajo se concentró básicamente sobre los efectos en la valoración estadística de las pruebas de paternidad y forenses ¿es decir, sobre los valores de Índice de Paternidad y Cocientes de Verosimilitud¿ que puedan ser producidos por la existencia de estratificación poblacional en este país. Este último abordaje constituyó una integración de los estudios comparativos para determinar la implicancia de la subestructuración poblacional sobre el peso de la evidencia genética en la práctica. Desde el punto de vista de la utilidad forense, puede verse que los parámetros de interés obtenidos en todas las poblaciones estudiadas demostraron que el grupo de marcadores incluidos en los distintos trabajos poseen una elevada eficacia tanto para uso en estudios de paternidad como forenses (CE combinada > 0,999999; PC combinada < 1,0 x 10-17 en marcadores autosómicos). También se halló que en todos los casos las poblaciones están equilibrio de Hardy¿Weinberg. Estos datos permiten afirmar que tanto el grupo de STRs estudiados como las bases de datos de frecuencias alélicas obtenidas para cada población pueden ser utilizados con fines forenses de manera confiable. En cuanto a la variabilidad genética de las poblaciones de Argentina, los resultados del análisis de marcadores sexuales mostró que las poblaciones nativas poseen índices de diversidad más bajos ¿0,9769 y 0,9497 en cromosoma Y, 0,6355 y 0,5792 en cromosoma X, para Toba y Colla respectivamente¿ que los de otras poblaciones de Argentina y de Sudamérica. En los estudios comparativos con STRs autosómicos se observaron valores de P significativos (¿ = 0,05) para las distancias genéticas entre diferentes pares de poblaciones. Los valores de Fst hallados pueden considerarse bajos entre las poblaciones urbanas (0,000¿0,003). Resultados similares se reportaron en otros estudios recientes de poblaciones Argentinas (Marino et al. 2008). Esta situación resultó sustancialmente distinta para las comparaciones con los grupos nativos, en cuyo caso los valores de Fst resultaron sensiblemente mayores en las comparaciones entre sí y con las poblaciones urbanas de Argentina (0,022¿0,047), mostrando valores de P significativos en todos los casos. Con relación a las muestras de las comunidades nativas analizadas en este trabajo, merece la pena notar que los resultados de las comparaciones realizadas con STRs de cromosoma Y, según se puede observar en los gráficos de NJ y de MDS, la muestra de la población Toba se colocó más próxima a otras comunidades nativas de Argentina y distante del set de poblaciones europeas y urbanas de Argentina utilizadas para la comparación. En contraste con este hecho, se observó que la muestra de la población Colla se ubicó de forma aproximadamente equidistante a los agrupamientos de poblaciones nativas y europeas. Este patrón refleja también el hecho de que la muestra de la población Colla presentó los valores más altos de Fst con respecto a todas las comunidades nativas con las que fue comparada. Estas observaciones son consistentes con el hecho de que esta comunidad Colla presenta una composición genética que manifiesta el producto de una mezcla intensa de grupos originarios y de inmigrantes europeos. En el mismo sentido se mostraron los resultados de las comparaciones con los haplotipos de la base de datos de referencia de cromosoma Y (www.yhrd.org, versión 22) y por la comparación con haplotipos modales incluidos dentro de distintos haplogrupos definidos mediante Y¿SNPs. Finalmente, el análisis de Y¿SNPs ha permitido confirmar este supuesto y cuantificar la contribución europea, nativa y de otros grupos al pool genético de esta población. Como fue de esperar, los resultados de Y¿SNPs en Toba mostraron un mayor aporte nativo americano a la composición actual de esta población. Además de los resultados obtenidos a partir de la comparación de las distancias genéticas, la comparación de frecuencias alélicas de STRs autosómicos realizadas marcador a marcador entre todos los pares posibles de poblaciones permitió detectar diferencias significativas en un número variable de marcadores dependiendo de los pares comparados. Es de notar que las diferencias se detectaron para diferentes pares de poblaciones urbana¿urbana, urbana¿nativa, nativa¿nativa, urbana¿ibérica y nativa¿ibérica, siendo nuevamente las poblaciones nativas las que mostraron las diferencias más importantes. Por lo tanto, dadas las diferencias observadas en las distribuciones de frecuencias en varios loci y los valores estadísticamente significativos de Fst entre diferentes poblaciones, podría resultar cuestionable el uso con fines forenses de una base de datos de frecuencias alélicas global de Argentina para STRs autosómicos cuando sea necesario utilizar bases de datos de referencia urbanas, como ha sido recientemente sugerido (Marino et al. 2008). Aún menos aceptable sería el hecho de utilizar bases de datos ibéricas o italianas asumiendo que, al ser estas poblaciones las que dieron origen al mayor influjo de inmigrantes europeos a Argentina, podrían representar de forma adecuada la composición genética de este país. Basados en estos resultados, se planteó demostrar si el nivel de subestructuración detectado a nivel de la composición genética entre las distintas poblaciones puede traducirse en efectos reales sobre los parámetros principales de valoración de las pruebas forenses y de investigación de distintos casos de parentescos: los Cocientes de Verosimilitud (CLRs) y los Índices de Paternidad (IPs). El fin de explorar el efecto sobre estos parámetros es que éstos son los valores que se reportan en estos estudios y los cuales deben ser interpretados directamente por los jueces o por los individuos involucrados. Esta investigación se llevó a cabo mediante procesos de simulación asistidos con ordenador, los que revelaron que tanto los cálculos de CLRs como de IPs son afectados en forma significativa por los efectos de la subestructuración detectada con marcadores STRs de uso forense. El grado de distorsión en los valores dependió de la base de datos de frecuencia utilizada para el cálculo, observándose valores extremos cuando se emplean como referencia bases de datos urbanas para el cálculo de CLRs o IPs de perfiles provenientes de poblaciones nativas y viceversa. En cuanto a la incorporación del Fst ¿comúnmente utilizado como una medida de estructuración poblacional¿ en el cálculo de IPs, los resultados de las investigaciones realizadas demostraron que el uso de este parámetro podría resultar en una estrategia simplificada para poder balancear los efectos ocasionados por la subestructuración poblacional en los valores de IPs. Es de resaltar que la aplicación de la corrección por Fst no siempre resulta en valores más bajos de IP que los obtenidos al utilizar las bases de datos de referencia correspondiente, y que el uso de Fst con este propósito puede no siempre resultar conservativo. La utilización de la corrección por Fst con este fin se halla dentro de las recomendaciones publicadas por la Sociedad Internacional de Genética Forense (ISFG) (Gjiertson 2007), si bien en dichas recomendaciones no se indican detalles sobre las estrategias para estimar este valor ni sobre su aplicación precisa. Así, resulta común que el uso de esta corrección esté ampliamente aceptado por muchos laboratorios de genética forense. El cálculo mismo del valor de Fst resulta problemático en varios sentidos: no solo la aplicación de la corrección por Fst puede resultar problemática si no que la obtención de un valor de Fst ¿real¿ está también condicionada por el esquema de muestreo. Sin embargo, los valores de Fst solo pueden ser calculados empíricamente y no es posible especular acerca de los posibles valores de Fst que puedan obtenerse bajo diferentes condiciones. En resumen, los resultados obtenidos de los estudios realizados mostraron que en Argentina existe un nivel de estratificación poblacional que pudo ser detectado mediante STRs de uso forense. Este nivel de subestructuración demostró tener efectos reales sobre los valores de los Cocientes de Verosimilitud e Índices de Paternidad utilizados en los informes forenses y de paternidad como medio de valoración estadística de la prueba genética. Por lo tanto, el uso en genética forense de bases de datos de frecuencias alélicas globales no está justificado en Argentina y puede conducir a desvíos importantes de los valores de CLRs e IPs. Además, el hecho de que la estima de valores de Fst presente ciertas dificultades y de que las poblaciones de Argentina no muestran valores de Fst elevados ¿si bien en algunos casos significativamente diferentes¿ pueden hacer que la utilización de este índice para corregir el efecto de la subestructuración a nivel de los valores de CLRs e IPs resulte inapropiado. De esta forma, se puede considerar que el rol de las bases de datos de referencia locales no puede ser fácilmente sustituido por otros esquemas de muestreo para corregir el efecto de subestructuración poblacional, y por lo tanto, siempre que resulte posible, la población de interés debería ser adecuadamente muestreada con el fin de representar de la forma más fiel posible su heterogeneidad genética.