Evaluación y clasificación de materialesun enfoque estadístico
- Tarrío Saavedra, Javier
- Salvador Naya Director
- Ramón Artiaga Director
- Mario Francisco-Fernández Director
Defence university: Universidade da Coruña
Fecha de defensa: 16 November 2012
- Wenceslao González Manteiga Chair
- María Antonia Señarís Rodríguez Secretary
- José Manuel Torralba Castelló Committee member
- Ricardo Cao Abad Committee member
- María Dolores Ugarte Martínez Committee member
Type: Thesis
Abstract
La tesis doctoral que aquí se muestra se presenta como el compendio de cuatro de los artículos de investigación elaborados y publicados en revistas indexadas en el Journal Citation Report durante el período en el que el autor ha estado matriculado en el programa de doctorado de Estadística e Investigación Operativa de la Universidad de A Coruña (Universidade da Coruña). Seguidamente se muestran las referencias correspondientes a cada uno de los artículos, así como el Factor de Impacto (FI) de las revistas donde aparecen publicados: 1. Javier Tarrío-Saavedra, Salvador Naya,Mario Francisco-Fernández, Jorge López-Beceiro, Ramón Artiaga (2011). Application of functional ANOVA to the study of thermal stability of micronano silica epoxy composites. Chemometrics and Intelligent Laboratory Systems, 105, 114-124. ISSN: 0169-7439. El FI de la revista Chemometrics and Intelligent Laboratory Systems en el 2011 es 1,920 (situada en el primer cuartil de la categoría STATISTICS & PROBABILITY). 2. Mario Francisco-Fernández, Javier Tarrío-Saavedra, Abhirup Mallik, Salvador Naya (2012). A comprehensive classification of wood from thermogravimetric curves. Chemometrics and Intelligent Laboratory Systems, In Press, DOI: http://dx.doi.org/10.1016/j.chemolab.2012.07.003. ISSN: 0169-7439. El FI de la revista Chemometrics and Intelligent Laboratory Systems en el 2011 es 1,920 (situada en el primer cuartil de la categoría STATISTICS & PROBABILITY). 3. Javier Tarrío-Saavedra, Salvador Naya,Mario Francisco-Fernández, Jorge López-Beceiro, Ramón Artiaga (2011). Functional nonparametric classification of wood species from thermal data. Journal of Thermal Analysis and Calorimetry, 104, 87-100. ISSN: 1388-6150. El FI de Journal of Thermal Analysis and Calorimetry en el 2011 es 1,604 (situada en en el segundo tercio o tercil de la categoría CHEMISTRY, ANALYTICAL). 4. Abhirup Mallik, Javier Tarrío-Saavedra, Mario Francisco-Fernández, Salvador Naya (2011). Classification of wood micrographs by image segmentation. Chemometrics and Intelligent Laboratory Systems, 107, 351-362. ISSN: 0169-7439. El FI de la revista Chemometrics and Intelligent Laboratory Systems en el 2011 es 1,920 (situada en el primer cuartil de la categoría STATISTICS & PROBABILITY). Aparte de la resolución de los problemas concretos planteados en cada artículo, esta serie de trabajos pretenden representar un nexo de unión o bisagra entre la estadística, con todas las oportunidades que ofrece, y la Ciencia de Materiales, dotando al conjunto del texto de un carácter marcadamente aplicado. En esta tesis se abordan problemáticas de la Ciencia de los Materiales que son novedosas o que no han sido resueltas hasta el momento mediante métodos estadísticos clásicos. Para ello se recurre a técnicas recientemente desarrolladas, o incluso en desarrollo, relacionadas principalmente con el Análisis de Datos Funcionales (FDA) y el Aprendizaje Máquina en un contexto multivariante. Por lo tanto, aún sin ser su principal motivación, en la presente monografía se busca igualmente contribuir a la difusión de estos nuevos procedimientos en el campo de Ingeniería de Materiales. Esta memoria está dividida en dos partes principales, una relacionada con la evaluación de micro-nanocompuestos de matriz orgánica epoxi y carga inorgánica humo de sílice, y otra que hace referencia a la clasificación de materiales (en particular, a la clasificación de especies de madera) a partir de datos térmicos y de las características obtenidas después de un proceso de segmentación de imágenes. El estudio, desarrollo y aplicación de los micro y nanomateriales ha experimentado un gran auge en los últimos 20 años. Una de las razones es la posibilidad de obtener compuestos con propiedades mecánicas únicas, mejorando el comportamiento que presentan los materiales tradicionales. En lo que respecta a los compuestos de matriz polimérica epoxídica y refuerzo inorgánico de micro y nanopartículas de sílice, su estudio y uso está muy extendido. Esto es debido, por una parte, a la rigidez, estabilidad y ligereza de la resina epoxi y, por otra, a la mejora en la tenacidad, estabilidad térmica, resistencia a la llama, etc. que aporta la adición de micro y nanopartículas de sílice. La obtención de los valores óptimos de la cantidad de partículas, grado de dispersión, tamaño medio y forma, se vuelve crucial en el desarrollo de estos materiales. En la presente tesis doctoral se propone medir la influencia de la adición de nano partículas de sílice en la estabilidad térmica de una resina epoxi, aplicando para ello el denominado ANOVA funcional a las curvas obtenidas mediante Análisis Termogravimétrico (TG). Esta metodología, relacionada con el FDA, ha demostrado aportar una valiosa información, complementaria e incluso alternativa a la obtenida por otros procedimientos experimentales y estadísticos. En la segunda parte de este estudio, se aborda el problema de la clasificación de materiales, concretamente, se evalúa el poder discriminante de las curvas TG y de las curvas obtenidas mediante Calorimetría Diferencias de Barrido (DSC) por varios métodos de clasificación, funcionales y multivariantes, paramétricos y no paramétricos, novedosos y tradicionales. Para ello, se elige uno de los materiales más difíciles de clasificar debido a su heterogeneidad estructural y química: la madera. La posibilidad de clasificación de especies de madera a partir de las curvas obtenidas mediante la aplicación del análisis térmico, había sido apuntada por Salvador Naya en su tesis doctoral. Junto al trabajo que aquí se describe, representan los únicos acercamientos, hasta la fecha, a la clasificación de maderas mediante curvas TG. Por otro lado, también se presenta el primer estudio de clasificación de maderas a partir de las curvas obtenidas mediante DSC. Debido a la alta variabilidad que existe dentro de cada especie (se pueden observar diferencias apreciables entre muestras pertenecientes a distintos árboles e incluso a un mismo árbol), se ha juzgado no sólo útil sino también necesaria la inclusión de un estudio de simulación de curvas TG. Este es un procedimiento todavía muy poco usual en el área del Análisis Térmico, a través del cual se obtienen nuevas muestras artificiales en escenarios más desfavorables que el que describen los datos experimentales, ahorrando en tiempo de experimentación y coste del material que conlleva. Mediante este procedimiento se evalúa de una forma exhaustiva el poder discriminante de las curvas TG. Además, también se ha probado una nueva alternativa para resolver el mismo problema, pero en este caso partiendo de datos completamente diferentes; este enfoque está basado en la obtención y procesamiento de imágenes, metodologías mucho más utilizadas que el análisis TG y DSC para resolver problemas de clasificación y detección de defectos. Se han clasificado muestras pertenecientes a diferentes especies de madera, utilizando para ello las micrografías obtenidas a 1500x aumentos mediante Microscopía Electrónica de Barrido (SEM) y procesadas mediante el procedimiento de segmentación de imágenes. El uso de micrografías SEM como fuente de datos para la clasificación de maderas (previo procesado y extracción de características) representa una novedad en la Ciencia de Materiales y la Quimiometría. Hay que destacar que la discriminación de materiales en sus diferentes clases es un importante problema práctico con una aplicación directa en la industria. En concreto, la clasificación de las especies de madera es útil en las industrias del mueble, la producción de paneles de madera, o incluso en la Arqueología. Hoy en día, la identificación de la madera se realiza con una precisión que varía en gran medida dependiendo del operador. Además, la formación de trabajadores cualificados puede resultar muy costosa, tanto en tiempo como en dinero. Por tanto, la aplicación de métodos automáticos de reconocimiento de muestras de madera puede tener una aplicación inmediata dentro de la tecnología de este material. A partir de los resultados alcanzados, se han obtenido interesantes conclusiones relacionadas con la estructura físico-química de la madera. Pese a la aparente heterogeneidad de las partes que constituyen esta monografía, una misma idea une las dos partes principales de este texto: la aplicación de diversas técnicas estadísticas al estudio de materiales, más concretamente, al estudio de la degradación de materiales. Dada la naturaleza de los datos a tratar, gran parte de las técnicas utilizadas en este trabajo tienen relación con el FDA, como son el ANOVA funcional o los diferentes métodos de clasificación supervisada utilizados. Pero, ya sea para aplicar las anteriores o de forma independiente, en las siguientes páginas se utilizan herramientas como el bootstrap paramétrico, simple y suavizado, la simulación de Monte Carlo, la regresión no lineal según una suma de componentes logísticas, la regresión spline, el Análisis de Componentes Principales (PCA), la clasificación multivariante aplicando diversos clasificadores como son el Análisis Discriminante Lineal (LDA), Bayes Naive (NBC), Regresión Logística, Clasificación Cuadrática, k vecinos más próximos (k-NN), Máquinas de Soporte Vectorial (SVM) o Redes Neuronales (NN). El principal objeto de aplicación de estas técnicas han sido las curvas resultantes de los experimentos obtenidos por Análisis Térmico, que, por sus características, pueden considerarse datos funcionales. Por un lado, se han obtenido curvas TG, que describen la masa que posee un espécimen en relación a la temperatura que soporta (o al tiempo) y, por otro, curvas DSC, que expresan el intercambio de energía en una muestra respecto a su temperatura o al tiempo. De forma global, el trabajo que aquí se presenta se ocupa del estudio de las diferencias existentes en los procesos de degradación entre materiales, ya sean provocadas (ANOVA funcional) o preexistentes (muestras de diferentes especies de madera) y de la simulación de dichos procesos de degradación (obteniendo nuevas muestras artificiales en diferentes escenarios). Adicionalmente, se presenta un estudio en el que se prueba la idoneidad del uso de micrografías SEM segmentadas para la clasificación supervisada de materiales. Es muy importante tener en cuenta que la presente tesis doctoral se estructura en torno a un conjunto de cuatro artículos de investigación publicados durante el período en el que el autor estuvo matriculado en el programa de doctorado en Estadística e Investigación Operativa impartido en la Universidad de A Coruña. En el primer artículo se aborda el primer problema planteado anteriormente: evaluación de la influencia del contenido en micro-nanopartículas en la estabilidad térmica de una resina epoxi. Este estudio representa por sí solo la primera parte de esta tesis. Los tres artículos restantes constituyen la segunda parte: la clasificación de materiales; en particular, la clasificación de especies de madera a partir de datos térmicos (incluyendo un estudio de simulación) y micrografías segmentadas. Siguiendo este esquema, el Capítulo 3, 4 y 5 se corresponden con los 3 últimos artículos que se han mencionado al comienzo de este resumen. En las siguientes líneas se muestra una introducción a cada uno de losproblemas planteados. Aplicación del ANOVA funcional en el estudio de la estabilidad térmica de micro-nano compuestos epoxi-humo de sílice En este capítulo, se ha evaluado el efecto de la adición de humo de sílice (compuesto de nano y micropartículas) en la estabilidad térmica de una resina epoxi mediante un test ANOVA de carácter funcional (FANOVA). Se han considerado tres niveles diferentes de adición de humo de sílice: 0, 10 y 20 wt%. La prueba ANOVA se ha aplicado tanto a las curvas TG reescaladas como a las curvas DTG y previamente a la aplicación del test, se ha realizado un preprocesado, con el objeto de preparar la base de datos convenientemente antes de ser analizada. Con tal motivo se han aplicado técnicas estadísticas como los b-splines penalizados y el concepto de profundidad de datos. Concretamente, en el ámbito de los contrastes ANOVA con respuesta funcional, el test en el que se basa gran parte de este capítulo fue ideado y desarrollado por A. Cuevas, M. Febrero y R. Fraiman en Cuevas et al. (2004). Otros enfoques de este mismo problema se pueden en contrar en Brumback y Rice (1998), Ramsay y Silverman (2005); Ramsay et al. (2009), Fan et al. (1998), Shen y Faraway (2004) y Shen y Faraway (2004). Recientemente, también se han realizado estudios de gran interés para tratar problemas que presentan más de un de factor tratamiento (Cuesta-Albertos y Febrero-Bande, 2010). Clasificación de materiales La clasificación supervisada de materiales es un tema de importancia capital en Ingeniería, correspondiéndose con la segunda parte de esta tesis, en la que se estudia el caso particular de la madera. En concreto, se han considerado diferentes especies de interés industrial: roble, haya, castaño, pino insigne, pino rojo, eucalipto, nogal y jatobá. La elección de este tipo de material está relacionada, por un lado, con la importancia relativa que la industria de la madera tiene en Galicia y, por otro, con la particular dificultad que la clasificación de la madera comporta, debido a su gran heterogeneidad (existente incluso en muestras de un mismo árbol). Una aportación fundamental de los capítulos 3, 4 y 5 a la tecnología de la madera consiste en la utilización y adaptación de nuevas técnicas no paramétricas pertenecientes al análisis de datos funcionales, basadas principalmente en el estimador de Nadaraya-Watson y el algoritmo Adaboost, así como su aplicación a curvas TG y DSC. Su comparación con métodos de clasificación supervisada multivariante representa también una aportación importante. Estos últimos se pueden emplear gracias al desarrollo y/o aplicación de diversas técnicas de extracción de características a partir de curvas TG y micrografías SEM previamente segmentadas: (a) utilización de los parámetros de ajuste correspondientes a un modelo de regresión compuesto por una suma de 4 componentes logísticas, cada una relacionada con el proceso de degradación de cada constituyente principal de la madera (agua, hemicelulosa, celulosa y lignina); (b) las componentes principales que explican el 99% de la variabilidad de las curvas TG; (c) el área media, circularidad, rectangularidad, número y distancia entre la traqueidas mostradas en las micrografías SEM. El modelo de regresión propuesto ha servido igualmente para llevar a cabo un completo estudio de simulación de curvas TG correspondientes a las especies estudiadas. Mediante este estudio se pueden obtener muestras artificiales en escenarios con diferentes grados de dependencia entre parámetros y con una variabilidad diferente a la obtenida en los estudios experimentales. Ello permite evaluar de una forma más precisa y completa la capacidad discriminante de las curvas TG.