Functional analysis and modeling of cellular signaling circuits with transcriptomic and proteomic data
Análisis funcional y modelado de circuitos de señalización celular con datos transcriptómicos y proteómicos

View/ Open
Author
Garrido Rodríguez-Córdoba, Martín
Director/es
Calzado Canale, Marco AntonioDopazo Blázquez, Joaquín
Muñoz Blanco, Eduardo
Publisher
Universidad de Córdoba, UCOPressDate
2021Subject
Biomedical researchOmics technologies
Omics data
Cellular signaling modeling
RNA-Seq
MIGNON
Genomics
Metabolomics
Proteomics
Transcriptomics
METS:
Mostrar el registro METSPREMIS:
Mostrar el registro PREMISMetadata
Show full item recordAbstract
Biomedical research models try to leverage useful insights for the sake of human health. Such models emerge from data, and, in recent years, the advent of omics technologies has revolutionized the way molecular data is generated and processed. Omics technologies allow the systematic evaluation of the molecules in a sample, generating large amounts of data that need to be analyzed and interpreted through computational approaches. Particularly, in the functional analysis step, molecular features are usually combined with prior knowledge to reduce its dimension and increase its interpretability. Across the different functional analysis approaches, those that try to model altered cellular signaling circuits hold the promise to reveal disease mechanisms and to allow the development of effective treatments. Cellular signaling can be traced and modeled from multiple molecular layers, but first proteomics, then transcriptomics and finally genomics offer the closer look to signaling processes. Among them, due to its balance between technology and closeness to the phenotype, the sequencing of RNA molecules (RNA-Seq), has gained great popularity in the past few years. In the present work, we develop new computational tools to deepen on the analysis and modeling of cellular signaling circuits from transcriptomic and proteomic data. First, we developed MIGNON, a novel workflow for the analysis of RNA-Seq data that can analyze the genomic and transcriptomic information extractable from this technique. MIGNON offers a mechanistic signaling framework to combine the two levels of information, generating an output easy to interpret and link to a given phenotype. Second, we applied and evaluated different computational strategies to infer altered cellular signaling circuits from transcriptomic, proteomic and phosphoproteomic data, highlighting the similarities and differences between them. Finally, we created a basic toolkit to perform the visualization, differential analysis and classic functional analysis of transcriptomic and proteomic data that was applied to create, reinforce, or refute hypotheses in different biomedical research contexts. Overall, this thesis work aims to improve the functional analysis of transcriptomic and proteomic data, providing the research community with classic and novel methodologies in the form of software packages. In addition to the novelty of MIGNON and of the comparison of strategies to model cellular signaling circuits, we believe that this work can help to widen the bottleneck constituted by the omic data interpretation in biomedical research contexts. Los modelos científicos empleados en la investigación biomédica pretenden generar información útil para mejorar la salud humana. Estos modelos emergen a partir de datos y, en los últimos años, la llegada y el perfeccionamiento de las tecnologías ómicas ha revolucionado la forma en la que los datos moleculares son generados y procesados. Las tecnologías ómicas permiten evaluar sistemáticamente las moléculas en una muestra biológica, generando una gran cantidad de datos que deben ser analizados e interpretados a través de aproximaciones computacionales. Concretamente, en el análisis funcional, los datos ómicos se combinan con información previa, reduciendo su dimensión e incrementando su interpretabilidad. De entre las diferentes estrategias de análisis funcional, aquellas que intentan modelar los circuitos de señalización alterados son especialmente prometedores de cara a revelar los mecanismos subyacentes a procesos patológicos, permitiendo el desarrollo efectivo de nuevos tratamientos. Este modelado se puede llevar a cabo con diferentes capas moleculares, pero, las técnicas proteómicas, transcriptómicas y genómicas, en ese orden, ofrecen la visión más cercana a los procesos de señalización. De entre ellas, debido a su equilibrio entre desarrollo tecnológico y cercanía al fenotipo, la secuenciación de moléculas de ARN (RNA-Seq) ha ganado una gran popularidad en los últimos años. En este trabajo, hemos desarrollado nuevas herramientas computacionales para profundizar en el análisis y modelado de circuitos de señalización celular a partir de datos transcriptómicos y proteómicos. En primer lugar, desarrollamos MIGNON, un nuevo workflow para el análisis de datos de RNA-Seq capaz de analizar la información genómica y transcriptómica que se puede extraer de esta técnica. Además, MIGNON ofrece la posibilidad de combinar los dos niveles de información en el contexto de un modelo de señalización celular, generando un resultado fácil de interpretar y de vincular a determinados fenotipos. En segundo lugar, aplicamos y evaluamos diferentes estrategias computacionales para inferir circuitos de señalización celular a partir de datos transcriptómicos, proteómicos y fosfoproteómicos, explorando la similitudes y diferencias entre ellos. Finalmente, creamos un kit computacional para llevar a cabo la visualización y el análisis estadístico y funcional de datos transcriptómicos y proteómicos. Este kit fue aplicado para crear, reforzar o refutar hipótesis en diferentes contextos de investigación biomédica. En resumen, el trabajo de esta tesis pretende mejorar el análisis funcional de datos transcriptómicos y proteómicos, proporcionando a la comunidad metodologías novedosas y clásicas en forma de nuevos paquetes de software. Además de la novedad de MIGNON y de la comparación de estrategias para modelar los circuitos de señalización celular, creemos que este trabajo puede ayudar a ensanchar el cuello de botella que representa el análisis e interpretación de datos ómicos en la investigación biomédica.