Bioimage Informatics for Phenomics - Mines Paris Accéder directement au contenu
Hdr Année : 2020

Bioimage Informatics for Phenomics

Résumé

While we have the technologies and computational tools to analyze entire genomes, transcrip- tomes and proteomes, the computational description of phenotypes resulting from this molecular basis is still lagging behind. Yet, the quantitative description of the diverse aspects of the phe- nome is a prerequisite for understanding the complex genotype-phenotype relationships in living systems. High Content Screening (HCS) allows to systematically explore many different aspects of the phenome, in particular cell morphology, the dynamics of cellular behavior and the spatial dis- tribution of transcripts and proteins inside cells. Monitoring and analyzing the changes in these aspects upon perturbation by gene silencing or drug treatment have the potential to unravel the relationship between these cellular properties and the molecular mechanisms that regulate them. Similarly, the analysis of stained tissue slides allows to study architectural changes depending on disease related variables. Large-scale imaging approaches, such as HCS and histopathology, thus provide information that is complementary to information at the molecular level, traditionally studied in bioinformatics. In order to make best use of these challenging and complex large-scale image data sets, we need robust and sophisticated methods capable of integrating a large set of image features in order to reach a biologically meaningful description of the data. For this reason, computer vision is the method of choice for computational phenotyping. This manuscript describes my contributions to the field of computational phenotyping by com- puter vision. After an introduction to the field of Bioimage Informatics as well as some back- ground on High Content Screening, I will describe a number of different projects I have been working on over the last years exemplifying the different types of information that can be studied with images: (1) analysis of morphological phenotypes by supervised learning, (2) analysis of temporal information, in the form of phenotypic and spatial trajectories, (3) analysis of local- ization patterns, i.e. the spatial distributions of biomolecules inside cells and (4) analysis at the tissular scale. These methods have been applied to large-scale screens on cell division and migration, namely the first genome-wide screen by time-lapse microscopy in a human cell line. Some more recent applications include the study of the spatial aspects of gene expression, where we aim at un- derstanding the patterns according to which RNA localize inside cells, as well as the field of digital pathology, where we wish to predict clinical variables, such as outcome or response to treatment, from large stained images of diseased tissue. While often used for diagnostic purpose, histopathology data is also informative about cellular phenotypes and therefore allows to bridge the gap between phenotypic analysis at the cellular level and implications for disease (at the patient level). The most striking evolution in this field is the advent of deep learning, that has revolutionized computer vision over the last years. I will discuss the role deep learning is going to play in the near future with respect to the different applications mentioned above, and the methodological or conceptional developments that are most promising for each application in turn. Altogether, one of the major challenges in bioinformatics today is to establish relationships be- tween the molecular level (e.g. the level of genetic mutations or transcripts) and the level of an entire biological system (e.g. cell or even patient level) by analysis of large-scale omics data sets. These associations need to cross 9 orders of magnitude. The projects and methods I am showing in this manuscript will contribute to bridging this gap.
Nous possédons aujourd’hui les technologies expérimentales et computationnelles pour analyser des génomes, transcriptomes et protéomes dans leur intégralité. Cependant, les méthodes per- mettant la description et l’analyse computationnelle des phénotypes — résultant de cette base moléculaire — sont encore insuffisantes. Or, la description quantitative des divers aspects du phénome est une condition sine qua non pour la connaissance approfondie des relations com- plexes entre génotype et phénotype. Le criblage à haut débit nous permet d’explorer de façon systématique un grand nombre d’aspects du phénome, en particulier en ce qui concerne la morphologie cellulaire, le comportement dy- namique des cellules et la distribution spatiale des transcrits et protéines à l’intérieur des cellules. L’observation et l’analyse du changement de ces propriétés en réponse à des perturbations (e.g. l’extinction d’un gène ou un traitement pharmacologique) font apparaître le lien fonctionnel entre les perturbations agissant au niveau moléculaire et les variables phénotypiques. De façon similaire, l’analyse des coupes histologiques permet d’étudier les changements architecturaux qui interviennent au niveau tissulaire en réponse à une maladie. Le criblage à haut débit et l’histopathologie génèrent donc de grands jeux de données qui donnent accès à une information complémentaire à celle portant sur l’échelle moléculaire, traditionnelle- ment étudiée en bioinformatique. Afin de pleinement exploiter le potentiel de ces données com- plexes et massives, nous avons besoin de méthodes robustes et sophistiquées, capables d’intégrer une grande quantité de caractéristiques d’images. Pour cette raison, la vision par ordinateur s’impose comme choix méthodologique afin d’arriver à une description biologiquement perti- nente. Ce manuscrit décrit mes contributions au domaine du phénotypage computationnel par des méthodes de vision par ordinateur. Après une introduction générale qui portera sur les problé- matiques actuelles en bio-imagerie et le criblage à haut contenu, je décrirai les travaux que j’ai menés ces dernières années au regard des différents types d’information que l’on peut étudier avec des images : (1) L’analyse de phénotypes morphologiques par l’apprentissage supervisé (2) L’analyse de l’information temporelle sous forme de trajectoires phénotypiques et spatiales (3) L’analyse des distributions spatiales de biomolécules à l’intérieur des cellules (4) L’analyse de l’échelle tissulaire. En termes d’applications biologiques, je présenterai l’analyse que j’ai réalisée du premier crible à l’échelle génomique par vidéo-microscopie dans des cellules humaines, qui a permis d’étudier la division et la migration cellulaires. Mes projets plus récents incluent l’étude des aspects spa- tiaux de l’expression génétique, où l’on veut comprendre la répartition spatiale intra-cellulaire des ARNs, ainsi que la pathologie digitale. C’est un sujet en plein essor, dans lequel on souhaite prédire des variables cliniques, comme la réponse au traitement des données histopathologiques. L’évolution la plus remarquable dans ce domaine ces dernières années est la montée de l’apprentis- sage profond, qui a révolutionné la vision par ordinateur. Je discuterai du rôle que l’apprentissage profond jouera en analyse d’images biologiques, ainsi que des développements méthodologiques et conceptuels les plus prometteurs pour chacune des applications mentionnées plus haut. Pour conclure, l’un des défis majeurs en bioinformatique est d’étudier les relations entre le niveau moléculaire (e.g. les mutations génétiques) et le niveau d’un système biologique intégral (e.g. le patient) par l’analyse des données omics. Relier l’un à l’autre nécessite de franchir 9 ordres de grandeur. Les projets et méthodes que je présente dans ce manuscrit contribueront à combler ce fossé.
Fichier principal
Vignette du fichier
ThomasWalter_HDR_2020.pdf (57.97 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

tel-02981391 , version 1 (27-10-2020)

Identifiants

  • HAL Id : tel-02981391 , version 1

Citer

Thomas Walter. Bioimage Informatics for Phenomics. Bioinformatics [q-bio.QM]. Sorbonne Université, 2020. ⟨tel-02981391⟩
146 Consultations
11 Téléchargements

Partager

Gmail Facebook X LinkedIn More