J.-B. Bohuon edited state-of-the-art.md  about 9 years ago

Commit id: 34f38f28a02955b8d4571dad66196ab3fbc0505b

deletions | additions      

       

# Matériel et méthodes État de l'art  ## Matériel Les ontologies au sens de l'ingénierie des connaissances.  Écriture à partir des ressources pédagogiques du master Une ontologie au sens  de physique fondamentale d'Orsay, ainsi que d'ouvrages l'ingénierie des connaissances est la formalisation des connaissances d'un domaine dans un langage formel, comme par exemple OWL (employé dans le cas présent). Ce langage permet l'emploi d'un résonneur (comme Pellet par exemple), et par conséquent la réalisation  de référence en sciences physiques. déductions basées sur les règles formalisées dans le langageêOWL.  ## Langage L'écriture d'une ontologie consiste à indentifier les termes du domaine et à écrire les relations toujours vérifiées du domaine (axiomesmes entre classes et assertions sur les instances de ces classes). La première étape consiste en l'identification des concepts (nommés classe en OWL), et des relations : ObjectProperties (qui relient des concepts) et DatatypeProperties (qui indiquent une relation avec un Literal). Les axiomes et assertions visent à définir précisément les classes, et les propriétés, ainsi qu'à stocker des informations. Au résultat, l'ontologie doit être consistente (aucune contradction) et l'exhaustivité des informations stockées permettra ou non son usage comme une base de connaissances (???).  Le langage choisis est OWL, du Dans le cas des sciences physiques, la communauté  fait de son adaptation pour appel aux connaissances publiées dans  les ontologies journaux scientifiques. Les livres  et qu'il est répandu (REF). En effet, ce langage permet ouvrages de référence du domaine constituent une synthèse de ces publications. La formalisation de ces connaissances dans une base de connaissances doit permettre son usage par la communauté. Une ontologie définit un espace  de stocker noms d'URI utilisable par la communauté. L'usage de ces URI permet la normalisation  des informations relevant références aux concepts partagés du domaine. Par ailleurs, la possibilité de faire des requêtes sur une base de connaissances commune permet  de  faire des requêtes et par conséquent d'exploiter les mêmes connaissances dans les applications.  ## Ontologie fondationnelle  L'ontologie de sciences physiques écrite a trois classes de plus haut niveau (_PhysicalObject_, _Property/Attribute_, _KnowledgeElement_). Il a été fait le choix de placer ces classes de haut niveau au plus bas niveau d'une ontologie fondationnelle. Les sciences physiques constituent une représentation du monde, ## Développement d'ontologies  et par conséquent, l'ontologie fondationnelle doit être descriptive. Par ailleurs, la prise en compte des connaissances (_knowledgeElement_) requiert une ontologie possibliste. problèmes importants  L'ontologie DUL répond La communauté des physicien(ne)s n'a pas adopté d'ontologie de référence. Par ailleurs, peu d'ontologies ont été développées. La comparaison avec le nombre d'ontologies de biologie est  à ces critères et a noter. Plus de 300 ontologies sont disponibles sur bioportal.org. Une explication possible est que contrairement aux problèmes de biologie tels que la question des gènes, les problèmes de sciences traitent généralement d'un nombre limité de conciepts, qui peuvenet être gérés  par conséquent été retenue.  (REF) (onset) une personne ou un groupe de personnes. Seule l'astronomie fait exception à la règle, avec le nombre d'objets cosmiques qui sont l'objet de son étude (astres, galaxies, etc).  Le lien entre l'ontologie fondationnelle DUL et l'ontologie PSO a été réalisée. Un petit module est disponible.  Il est à noter que les sciences physiques sont en partie basées sur les mathématiques. Il est à noter que les mathématiques peuvent être traduits dans une ontologie descriptive (les mathématiques traduisent une représentation du monde) et possibiliste (les objets mathématiques sont des objets abstraits) également. ###  Le choix cas  de DUL est donc en accord avec l'astronomie -  un développement d'une ontologie de mathématiques en parallèle avec l'ontologie PSO. thésaurus  ### Modularité L'astronomie est confronté à la gestion de grands nombres d'astres. Par conséquent, afin de partager des données concernant ces astres, des catalogues d'astres existent (REF) (Nasa, Strasbourg, thésaurus). Une tentative a été faite pour traduire le thésaurus (?) en au format OWL. L'ontologie produite fait appel à différents concepts de physique, de géométrie… et a donc nécessité la traduiction au format OWL de thésaurus correspondants.  Avant tout, le coprus est constitué Cette ontologie inclut des _domain_ et _range_ des propriétés crées. Cependant aucun axiome  de modules. Ces modules peuvent farie appel définition (équivalent classes) n'a été écrit. Seules des assertions de valeurs (DatProperty) sont présents. Par ailleurs, les hypothèses ne sont pas implémentées et donc  les uns aux autres. Cela se traduit par l'import informations qui sont stockées relèvent d'un type unique : l'existence d'un concept (class) ou  d'une ontologie. relation.  Les sciences physique font appel aux mathématiques, et ces deux domaines sont deux disciplines indépendantes. La modularité est nécessaire afin d'assurer le développement des ontologies de manière indépendante. Ceci permet de développer les ontologies nécessaires à une description fine des sciences physiques séparément et de manière complémentaire (dans le but d'être employées par les sciences physiques mais également dans le développement d'une ontologie indépendante du domaine concerné).  Par ailleurs, la gestion des hypothèses requiert que les seuls axiomes (TBox) et assertions (ABox) inclus dans une ontologie ### Quontom - pas  de type PSO-x soit gestion  desaxiomes et assertions valables sous les  hypothèsescorrespondantes. Par conséquent, des modules sont nécessaires.   La physique quantique est une théorie fondatrice en sciences physiques et l'ontologie QuONTOm vise à modéliser la physique quantique. Cependant, les auteurs se sont confrontés à différents problèmes. En particulier, l'écriture d'opérateurs mathématiques n'a pas été possible, du fait de l'absence d'ontologie de mathématiques(REF),  Par ailleurs, les auteurs n'ont pas favorisé l'approche modulaire. Par conséquent, les concepts mathématiques employés dans la définition de concepts de sciences physiques (comme par exemple les observables) n'ont pu être développés en l'absence d'une dynamique de développement d'une ontologie de mathématiques.  ## Traitement à Par ailleurs, cette ontologie ne met pas en place de gestion des hypothèses. Par conséquent, ce qui est stocké dans QuONTOm relève d'axiomes valables dès lors que les hypothèses de  la main physique quantique sont vérifiées. Ceci limite la quantité d'axiomes qui peuvent être stockés dans cette ontologie.  Le développement de l'ontologie est réalisé dans l'optique de traiter des problèmes relevant de la modélisation. Par conséquent, le travail d'écriture de l'ontologie se fait manuellement. La relecture également est réalisée par des individus et est associée à une vérification automatique (résonneur et test conventionnels).  ### Le cas d'OPB - pas de prise en compte de la modélisation des sciences physiques  ## Labels Les biologistes faisant appel à des concepts de physique ont implémentés une ontologie de physique pour la biologie. Cette ontologie définit donc des concepts de physique, de la manière dont ils sont employés en biologie. Cette ontologie est donc à visée appliquée, sans objectif de modéliser. Par ailleurs, de la même manière que les ontologies de biologie ne mettent pas en place de gestion des hypothèses, OBP ne définit que des termes valables à condition que les hypothèses minimales pour la biologie soient vérifées.  Chaque label est écrit en anglais (afin de permettre l'échange avec d'autres ontologies). Les termes choisis ont pour vocation d'être consensuels. (REF) Ces labels ne proviennent On remarque donc qu'il n'y a  pas d'ontologie  de traitement informatisé. description des sciences physiques, et que bien que les sciences physiques soient basées sur la gestion des hypothèses, dans les quelques ontologies existantes, la gestion des hypothèses n'est pas mise en place.  Alignement avec un thésaurus (REF)(ASTRO) ## Gestion des hypothèses  ### Recensement La gestion des hypothèses scientifiques dans l'écriture d'une ontologie est une problématique non résolue par le langage OWL. En effet, le langage OWL a une expressivité limitée, exigeant des choiex de développement dans la gestion des hypothèses.  Recensement des théories ### Singleton Properties  L'approche _Singleton Properties_ (Cambridge) consiste en la définition d'une propriété pour chaque contexte particulier. De cette manière, la proprité _P_ valable si et seulement si la condition _Q_ est vérifiée devra être définie comme une propriété _P1_ fille de la propriété _P_. Cette approche fait l'hypothèse que toutes les propriétés peuvent être écrrites  et a été montrée comme valable du point de vue de l'efficacité. Cependandant, elle exige un travail d'écriture de propriétés démesuré.  ### Réification  Les spécifications de OWL et RDF (Resource Description Framework) spécifient la réification de triplets. Un triple valable sous une hypothèses sera donc constitué d'un jeu de triplets réifié incluant le domaine de validité du triplet ainsi réifié. Le triplet lui-même n'est pas créé. Par conséquent, les requêtes qui pourront être faites sur les informations stockées à l'aide de réification exigent que les requêtes emploient des _patterns_, puisque le triplet lui-même n'est pas existant.  #### Named Graphs  L'emploi de Named Graphs est proposé par le W3C, dans le cadre du stockage d'informations dans  des jeux d'hypothèses de données RDF. Un named Graph est un graph posédant une URI. Par conséquent, des triplet faisant intervenir ce Named Graph être écrits. En particulier, il peut être indiqué sous quelles conditions (le graph est valable).  Dans le cas des ontologies, il n'existe pas de schéma semblable aux Named Graphs. Cependant, une ontologie u format OWL possède une URI et peut être traitée comme un Named Grap. En particulier, il est possible d'écrire des assertions  sur lesquelles elles reposent. Ces liens entre cadres théoriques (_Model_ et _Theory_), les URI des ontologies, et ainsi d gérer les  hypothèses . Cette méthode novatrice est explorée par la suite.  ## Conclusion : motivation pour l'écriture du corpus d'ontologies  Il n'y a pas d'ontologie modélisant les sciences physiques  et modules contenant utilisable comme une base de connaissances. Une première étape à permettant d'écrire une ontologie des sciences physiques consiste donc à mettre en place une gestion des hypothèses, puis à employer cette méthode de geestion des hypothèses pour l'écriture d'une ontologie (base de connaissances )des sciences physiques.  Il n'y a pas d'ontologie disponible pour  les axiomes (_KnowledgePropositionSet_) sont formalisées dans sciences physiques  Pas d'ontologie disponible , alors que domaine hautement logique et que scientifiques intéressés (physiciens et biologistes). et pas de gestion d'hypothèses alors que le domaine  le modules _TH_. requiert. Donc motivation pour l'écriture d'un corpus d'ontologies.