comment Sinequa facilite l’accès aux données de la NASA

comment Sinequa facilite l’accès aux données de la NASA
Descriptive text here

Si l’année dernière, la NASA a déclaré 2023 « l’année de l’open Source », elle a toujours fait de l’accès à ses recherches une priorité. Pour faciliter le partage de données, la Direction des missions scientifiques (SMD) de la NASA a lancé la version bêta du Science Discovery Engine, alimenté par la plateforme Sinequa, leader du marché de la recherche et de l’analyse scientifiques. Données basées sur l’IA.

Co-fondée en 2005 par Jean Ferré et Alexandre Bilger, Sinequa permet aux entreprises de valoriser la masse de données dont elles disposent. Sa solution, combinant un moteur de recherche puissant (Enterprise Search) avec des fonctionnalités avancées de traitement du langage naturel (NLP) et des algorithmes de machine learning, permet d’extraire des informations métiers à partir de données structurées, mais aussi non structurées. . L’entreprise a été l’une des premières à inclure de grands modèles linguistiques (LLM) dans la recherche.

Moteur de découverte scientifique de la NASA

SDE est un élément clé du programme Open Source Science Initiative (OSSI) de la NASA visant à rendre la recherche scientifique financée par des fonds publics transparente, inclusive, accessible et reproductible, ainsi que de son initiative Transform to Open Science (TOPS). dont l’objectif est de créer une culture inclusive de science ouverte capable de répondre aux défis du 21ème siècle.

En 2019, la communauté scientifique a recommandé à la NASA de développer un portail de recherche qui permettrait, à partir d’une interface unique, d’accéder aux contenus des cinq domaines scientifiques de la SMD : astrophysique, sciences biologiques et physiques, sciences de la Terre, héliophysique et sciences planétaires.

En 2020, la solution Enterprise Search de Sinequa a été sélectionnée pour aider la NASA à accéder et à exploiter de manière optimale les informations accumulées sur plusieurs décennies. L’étroite collaboration qui s’est amorcée entre l’équipe Sinequa et les développeurs, chercheurs et data scientists de la NASA a conduit à la création du SDE.

Un ensemble de données hétérogène

Pour mettre en œuvre ce moteur de recherche, les partenaires ont dû relever un défi majeur, outre la quantité de données : leur hétérogénéité et leur complexité, chacun de ses 5 domaines fonctionnant avec ses propres standards et terminologies.

Aujourd’hui, les utilisateurs de SDE peuvent extraire des informations enregistrées à partir de plus de 84 000 ensembles de données et de plus de 715 000 documents, à travers 128 sources d’informations, sites Web, référentiels de données et archives de documents différents. Également intégrée à plus de 44 500 logiciels, modèles et outils scientifiques, la solution de Sequina reconnaît plus de 8 900 termes scientifiques différents, un nombre qui devrait augmenter prochainement.

La nouvelle interface utilisateur

La version bêta du SDE a été lancée en décembre 2022. Depuis, l’interface n’a cessé d’être améliorée afin de proposer des résultats de recherche plus pertinents, une nouvelle version a été mise en ligne en janvier dernier.

Kaylin Bugbee, chef de projet SDE, explique :

« Les scientifiques et les chercheurs passent beaucoup de temps à rechercher et à démêler des données et des informations scientifiques. Les nouvelles mises à jour de l’interface utilisateur SDE font gagner du temps aux chercheurs en les aidant à rechercher rapidement des données et de la documentation par sujet scientifique ou dans l’ensemble de la collection d’informations. Cette amélioration de l’efficacité de la recherche permet aux scientifiques d’accéder plus rapidement à une science ouverte et exploitable ».

Désormais, des fonctionnalités de filtrage supplémentaires offrent aux utilisateurs la possibilité d’effectuer des recherches spécifiques dans un domaine scientifique donné, comme les sciences planétaires ou l’héliophysique, simplifiant ainsi leurs processus de recherche. Parmi les mises à jour figure également un nouvel outil de recherche d’acronymes, permettant une meilleure compréhension du contexte des résultats de recherche et du contenu des documents.

La NASA prévoit d’intégrer davantage de données et de contenu dans les mois à venir, notamment en enrichissant les fonctionnalités de l’interface utilisateur et en poursuivant le développement de l’API du moteur. L’équipe SDE prévoit de son côté un déploiement complet de l’outil à l’automne 2024.

Ulf Zetterberg, co-PDG de Sinequa, conclut :

« Le Science Discovery Engine est une infrastructure fantastique qui aide les scientifiques de la NASA, ainsi que les utilisateurs du monde entier, à trouver les informations dont ils ont besoin en quelques secondes seulement, au lieu de quelques minutes, voire de longues heures. Nous sommes fiers d’aider la NASA à transformer et à améliorer la productivité au sein de son organisation et travaillerons à ses côtés pour combiner de nouveaux ensembles de données et de nouvelles sources d’informations qui alimenteront son moteur de connaissances. Pour la science, la technologie et l’innovation, le partage de données scientifiques et ouvertes est le seul moyen de prospérer. À cet égard, Sinequa se réjouit de jouer un rôle actif dans cette initiative.

 
For Latest Updates Follow us on Google News
 

PREV près du lac de la Cavayère, un nouveau parcours santé composé de huit modules est accessible à tous
NEXT où regarder la brillante parodie des Feux de l’amour ? – .