Crédit :CC0 Domaine public
L'omniprésence et le volume considérable de données générées aujourd'hui donnent aux experts de pratiquement tous les domaines des informations suffisantes pour tout suivre, des tendances financières, voies d'évacuation en cas de catastrophe, et la circulation routière, aux migrations animales, les conditions météorologiques, et vecteurs de maladies. Mais utiliser ces données pour créer des visualisations de modèles prédictifs complexes à l'aide de l'apprentissage automatique est un défi pour les experts qui n'ont pas les compétences informatiques requises.
Une équipe du laboratoire de visualisation et d'analyse de données (VIDA) de la NYU Tandon School of Engineering, dirigé par Claudio Silva, professeur au département d'informatique et de génie, développé un framework appelé VisFlow, grâce auquel ceux qui ne sont peut-être pas des experts en apprentissage automatique peuvent créer des visualisations de données très flexibles à partir de presque toutes les données. Par ailleurs, l'équipe a rendu plus facile et plus intuitif l'édition de ces modèles en développant une extension de VisFlow appelée FlowSense, qui permet aux utilisateurs de synthétiser des pipelines d'exploration de données via une interface en langage naturel.
La recherche, "FlowSense:A Natural Language Interface for Visual Data Exploration with a Dataflow System" a remporté le prix du meilleur article lors de la conférence IEEE de cette année sur la science et la technologie de l'analyse visuelle (VAST).
Mardi, 22 octobre Bowen Yu, qui a reçu son doctorat à NYU Tandon sous Silva, présentera l'article lors de la session plénière d'ouverture de la conférence IEEE Visualization (IEEE VIS) à Vancouver, Colombie britannique. L'étude est l'un des nombreux articles mettant en lumière la recherche VIDA qui sera présenté à l'IEEE VIS, le principal lieu de recherche en visualisation et une conférence de premier plan pour l'infographie.
À la conférence, collaborateurs de VIDA, qui s'est imposé comme un centre de recherche de premier plan pour la visualisation de données, présentera des projets de modélisation de visualisation avec des applications en astronomie, Médicament, et la recherche sur le climat développées au centre ou avec le centre :
VisFlow, introduit en 2017 et financé en partie par le programme Data Driven Discovery of Models de la Defense Advanced Research Projects Agency est un cadre basé sur le Web qui permet à l'utilisateur d'utiliser de simples actions de glisser-déposer pour interagir facilement avec les données, permettre aux utilisateurs de créer des modèles de données visuels basés sur des séries temporelles, réseaux, emplacements géographiques, et plus, qui peuvent tous être transformés en un tableau de bord de visualisation compact et interactif.
Yu a déclaré que FlowSense va encore plus loin avec ces capacités. "Imaginez si l'on pouvait simplement parler ou taper une phrase pour activer un diagramme de flux de données, " a-t-il déclaré. " Cette capacité rendrait les utilisateurs non experts plus à l'aise, tout en fournissant aux utilisateurs expérimentés des raccourcis. Nous pensons qu'avec la prise en charge du langage naturel, nous pouvons atténuer la courbe d'apprentissage d'un système comme celui-ci et rendre le flux de données plus accessible", a-t-il déclaré.
Silva, un membre de l'IEEE affilié au Courant Institute for Mathematical Sciences de NYU, Centre de science des données, Centre pour les sciences urbaines et le progrès, et Centre de technologie avancée des télécommunications, ajoutée, "Nous proposons VisFlow et FlowSense en open source, frameworks basés sur du code gratuits sur github, comme un moyen de motiver un développement ultérieur à des fins de visualisation. Il y a vraiment beaucoup plus de recherches qui pourraient être faites dans ce domaine, et j'espère que FlowSense sera un stimulant majeur pour un travail plus collaboratif en rendant les systèmes de flux de données plus flexibles, facile à utiliser, et populaire parmi les analystes de données."