Professeur d'informatique NUS Ooi Beng Chin et directeur du NUS Smart Systems Institute (debout, troisième à partir de la droite) a dirigé l'équipe NUS qui a développé Apache SINGA. Crédit :NUS
Une équipe de chercheurs de l'Université nationale de Singapour (NUS) a placé Singapour sur la carte mondiale de l'intelligence artificielle (IA) et de l'analyse des mégadonnées. Leur projet open source, appelé Apache SINGA, « diplômé » de l'incubateur Apache le 16 octobre 2019 et est désormais le premier projet de haut niveau (TLP) d'Asie du Sud-Est dans le cadre de l'Apache Software Foundation, la plus grande communauté de logiciels open source au monde.
Être reconnu comme un TLP n'est pas une mince affaire car Apache SINGA rejoint désormais les rangs des principaux outils open source tels que Apache HTTP Server et Apache Kafka. Bien que le nom ne sonne pas immédiatement, Apache Kafka propulse les solutions Big Data chez Airbnb, LinkedIn, Netflix, Pay Pal, Spotify et de nombreuses autres sociétés. Le serveur HTTP Apache est le serveur Web le plus populaire au monde et dessert actuellement 29 % de tous les sites Web actifs sur Internet.
Dirigé par le professeur Ooi Beng Chin, Apache SINGA a été lancé par le groupe de recherche sur le système de base de données de la NUS School of Computing avec l'Université du Zhejiang et NetEase en 2014. Le prototype a été soumis à Apache Incubator en mars 2015, et la première sortie officielle a été faite en octobre 2015. Depuis lors, les chercheurs du NUS ont reçu le soutien de la National Research Foundation Singapore, Ministère de l'Éducation, et l'Agence pour la science, Technologie et recherche.
Le professeur Ooi a dit, « Nous avons constaté une demande croissante de plates-formes d'apprentissage en profondeur et de machines en 2012, mais il y avait un manque de plates-formes distribuées efficaces. La remise des diplômes est une marque de reconnaissance pour Apache SINGA, Mais ce n'est que le début. Nous espérons qu'Apache SINGA pourra avoir un impact sur l'apprentissage en profondeur de la même manière que les serveurs HTTP Apache l'ont fait pour les serveurs de sites Web."
L'apprentissage en profondeur est un sous-ensemble de l'apprentissage automatique qui cherche à tirer parti des réseaux de neurones artificiels pour générer des informations significatives à partir de grandes quantités de données. Alors que l'apprentissage automatique nécessite généralement que les humains fournissent des données structurées, l'apprentissage en profondeur peut structurer les données brutes par lui-même. Un exemple serait d'identifier l'image d'un chat; l'apprentissage automatique nécessitera une intervention humaine pour définir qu'un chat a des caractéristiques telles que des moustaches, oreilles et pattes pointues. L'apprentissage en profondeur analysera plusieurs images de chats à travers divers algorithmes pour déterminer toutes les caractéristiques par lui-même, simuler un cerveau artificiel.
Cependant, la limitation de l'apprentissage en profondeur est qu'il nécessite une quantité astronomique de données qui à son tour nécessite beaucoup de puissance de calcul. Un système centralisé typique nécessiterait un seul superordinateur pour traiter toutes ces informations, ce qui n'est pas une option pour la plupart des organisations. L'approche système distribuée d'Apache SINGA permet de surmonter le besoin d'un seul superordinateur car elle répartit la charge de travail sur un grand nombre d'ordinateurs normaux.
Apache SINGA alimente actuellement des applications dans plusieurs secteurs, notamment la santé, bancaire et financier, développement de logiciels et cybersécurité. Une de ces applications est FoodLG, qui utilise la reconnaissance d'images pour identifier un plat sur la base de la photo téléchargée par l'utilisateur final. Cinq hôpitaux de Singapour utilisent actuellement différentes versions de FoodLG pour promouvoir un mode de vie sain et faciliter la gestion des maladies telles que le diabète, hypertension et taux de cholestérol élevé.
L'hôpital universitaire national (NUH) et l'hôpital général de Singapour exploitent également Apache SINGA pour analyser les images IRM et radiographiques afin d'améliorer l'identification des problèmes de santé. En outre, NUH utilise des modèles formés sur Apache SINGA pour la modélisation de la progression de la maladie et la modélisation de la réadmission des patients. Dans le domaine de la cybersécurité, SecureAge développe des modèles d'apprentissage en profondeur de détection de logiciels malveillants à l'aide d'Apache SINGA pour identifier les logiciels malveillants avec plus de précision, ainsi que l'identification de nouveaux types de logiciels malveillants sur la base de données passées. Les banques locales, d'autre part, utilisent également Apache SINGA pour développer et former des modèles de modélisation des risques et de résolution de la conformité à la lutte contre le blanchiment d'argent.
La prochaine étape pour Apache SINGA est d'améliorer son système afin que même les non-experts en IA puissent l'utiliser et de se préparer à l'ère de la 5G en le rationalisant pour qu'il s'exécute sur des appareils de périphérie.