Architecture de base de la procédure d'apprentissage dans la méthode de la forêt aléatoire. Crédit :SIOM
L'apprentissage automatique est une branche importante dans le domaine de l'intelligence artificielle. Son idée de base est de construire un modèle statistique basé sur des données et d'utiliser le modèle pour analyser et prédire les données. Avec le développement rapide de la technologie Big Data, les algorithmes d'apprentissage automatique basés sur les données ont commencé à prospérer dans divers domaines de la recherche sur les matériaux.
Récemment, une équipe de recherche dirigée par le professeur Wang Jun de l'Institut d'optique et de mécanique fine de Shanghai de l'Académie chinoise des sciences (CAS) a proposé une méthode de reconnaissance pour distinguer le film continu monocouche et les zones de défauts aléatoires de deux dimensions (2-D) semi-conducteurs en utilisant la méthode d'apprentissage automatique avec des signaux Raman.
Leurs travaux ont révélé le potentiel d'application des algorithmes d'apprentissage automatique dans le domaine de la spectroscopie des matériaux 2D, et a été publié dans Nanomaterials.
Le spectre Raman des matériaux 2D est très sensible à la liaison moléculaire et à la structure de l'échantillon, et peut être utilisé pour la recherche et l'analyse de l'identification chimique, morphologie et phase, pression/stress interne, et composition. Bien que la spectroscopie Raman fournisse suffisamment d'informations, comment exploiter la profondeur de l'information et utiliser plusieurs informations pour prendre des décisions globales nécessite encore des recherches plus approfondies.
Dans cette étude, les chercheurs ont utilisé diverses informations sur les caractéristiques, notamment la fréquence Raman et l'intensité du MoS2. Ils ont utilisé le processus d'échantillonnage bootstrap pour obtenir des sous-ensembles d'apprentissage contenant différentes informations de localisation spatiale, et établi un modèle de forêt aléatoire composé d'un certain nombre de décisions à travers la procédure d'apprentissage.
Lorsqu'un nouveau point d'échantillonnage entre dans le modèle pour la prédiction et le jugement, chaque arbre de décision dans la forêt aléatoire fera des jugements indépendants, et ensuite donner des résultats de prédiction relativement précis par le biais d'un vote à la majorité. En plus de juger les échantillons monocouche et bicouche, le modèle peut également prédire les fissures et les noyaux distribués de manière aléatoire qui sont facilement introduits lors de la croissance de l'échantillon.
Le programme de recherche proposé dans ce travail introduit des algorithmes d'apprentissage automatique dans l'étude de la spectroscopie bidimensionnelle des matériaux, et peut être étendu à d'autres matériaux, fournissant des solutions importantes pour la caractérisation des matériaux dans différents domaines.