Crédit :Cornell Brand Communications
La vie peut être difficile pour les développeurs d'applications mobiles.
Après avoir créé une application qui aide les utilisateurs à réserver une chambre d'hôtel ou à échanger des points de fidélité, ils doivent déterminer dans quelle mesure l'application fonctionne et comment elle se compare à ses concurrents. Lorsqu'un client écrit une critique en ligne indignée en disant "Je ne peux pas faire défiler correctement !" et ne donne qu'une étoile à l'application, les développeurs doivent résoudre le problème, et vite.
Mais en identifiant exactement pourquoi les utilisateurs sont insatisfaits, sur la base de plusieurs milliers de courtes critiques en ligne, est à forte intensité de main-d'œuvre, chronophage et coûteux, et nécessite plusieurs étapes. Et les enjeux sont élevés. Les applications mobiles qui donnent aux clients une mauvaise expérience peuvent nuire à la marque de l'entreprise, aliéner récompense les clients et augmenter les défections aux concurrents.
Un statisticien de Cornell et ses collègues ont trouvé un moyen plus rapide pour les développeurs d'améliorer les applications mobiles, avec une nouvelle méthode d'exploration de texte qui agrège et analyse les avis des clients en une seule étape.
"L'idée était, pouvez-vous concevoir une méthode qui examinerait toutes les évaluations, et dire que ce sont les sujets dont les gens ne sont pas satisfaits et c'est peut-être là qu'un développeur devrait se concentrer, " a déclaré Shawn Mankad, professeur adjoint d'opérations, gestion de la technologie et de l'information à la Samuel Curtis Johnson Graduate School of Management.
L'idée pourrait avoir des implications importantes pour le commerce mobile, qui devrait atteindre 250 milliards de dollars d'ici 2020. Grâce à la prévalence croissante des smartphones, le commerce mobile a déjà commencé à influencer de manière significative toutes les formes d'activité économique, selon Mankad et ses collègues.
Mankad est l'auteur principal de "Single Stage Prediction with Embedded Topic Modeling of Online Reviews for Mobile App Management, " qui paraîtra dans un prochain numéro du Annales de statistiques appliquées . Les co-auteurs de Mankad sont le candidat au doctorat Cornell Shengli Hu et Anandasivam Gopal de l'Université du Maryland.
Le papier est l'un des nombreux Mankad a écrit avec un 525 $, 000 bourses de la National Science Foundation. L'objectif initial était de créer de nouveaux outils statistiques pour surveiller la stabilité du système financier.
Dans la dernière étude, Mankad et ses collègues ont appliqué ces outils au problème des applications mobiles.
Dans le text mining, une façon courante de représenter des textes est de construire une énorme matrice pour garder une trace des mots qui apparaissent dans quelle critique en ligne. "Cela devient une matrice très large. Et vous avez tellement de colonnes que vous devez les réduire d'une manière ou d'une autre, " a déclaré Mankad. " C'est donc là que nous appliquons la méthode. "
Le modèle, en effet, prend une moyenne pondérée des mots qui apparaissent dans les avis en ligne. Chacune de ces moyennes pondérées représente un sujet de discussion. La méthode fournit non seulement des conseils sur les performances d'une seule application, mais la compare également aux applications concurrentes au fil du temps pour comparer les fonctionnalités et le sentiment des consommateurs.
"L'idée est que vous prenez le texte, tu prends les notes, et il ne fait que sortir ces tableaux de bord que vous pouvez consulter, " a déclaré Mankad.
Ils ont appliqué leur approche à la fois aux données simulées et à plus de 104, 000 avis sur mobile de 162 versions d'applications de trois des agences de voyages en ligne les plus populaires aux États-Unis :Expedia, Kayak et TripAdvisor. Il y avait plus de 1, 000 avis par application et par an.
Mankad et ses collègues ont découvert que leur modèle d'exploration de texte fonctionnait mieux que les méthodes standard pour prévoir la précision à la fois sur des revues réelles et sur des données simulées. Et ils ont découvert que la méthode peut aider les entreprises à peser le pour et le contre de la fréquence à laquelle elles publient de nouvelles versions de leurs applications.
"Dans le text mining, il existe une classe très populaire de méthodes basées sur la modélisation bayésienne. Le domaine peut devenir dogmatique sur la technique à utiliser, " dit Mankad. " Dans ce papier, nous faisons quelque chose de différent en essayant une méthode de factorisation matricielle. Tome, c'est bien d'essayer une nouvelle méthode quand vous pensez qu'elle peut avoir un avantage dans certaines situations."