• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Autres
    L'examen des lois sur le verrouillage de Sydney met en évidence le rôle vital d'une analyse transparente des données

    Carte de Sydney et des quartiers de divertissement tels qu'utilisés par BOCSAR dans son analyse :bleu – quartier de divertissement CBD ; rouge – quartier des divertissements de Kings Cross; vert – zones de déplacement à proximité ; jaune – zones de déplacement extérieures. Crédit : Center for Translational Data Science, Auteur fourni

    Le Bureau des statistiques et de la recherche sur la criminalité de la Nouvelle-Galles du Sud (BOCSAR) a récemment revendiqué la réglementation de Sydney sur les licences d'alcool, communément appelées lois de verrouillage, réduit les agressions non domestiques de 13% dans le CBD. Son calcul reposait sur une décision d'allouer 1, 837 de ces infractions à la fois à Kings Cross et à la CDB, c'est-à-dire compter deux fois les données. Notre analyse a révélé que cette décision était essentielle pour conclure que les agressions avaient diminué dans le CBD. Pour tous les autres choix concernant les domaines auxquels les données sur les infractions ont été attribuées et le type d'analyse, nous n'avons trouvé aucune diminution.

    Nos résultats mettent en évidence une question importante :comment les choix de collecte de données, le prétraitement et l'analyse affectent les décisions politiques ?

    L'affectation des crimes à des zones n'est qu'un des nombreux choix effectués lors de l'utilisation des données pour évaluer les impacts des politiques. D'autres choix incluent la façon de mesurer les crimes violents, la période à considérer et l'étendue géographique des zones à inclure. La question est :si d'autres choix étaient faits, les résultats affecteraient-ils une décision d'abroger ou de maintenir les lois ?

    Nos résultats soulignent la nécessité de suivre quelques principes lors de l'utilisation des données pour éclairer l'élaboration des politiques. D'abord, l'institution qui collecte les données et l'institution qui analyse les données doivent être indépendantes l'une de l'autre. Seconde, nous avons besoin d'autant de transparence sur les données et leur analyse que possible.

    Alors qu'ont montré exactement les analyses ?

    BOCSAR a choisi d'utiliser les agressions non domestiques mensuelles à partir de 2009. Il n'y a rien de mal avec ces choix, mais d'autres auraient pu être réalisés.

    Par exemple, pourquoi à partir de 2009, pas de 2005 ? Pourquoi mensuellement, pas tous les jours ? Pourquoi les agressions non domestiques signalées, pas signalé des agressions causant des lésions corporelles graves? Pourquoi diviser la zone en CBD et Kings Cross uniquement ?

    Une façon d'évaluer l'impact de tels choix est d'utiliser différents sous-ensembles de données, différents types de prétraitement des données et différentes techniques statistiques et/ou d'apprentissage automatique. Si la conclusion reste la même, alors notre décision est robuste à cette source de variabilité. Si non, nous devons comprendre pourquoi.

    Pour le quartier de Kings Cross, l'analyse du Center for Translational Data Science de l'Université de Sydney a montré que la conclusion restait inchangée quelles que soient la fréquence et la période de collecte des données et de l'analyse effectuée. Les agressions non domestiques avaient diminué après l'introduction des lois sur le verrouillage en 2014.

    Pour le CBD, l'inverse était vrai. Seulement si on fait exactement les mêmes choix que BOCSAR, en attribuant notamment 1, 837 crimes à la fois à la CDB et à King Cross, Pouvons-nous conclure que les agressions non domestiques avaient très légèrement diminué.

    Sous toutes les autres variantes des analyses, y compris les données, méthodologie et répartition spatiale de ces données, nous n'avons trouvé aucune diminution. Les agressions non domestiques dans le CBD étaient en baisse depuis 2008 et, si quoi que ce soit, plus lentement après l'entrée en vigueur des lois sur le verrouillage.

    Alors pourquoi l'inclusion de 1, 837 crimes si critiques aux conclusions sur la CDB ?

    En utilisant les données fournies par BOCSAR, nous avons tracé l'emplacement le plus probable de ces 1, 837 délits. La figure 1 montre que ces crimes se sont produits principalement à Kings Cross, une zone dans laquelle le taux de criminalité avait baissé depuis 2014. Nous disons « emplacement le plus probable » car nous n'avons pas encore reçu les données supplémentaires que nous avons demandées à BOCSAR pour nous aider à localiser exactement où ces crimes ont eu lieu.

    Nombre de crimes (par région SA1) attribués à la fois à la CDB et à Kings Cross. Crédit : Center for Translational Data Science, Auteur fourni

    Avec la suppression de ces 1, 837 crimes de la CDB, nous n'avons détecté aucune diminution des agressions non domestiques. Mais BOCSAR l'a apparemment fait. Après avoir retiré ces crimes de la CDB, BOCSAR a publié un rapport mis à jour à une enquête parlementaire sur l'économie nocturne de Sydney. Ce rapport affirmait que les agressions dans le CBD avaient diminué de 4 % (beaucoup moins que les 13 %).

    Le comité a ensuite demandé nos commentaires. Nous avons constaté que le rapport ne fournissait pas d'intervalle de confiance pour cette diminution. Pourtant, le rapport a fait une vertu de rapporter des estimations d'incertitude pour d'autres quantités et ailleurs, il a revendiqué des résultats « statistiquement significatifs ».

    Nous avons répliqué l'analyse de BOCSAR et constaté que le changement de la criminalité aurait pu être aussi faible qu'une diminution de 12% et aussi élevé qu'une augmentation de 6%. En d'autres termes, le résultat est "statistiquement non significatif".

    Quelles sont les implications pour l'élaboration des politiques?

    Pourquoi est-ce important ? Il y a deux raisons.

    D'abord, le danger de ne pas expliquer, quantifier et rapporter l'incertitude est que le public perd confiance dans l'élaboration de politiques fondées sur les données. Ce n'est que si les conclusions reconnaissent et expliquent l'incertitude inhérente à la déduction de quantités complexes à partir de données que nous pouvons prendre des décisions politiques solides et explicables qui renforcent la confiance du public.

    Seconde, si nous n'acceptons pas et ne signalons pas l'incertitude, nous pourrions arrêter de chercher d'autres explications. Nous pourrions alors ne pas parvenir à un résultat que tout le monde souhaite :une réduction de la violence et une économie nocturne saine.

    Comment procédons-nous à partir d'ici ? Nous ferions deux recommandations :

    1. L'institution qui collecte et conserve les données doit être distincte, informés mais indépendants de la ou des institutions qui analysent les données.
    2. Il devrait y avoir autant de transparence des données que possible, qui permettrait à différents groupes d'effectuer différents types d'analyses, en utilisant différentes sources de données.

    Nous sommes presque certains que ces différents groupes produiraient des résultats différents, mais la discussion qui s'ensuit pourrait fournir des informations qui nous rapprochent de décisions politiques plus solides et acceptables.

    Pour citer le physicien Richard Feynman, lauréat du prix Nobel :« Si seulement nous permettions cela, au fur et à mesure que nous progressons, nous restons incertains, nous laisserons des opportunités d'alternatives … pour progresser, il faut laisser la porte de l'inconnu entrouverte."

    La recommandation du comité parlementaire selon laquelle BOCSAR et le Center for Translational Data Science travaillent ensemble plus étroitement semble faire exactement cela. Nous attendons avec impatience une collaboration continue pour approfondir notre compréhension des moteurs des crimes violents.

    Cet article est republié à partir de The Conversation sous une licence Creative Commons. Lire l'article original.




    © Science https://fr.scienceaq.com