Annexe VI: Description des données macroplastiques#
Cette méthode s’applique aux données sur les déchets visibles à l’oeil nu, mais pas aux microplastiques
Position#
Les inventaires des déchets menés précédemment sur le lac considéraient la plage comme une unité à part entière. Dans Pla’stock, chaque plage a été divisée en deux sections, la ligne d’eau et la plage sèche. Pour comparer les données de Pla’stock aux résultats précédents et à d’autres études de ce type, les résultats de Pla’stock doivent être transformés en une section pour une plage. En d’autres termes, nous devons combiner la surface des deux sections pour chaque échantillon.
Objets#
La variété des objets identifiés lors de chaque action dépend des déchets sur le terrain et du temps passé à compter, trier et identifier chaque objet collecté. Par conséquent, les seuls codes ou objets pris en considération sont ceux qui ont été identifiés pendant Pla’stock. Les données historiques sont filtrées pour les mêmes codes.
Combinaison d’objets similaires#
Certaines catégories d’objets sont combinées. Cela signifie que nous modifions le code de certains éléments pour refléter les tendances de l’échantillonnage et tenir compte des différentes interprétations du protocole. Le tableau suivant résume la façon dont les codes sont combinés :
Gfrags: g80, g79, g78, g77, g76, g75
Gfoams: G81, G82, G76
Gcaps: G21, G22, G23, G24
Gfrags comprend toutes les formes de plastiques fragmentés de plus de 5 mm, Gfoams toutes les tailles de polystyrène expansé et Gcaps tous les bouchons en plastique et les anneaux en plastique qui accompagnent chaque bouchon.
Exemple#
Mètres carrés#
Pour illustrer les changements apportés aux données, considérons deux échantillons et deux codes (G27, Gfrags). Le premier échantillon est Amphion le 2022-02-01 et le second est Clarens le 2022-01-16. À Amphion, il y a plusieurs valeurs pour les mêmes codes le même jour. Il en va de même pour Clarens, mais à Clarens, il y a également deux substrats pour la plage. Notez que les codes G78 et G79 font partie du code combiné Gfrags.
Plage | Date | Position | Substrat | Aire | Code | Quantité | pcs/m² |
---|---|---|---|---|---|---|---|
Amphion | 01.02.2022 | 2 | 4,00 | 342 | G27 | 4 | 0,01 |
Amphion | 01.02.2022 | 1 | 4,00 | 98 | G78 | 8 | 0,08 |
Amphion | 01.02.2022 | 2 | 4,00 | 342 | G78 | 86 | 0,25 |
Amphion | 01.02.2022 | 1 | 4,00 | 98 | G79 | 12 | 0,12 |
Amphion | 01.02.2022 | 2 | 4,00 | 342 | G79 | 225 | 0,66 |
Amphion | 01.02.2022 | 2 | 4,00 | 342 | G79 | 3 | 0,01 |
Clarens | 16.01.2022 | 2 | 2,00 | 273 | G78 | 5 | 0,02 |
Clarens | 16.01.2022 | 1 | 4,00 | 67 | G27 | 3 | 0,04 |
Clarens | 16.01.2022 | 2 | 2,00 | 273 | G27 | 8 | 0,03 |
Pour combiner les données, nous devons additionner les surfaces pour chaque échantillon, appliquer la nouvelle surface à tous les comptages d’objets pour cet échantillon et ce jour, et supprimer la variable de position. Pour Amphion, la surface totale est de 342 + 98 = 440 m², pour Clarens 273 + 67 = 340 m².
échantillon | Plage | Substrat | Aire | Code | Quantité |
---|---|---|---|---|---|
('amphion', '01.02.2022') | Amphion | 4 | 440 | G79 | 3 |
('amphion', '01.02.2022') | Amphion | 4 | 440 | G27 | 4 |
('amphion', '01.02.2022') | Amphion | 4 | 440 | G78 | 8 |
('amphion', '01.02.2022') | Amphion | 4 | 440 | G79 | 12 |
('amphion', '01.02.2022') | Amphion | 4 | 440 | G78 | 86 |
('amphion', '01.02.2022') | Amphion | 4 | 440 | G79 | 225 |
('clarens', '16.01.2022') | Clarens | 2 | 340 | G78 | 5 |
('clarens', '16.01.2022') | Clarens | 2 | 340 | G27 | 8 |
('clarens', '16.01.2022') | Clarens | 4 | 340 | G27 | 3 |
Après avoir combiné tous les totaux de codes pour chaque échantillon et remplacé le substrat 4 par le substrat 2 dans toutes les localités qui ont des valeurs de substrat distinctes pour la position, nous nous retrouvons encore avec des codes en double sur un échantillon.
échantillon | Plage | Substrat | Aire | Code | Quantité | pcs/m² |
---|---|---|---|---|---|---|
('clarens', '16.01.2022') | Clarens | 2 | 340 | G78 | 5 | 0,01 |
('clarens', '16.01.2022') | Clarens | 2 | 340 | G27 | 8 | 0,02 |
('clarens', '16.01.2022') | Clarens | 2 | 340 | G27 | 3 | 0,01 |
('amphion', '01.02.2022') | Amphion | 4 | 440 | G27 | 4 | 0,01 |
('amphion', '01.02.2022') | Amphion | 4 | 440 | G78 | 94 | 0,21 |
('amphion', '01.02.2022') | Amphion | 4 | 440 | G79 | 240 | 0,55 |
Dans la dernière étape, les codes qui doivent être combinés (G78 et G79) sont placés sous un seul code et les données sont agrégées à l’identifiant de l’échantillon (date et lieu de l’échantillon).
échantillon | Plage | Substrat | Aire | Code | Quantité | pcs/m² |
---|---|---|---|---|---|---|
('amphion', '01.02.2022') | Amphion | 4 | 440 | G27 | 4 | 0,01 |
('amphion', '01.02.2022') | Amphion | 4 | 440 | Gfrags | 334 | 0,76 |
('clarens', '16.01.2022') | Clarens | 2 | 340 | G27 | 11 | 0,03 |
('clarens', '16.01.2022') | Clarens | 2 | 340 | Gfrags | 5 | 0,01 |
La différence#
Si les surfaces des positions ne sont pas combinées, les valeurs attendues sont beaucoup plus faibles. En effet, nous sommes obligés de prendre la moyenne de la densité des deux positions et des substrats pour chaque échantillon.
Plage | Date | Code | pcs/m² |
---|---|---|---|
Amphion | 01.02.2022 | G27 | 0,01 |
Amphion | 01.02.2022 | Gfrags | 0,56 |
Clarens | 16.01.2022 | G27 | 0,04 |
Clarens | 16.01.2022 | Gfrags | 0,02 |
Problème de communication : Cela peut être difficile à communiquer. La moyenne pour une région est la moyenne de la densité totale par échantillon. C’est-à-dire le nombre total d’objets divisé par la surface totale. Cependant, dans ce cas, la moyenne de la région est la moyenne des moyennes par échantillon.
Cela signifie que la médiane d’une région serait la médiane de la moyenne des moyennes par échantillon.
Mètres linéaires#
L’opération de transformation des données en mètres linéaires est différente. Pour convertir toutes les plages en une seule section, nous abandonnons la variable superficie et la remplaçons par les données de longueur fournies. La longueur est la même pour les deux sections de chaque plage (les surfaces sont différentes), nous avons donc divisé la somme de tous les objets par la longueur donnée pour l’échantillon. Ce processus est conforme à la norme décrite dans le guide de surveillance des déchets marins.
L’interpolation linéaire#
L’interpolation linéaire est une méthode pour estimer de nouveaux points de données dans la plage d’un ensemble discret de points de données connus. Elle relie deux points adjacents avec une ligne droite et utilise cette ligne pour estimer la valeur en un nouveau point.
Method: interpolation linéaire des quantiles prévus
Configuration des valeurs de quantiles
Définir les valeurs min et max
Interpoler une fonction de répartition cumulative (CDF)
Échantillonner et inverser la CDF
Estimation du stock de plastique#
Compte tenu de 68 399 m² et de 12 688 mètres linéaires de rivage.
Nombre total de pièces :
Microplastiques calculé au m²: 1’266 712 044 - 1’349 710 956
Macroplastiques calculé au m² : 47,100 - 70,600
Macroplastiques calculé au mètre linéaire: 38’300 - 68’800
Analyse et inférence#
Nous avons utilisé deux méthodes d’approximation pour inférer les résultats attendus : la régression par forêt aléatoire et l’approximation par grille bayésienne. La régression par forêt aléatoire est centrée autour de la moyenne des données observées. Les échantillons tirés de la régression par forêt aléatoire n’approximent pas la distribution des résultats observés, qui sont biaisés. Pour les prédictions, nous avons opté pour l’approximation par grille bayésienne.
Approximation par Grille Bayésienne :
Type de Modèle : Cette approche est ancrée dans les statistiques bayésiennes. Ce n’est pas un modèle spécifique mais une méthode pour estimer ou approximer la distribution postérieure des paramètres du modèle.
Fonctionnement : Implique de spécifier une distribution a priori pour les paramètres, une fonction de vraisemblance basée sur les données, puis d’utiliser des techniques de calcul (comme l’approximation par grille) pour estimer la distribution postérieure des paramètres.
Caractéristiques Clés :
Estimation de l’Incertitude : Fournit une interprétation probabiliste et une manière d’estimer l’incertitude dans les prédictions.
Connaissances Antérieures : Intègre les connaissances ou croyances antérieures sur les paramètres à travers la distribution a priori.
Intensif en Calcul : Pour les espaces de paramètres de haute dimension, l’approximation par grille peut devenir impraticable.
Flexibilité : Peut être appliquée à une large gamme de modèles, y compris les modèles linéaires, modèles hiérarchiques, etc.
Différences clés avec la forêt aléatoire :
Approche Fondamentale : La Forêt Aléatoire est un algorithme d’apprentissage automatique basé sur les arbres de décision, tandis que l’Approximation par Grille Bayésienne est une méthode statistique pour estimer les distributions de paramètres.
Sortie : La Forêt Aléatoire fournit un seul modèle prédictif. Les méthodes Bayésiennes fournissent une distribution de modèles possibles, donnant un sens de l’incertitude.
Complexité et Calcul : La Forêt Aléatoire est généralement simple et moins intensive en calcul par rapport aux méthodes Bayésiennes, en particulier pour les grands ensembles de données ou les modèles avec de nombreux paramètres.
Interprétabilité : Les Forêts Aléatoires peuvent être moins interprétables en raison de la nature d’ensemble de nombreux arbres, tandis que les méthodes Bayésiennes offrent des interprétations probabilistes qui peuvent être perspicaces mais pourraient nécessiter une compréhension statistique plus profonde.
Chaque méthode à ses forces et convient à différents types de problèmes et d’ensembles de données. Le choix entre elles dépend des exigences spécifiques de l’analyse, telles que le besoin de quantification de l’incertitude, les ressources de calcul et la nature des données.
Haut lac#
moyenne | écart-type | min | 25% | 50% | 75% | max | |
---|---|---|---|---|---|---|---|
Haut lac | 3,42 | 3,37 | 0,01 | 0,84 | 2,30 | 4,94 | 16,57 |
moyenne | écart-type | min | 25% | 50% | 75% | max | |
---|---|---|---|---|---|---|---|
Fragments de plastique: g80, g79, g78, g77, g76, g75 | 1,24 | 1,41 | 0,00 | 0,21 | 0,84 | 1,65 | 7,71 |
Mégots et filtres à cigarettes | 0,46 | 0,61 | 0,00 | 0,09 | 0,27 | 0,56 | 3,52 |
Fragments de polystyrène expansé: g81, g82, g83 | 0,59 | 1,16 | 0,00 | 0,12 | 0,26 | 0,60 | 13,20 |
Emballages de bonbons, de snacks | 0,37 | 0,61 | 0,00 | 0,06 | 0,18 | 0,43 | 7,37 |
Coton-tige | 0,22 | 0,25 | 0,00 | 0,06 | 0,15 | 0,29 | 2,84 |
Couvercles en plastique bouteille: g21, g22, g23, g24 | 0,20 | 0,36 | 0,00 | 0,03 | 0,10 | 0,24 | 4,22 |
Bâche, feuille plastique industrielle | 1,56 | 3,09 | 0,00 | 0,02 | 0,05 | 1,18 | 19,19 |
Pellets industriels (gpi) | 0,29 | 1,26 | 0,00 | 0,04 | 0,11 | 0,27 | 18,06 |
Fragments de plastique angulaires <5mm | 0,47 | 1,52 | 0,00 | 0,07 | 0,19 | 0,44 | 19,66 |
Déchets de construction en plastique | 0,23 | 0,38 | 0,00 | 0,05 | 0,14 | 0,30 | 6,94 |
Mousse de plastique pour l'isolation thermique | 0,32 | 0,59 | 0,00 | 0,06 | 0,17 | 0,39 | 7,33 |
Cartouches de fusil de chasse | 0,31 | 1,83 | 0,00 | 0,01 | 0,03 | 0,11 | 18,73 |
Bâtonnets de sucette | 0,34 | 1,87 | 0,00 | 0,02 | 0,05 | 0,11 | 19,82 |
Pailles et agitateurs | 3,42 | 3,37 | 0,01 | 0,84 | 2,30 | 4,94 | 16,57 |
Grand lac#
moyenne | écart-type | min | 25% | 50% | 75% | max | |
---|---|---|---|---|---|---|---|
Grand lac | 2,14 | 2,29 | 0,00 | 0,66 | 1,57 | 2,75 | 16,63 |
moyenne | écart-type | min | 25% | 50% | 75% | max | |
---|---|---|---|---|---|---|---|
Fragments de plastique: g80, g79, g78, g77, g76, g75 | 1,09 | 1,77 | 0,00 | 0,22 | 0,48 | 1,33 | 19,97 |
Mégots et filtres à cigarettes | 0,43 | 0,59 | 0,00 | 0,08 | 0,22 | 0,52 | 4,59 |
Fragments de polystyrène expansé: g81, g82, g83 | 0,36 | 1,18 | 0,00 | 0,05 | 0,12 | 0,27 | 17,45 |
Emballages de bonbons, de snacks | 0,20 | 0,21 | 0,00 | 0,06 | 0,13 | 0,28 | 1,70 |
Coton-tige | 0,21 | 0,84 | 0,00 | 0,05 | 0,10 | 0,23 | 18,05 |
Couvercles en plastique bouteille: g21, g22, g23, g24 | 0,25 | 1,05 | 0,00 | 0,02 | 0,07 | 0,18 | 13,41 |
Bâche, feuille plastique industrielle | 0,34 | 1,51 | 0,00 | 0,04 | 0,10 | 0,25 | 19,94 |
Pellets industriels (gpi) | 0,75 | 1,24 | 0,00 | 0,10 | 0,34 | 0,89 | 11,35 |
Fragments de plastique angulaires <5mm | 0,69 | 1,78 | 0,00 | 0,07 | 0,30 | 0,76 | 17,14 |
Déchets de construction en plastique | 0,65 | 2,89 | 0,00 | 0,01 | 0,02 | 0,03 | 19,79 |
Mousse de plastique pour l'isolation thermique | 0,19 | 1,19 | 0,00 | 0,02 | 0,05 | 0,10 | 16,74 |
Cartouches de fusil de chasse | 0,40 | 2,11 | 0,00 | 0,01 | 0,02 | 0,05 | 18,13 |
Bâtonnets de sucette | 0,25 | 1,63 | 0,00 | 0,01 | 0,03 | 0,08 | 19,32 |
Pailles et agitateurs | 2,14 | 2,29 | 0,00 | 0,66 | 1,57 | 2,75 | 16,63 |
Petit lac#
moyenne | écart-type | min | 25% | 50% | 75% | max | |
---|---|---|---|---|---|---|---|
Petit lac | 1,18 | 1,59 | 0,00 | 0,28 | 0,69 | 1,40 | 14,90 |
moyenne | écart-type | min | 25% | 50% | 75% | max | |
---|---|---|---|---|---|---|---|
Fragments de plastique: g80, g79, g78, g77, g76, g75 | 0,39 | 0,47 | 0,00 | 0,09 | 0,22 | 0,51 | 2,82 |
Mégots et filtres à cigarettes | 0,31 | 0,83 | 0,00 | 0,05 | 0,15 | 0,34 | 16,55 |
Fragments de polystyrène expansé: g81, g82, g83 | 0,26 | 1,72 | 0,00 | 0,01 | 0,02 | 0,05 | 18,32 |
Emballages de bonbons, de snacks | 0,12 | 0,24 | 0,00 | 0,03 | 0,07 | 0,14 | 4,43 |
Coton-tige | 0,21 | 1,28 | 0,00 | 0,02 | 0,06 | 0,14 | 18,23 |
Couvercles en plastique bouteille: g21, g22, g23, g24 | 0,10 | 0,53 | 0,00 | 0,01 | 0,04 | 0,08 | 10,80 |
Bâche, feuille plastique industrielle | 4,16 | 5,95 | 0,00 | 0,29 | 0,79 | 7,14 | 19,99 |
Pellets industriels (gpi) | 0,40 | 0,94 | 0,00 | 0,04 | 0,12 | 0,32 | 11,04 |
Fragments de plastique angulaires <5mm | 0,46 | 0,51 | 0,00 | 0,08 | 0,23 | 0,77 | 5,28 |
Déchets de construction en plastique | 0,82 | 3,19 | 0,00 | 0,00 | 0,02 | 0,04 | 19,93 |
Mousse de plastique pour l'isolation thermique | 0,38 | 2,26 | 0,00 | 0,01 | 0,02 | 0,06 | 19,51 |
Cartouches de fusil de chasse | 1,05 | 3,54 | 0,00 | 0,01 | 0,02 | 0,04 | 19,73 |
Bâtonnets de sucette | 0,43 | 2,48 | 0,00 | 0,01 | 0,02 | 0,04 | 19,62 |
Pailles et agitateurs | 1,18 | 1,59 | 0,00 | 0,28 | 0,69 | 1,40 | 14,90 |
Git repo: https://github.com/AssociationSauvegardeLeman/plastock.git
Git branch: jun14
seaborn : 0.13.1
matplotlib: 3.8.2
pandas : 2.0.3
numpy : 1.26.3