Annexe VI: Description des données macroplastiques#

Cette méthode s’applique aux données sur les déchets visibles à l’oeil nu, mais pas aux microplastiques

Position#

Les inventaires des déchets menés précédemment sur le lac considéraient la plage comme une unité à part entière. Dans Pla’stock, chaque plage a été divisée en deux sections, la ligne d’eau et la plage sèche. Pour comparer les données de Pla’stock aux résultats précédents et à d’autres études de ce type, les résultats de Pla’stock doivent être transformés en une section pour une plage. En d’autres termes, nous devons combiner la surface des deux sections pour chaque échantillon.

Objets#

La variété des objets identifiés lors de chaque action dépend des déchets sur le terrain et du temps passé à compter, trier et identifier chaque objet collecté. Par conséquent, les seuls codes ou objets pris en considération sont ceux qui ont été identifiés pendant Pla’stock. Les données historiques sont filtrées pour les mêmes codes.

Combinaison d’objets similaires#

Certaines catégories d’objets sont combinées. Cela signifie que nous modifions le code de certains éléments pour refléter les tendances de l’échantillonnage et tenir compte des différentes interprétations du protocole. Le tableau suivant résume la façon dont les codes sont combinés :

  1. Gfrags: g80, g79, g78, g77, g76, g75

  2. Gfoams: G81, G82, G76

  3. Gcaps: G21, G22, G23, G24

Gfrags comprend toutes les formes de plastiques fragmentés de plus de 5 mm, Gfoams toutes les tailles de polystyrène expansé et Gcaps tous les bouchons en plastique et les anneaux en plastique qui accompagnent chaque bouchon.

Exemple#

Mètres carrés#

Pour illustrer les changements apportés aux données, considérons deux échantillons et deux codes (G27, Gfrags). Le premier échantillon est Amphion le 2022-02-01 et le second est Clarens le 2022-01-16. À Amphion, il y a plusieurs valeurs pour les mêmes codes le même jour. Il en va de même pour Clarens, mais à Clarens, il y a également deux substrats pour la plage. Notez que les codes G78 et G79 font partie du code combiné Gfrags.

Table A6-1 : Les résultats de l'échantillon avant la combinaison des codes, des substrats et de la position
Plage Date Position Substrat Aire Code Quantité pcs/m²
Amphion 01.02.2022 2 4,00 342 G27 4 0,01
Amphion 01.02.2022 1 4,00 98 G78 8 0,08
Amphion 01.02.2022 2 4,00 342 G78 86 0,25
Amphion 01.02.2022 1 4,00 98 G79 12 0,12
Amphion 01.02.2022 2 4,00 342 G79 225 0,66
Amphion 01.02.2022 2 4,00 342 G79 3 0,01
Clarens 16.01.2022 2 2,00 273 G78 5 0,02
Clarens 16.01.2022 1 4,00 67 G27 3 0,04
Clarens 16.01.2022 2 2,00 273 G27 8 0,03



Pour combiner les données, nous devons additionner les surfaces pour chaque échantillon, appliquer la nouvelle surface à tous les comptages d’objets pour cet échantillon et ce jour, et supprimer la variable de position. Pour Amphion, la surface totale est de 342 + 98 = 440 m², pour Clarens 273 + 67 = 340 m².

Table A6-2 : La variable position est supprimée et les surfaces sont combinées pour chaque position de chaque échantillon. Cependant, le substrat à Clarens n'est pas corrigé.
échantillon Plage Substrat Aire Code Quantité
('amphion', '01.02.2022') Amphion 4 440 G79 3
('amphion', '01.02.2022') Amphion 4 440 G27 4
('amphion', '01.02.2022') Amphion 4 440 G78 8
('amphion', '01.02.2022') Amphion 4 440 G79 12
('amphion', '01.02.2022') Amphion 4 440 G78 86
('amphion', '01.02.2022') Amphion 4 440 G79 225
('clarens', '16.01.2022') Clarens 2 340 G78 5
('clarens', '16.01.2022') Clarens 2 340 G27 8
('clarens', '16.01.2022') Clarens 4 340 G27 3



Après avoir combiné tous les totaux de codes pour chaque échantillon et remplacé le substrat 4 par le substrat 2 dans toutes les localités qui ont des valeurs de substrat distinctes pour la position, nous nous retrouvons encore avec des codes en double sur un échantillon.

Table A6-3 : Après avoir combiné les codes et supprimé la variable de la position, il reste des codes en double pour l'échantillon de Clarens.
échantillon Plage Substrat Aire Code Quantité pcs/m²
('clarens', '16.01.2022') Clarens 2 340 G78 5 0,01
('clarens', '16.01.2022') Clarens 2 340 G27 8 0,02
('clarens', '16.01.2022') Clarens 2 340 G27 3 0,01
('amphion', '01.02.2022') Amphion 4 440 G27 4 0,01
('amphion', '01.02.2022') Amphion 4 440 G78 94 0,21
('amphion', '01.02.2022') Amphion 4 440 G79 240 0,55



Dans la dernière étape, les codes qui doivent être combinés (G78 et G79) sont placés sous un seul code et les données sont agrégées à l’identifiant de l’échantillon (date et lieu de l’échantillon).

Table A6-4 : The density of sample if the areas are combined. The result for each sample is the sum of the different results for the different positions and substrates for each sample.
échantillon Plage Substrat Aire Code Quantité pcs/m²
('amphion', '01.02.2022') Amphion 4 440 G27 4 0,01
('amphion', '01.02.2022') Amphion 4 440 Gfrags 334 0,76
('clarens', '16.01.2022') Clarens 2 340 G27 11 0,03
('clarens', '16.01.2022') Clarens 2 340 Gfrags 5 0,01



La différence#

Si les surfaces des positions ne sont pas combinées, les valeurs attendues sont beaucoup plus faibles. En effet, nous sommes obligés de prendre la moyenne de la densité des deux positions et des substrats pour chaque échantillon.

Table A6-5 : La densité de l'échantillon si les zones et les substrats ne sont pas combinés pour chaque échantillon.
Plage Date Code pcs/m²
Amphion 01.02.2022 G27 0,01
Amphion 01.02.2022 Gfrags 0,56
Clarens 16.01.2022 G27 0,04
Clarens 16.01.2022 Gfrags 0,02



Problème de communication : Cela peut être difficile à communiquer. La moyenne pour une région est la moyenne de la densité totale par échantillon. C’est-à-dire le nombre total d’objets divisé par la surface totale. Cependant, dans ce cas, la moyenne de la région est la moyenne des moyennes par échantillon.

Cela signifie que la médiane d’une région serait la médiane de la moyenne des moyennes par échantillon.

Mètres linéaires#

L’opération de transformation des données en mètres linéaires est différente. Pour convertir toutes les plages en une seule section, nous abandonnons la variable superficie et la remplaçons par les données de longueur fournies. La longueur est la même pour les deux sections de chaque plage (les surfaces sont différentes), nous avons donc divisé la somme de tous les objets par la longueur donnée pour l’échantillon. Ce processus est conforme à la norme décrite dans le guide de surveillance des déchets marins.

L’interpolation linéaire#

L’interpolation linéaire est une méthode pour estimer de nouveaux points de données dans la plage d’un ensemble discret de points de données connus. Elle relie deux points adjacents avec une ligne droite et utilise cette ligne pour estimer la valeur en un nouveau point.

Method: interpolation linéaire des quantiles prévus

  1. Configuration des valeurs de quantiles

  2. Définir les valeurs min et max

  3. Interpoler une fonction de répartition cumulative (CDF)

  4. Échantillonner et inverser la CDF

Estimation du stock de plastique#

Compte tenu de 68 399 m² et de 12 688 mètres linéaires de rivage.

Nombre total de pièces :

  • Microplastiques calculé au m²: 1’266 712 044 - 1’349 710 956

  • Macroplastiques calculé au m² : 47,100 - 70,600

  • Macroplastiques calculé au mètre linéaire: 38’300 - 68’800

Analyse et inférence#

Nous avons utilisé deux méthodes d’approximation pour inférer les résultats attendus : la régression par forêt aléatoire et l’approximation par grille bayésienne. La régression par forêt aléatoire est centrée autour de la moyenne des données observées. Les échantillons tirés de la régression par forêt aléatoire n’approximent pas la distribution des résultats observés, qui sont biaisés. Pour les prédictions, nous avons opté pour l’approximation par grille bayésienne.

Approximation par Grille Bayésienne :

  • Type de Modèle : Cette approche est ancrée dans les statistiques bayésiennes. Ce n’est pas un modèle spécifique mais une méthode pour estimer ou approximer la distribution postérieure des paramètres du modèle.

  • Fonctionnement : Implique de spécifier une distribution a priori pour les paramètres, une fonction de vraisemblance basée sur les données, puis d’utiliser des techniques de calcul (comme l’approximation par grille) pour estimer la distribution postérieure des paramètres.

  • Caractéristiques Clés :

    • Estimation de l’Incertitude : Fournit une interprétation probabiliste et une manière d’estimer l’incertitude dans les prédictions.

    • Connaissances Antérieures : Intègre les connaissances ou croyances antérieures sur les paramètres à travers la distribution a priori.

    • Intensif en Calcul : Pour les espaces de paramètres de haute dimension, l’approximation par grille peut devenir impraticable.

    • Flexibilité : Peut être appliquée à une large gamme de modèles, y compris les modèles linéaires, modèles hiérarchiques, etc.

Différences clés avec la forêt aléatoire :

  • Approche Fondamentale : La Forêt Aléatoire est un algorithme d’apprentissage automatique basé sur les arbres de décision, tandis que l’Approximation par Grille Bayésienne est une méthode statistique pour estimer les distributions de paramètres.

  • Sortie : La Forêt Aléatoire fournit un seul modèle prédictif. Les méthodes Bayésiennes fournissent une distribution de modèles possibles, donnant un sens de l’incertitude.

  • Complexité et Calcul : La Forêt Aléatoire est généralement simple et moins intensive en calcul par rapport aux méthodes Bayésiennes, en particulier pour les grands ensembles de données ou les modèles avec de nombreux paramètres.

  • Interprétabilité : Les Forêts Aléatoires peuvent être moins interprétables en raison de la nature d’ensemble de nombreux arbres, tandis que les méthodes Bayésiennes offrent des interprétations probabilistes qui peuvent être perspicaces mais pourraient nécessiter une compréhension statistique plus profonde.

Chaque méthode à ses forces et convient à différents types de problèmes et d’ensembles de données. Le choix entre elles dépend des exigences spécifiques de l’analyse, telles que le besoin de quantification de l’incertitude, les ressources de calcul et la nature des données.

Haut lac#

Table A6-6 : Haut lac, la distribution attendue des résultats des échantillons pour 2024.
  moyenne écart-type min 25% 50% 75% max
Haut lac 3,42 3,37 0,01 0,84 2,30 4,94 16,57
Table A6-7 : Haut lac, La distribution attendue des objets les plus courants 2024..
  moyenne écart-type min 25% 50% 75% max
Fragments de plastique: g80, g79, g78, g77, g76, g75 1,24 1,41 0,00 0,21 0,84 1,65 7,71
Mégots et filtres à cigarettes 0,46 0,61 0,00 0,09 0,27 0,56 3,52
Fragments de polystyrène expansé: g81, g82, g83 0,59 1,16 0,00 0,12 0,26 0,60 13,20
Emballages de bonbons, de snacks 0,37 0,61 0,00 0,06 0,18 0,43 7,37
Coton-tige 0,22 0,25 0,00 0,06 0,15 0,29 2,84
Couvercles en plastique bouteille: g21, g22, g23, g24 0,20 0,36 0,00 0,03 0,10 0,24 4,22
Bâche, feuille plastique industrielle 1,56 3,09 0,00 0,02 0,05 1,18 19,19
Pellets industriels (gpi) 0,29 1,26 0,00 0,04 0,11 0,27 18,06
Fragments de plastique angulaires <5mm 0,47 1,52 0,00 0,07 0,19 0,44 19,66
Déchets de construction en plastique 0,23 0,38 0,00 0,05 0,14 0,30 6,94
Mousse de plastique pour l'isolation thermique 0,32 0,59 0,00 0,06 0,17 0,39 7,33
Cartouches de fusil de chasse 0,31 1,83 0,00 0,01 0,03 0,11 18,73
Bâtonnets de sucette 0,34 1,87 0,00 0,02 0,05 0,11 19,82
Pailles et agitateurs 3,42 3,37 0,01 0,84 2,30 4,94 16,57

Grand lac#

Table A6-8 : Grand lac, la distribution attendue des résultats des échantillons pour 2024.
  moyenne écart-type min 25% 50% 75% max
Grand lac 2,14 2,29 0,00 0,66 1,57 2,75 16,63
Table A6-9 : Grand lac, La distribution attendue des objets les plus courants 2024.
  moyenne écart-type min 25% 50% 75% max
Fragments de plastique: g80, g79, g78, g77, g76, g75 1,09 1,77 0,00 0,22 0,48 1,33 19,97
Mégots et filtres à cigarettes 0,43 0,59 0,00 0,08 0,22 0,52 4,59
Fragments de polystyrène expansé: g81, g82, g83 0,36 1,18 0,00 0,05 0,12 0,27 17,45
Emballages de bonbons, de snacks 0,20 0,21 0,00 0,06 0,13 0,28 1,70
Coton-tige 0,21 0,84 0,00 0,05 0,10 0,23 18,05
Couvercles en plastique bouteille: g21, g22, g23, g24 0,25 1,05 0,00 0,02 0,07 0,18 13,41
Bâche, feuille plastique industrielle 0,34 1,51 0,00 0,04 0,10 0,25 19,94
Pellets industriels (gpi) 0,75 1,24 0,00 0,10 0,34 0,89 11,35
Fragments de plastique angulaires <5mm 0,69 1,78 0,00 0,07 0,30 0,76 17,14
Déchets de construction en plastique 0,65 2,89 0,00 0,01 0,02 0,03 19,79
Mousse de plastique pour l'isolation thermique 0,19 1,19 0,00 0,02 0,05 0,10 16,74
Cartouches de fusil de chasse 0,40 2,11 0,00 0,01 0,02 0,05 18,13
Bâtonnets de sucette 0,25 1,63 0,00 0,01 0,03 0,08 19,32
Pailles et agitateurs 2,14 2,29 0,00 0,66 1,57 2,75 16,63

Petit lac#

Table A6-10 : Petit lac, la distribution attendue des résultats des échantillons pour 2024.
  moyenne écart-type min 25% 50% 75% max
Petit lac 1,18 1,59 0,00 0,28 0,69 1,40 14,90
Table A6-11 : Petit lac, La distribution attendue des objets les plus courants 2024.
  moyenne écart-type min 25% 50% 75% max
Fragments de plastique: g80, g79, g78, g77, g76, g75 0,39 0,47 0,00 0,09 0,22 0,51 2,82
Mégots et filtres à cigarettes 0,31 0,83 0,00 0,05 0,15 0,34 16,55
Fragments de polystyrène expansé: g81, g82, g83 0,26 1,72 0,00 0,01 0,02 0,05 18,32
Emballages de bonbons, de snacks 0,12 0,24 0,00 0,03 0,07 0,14 4,43
Coton-tige 0,21 1,28 0,00 0,02 0,06 0,14 18,23
Couvercles en plastique bouteille: g21, g22, g23, g24 0,10 0,53 0,00 0,01 0,04 0,08 10,80
Bâche, feuille plastique industrielle 4,16 5,95 0,00 0,29 0,79 7,14 19,99
Pellets industriels (gpi) 0,40 0,94 0,00 0,04 0,12 0,32 11,04
Fragments de plastique angulaires <5mm 0,46 0,51 0,00 0,08 0,23 0,77 5,28
Déchets de construction en plastique 0,82 3,19 0,00 0,00 0,02 0,04 19,93
Mousse de plastique pour l'isolation thermique 0,38 2,26 0,00 0,01 0,02 0,06 19,51
Cartouches de fusil de chasse 1,05 3,54 0,00 0,01 0,02 0,04 19,73
Bâtonnets de sucette 0,43 2,48 0,00 0,01 0,02 0,04 19,62
Pailles et agitateurs 1,18 1,59 0,00 0,28 0,69 1,40 14,90
Git repo: https://github.com/AssociationSauvegardeLeman/plastock.git

Git branch: jun14

seaborn   : 0.13.1
matplotlib: 3.8.2
pandas    : 2.0.3
numpy     : 1.26.3