Sluit banner

2022-07-22 17:31:20 By : Mr. wills Wang

Bedankt voor uw bezoek aan nature.com.U gebruikt een browserversie met beperkte ondersteuning voor CSS.Voor de beste ervaring raden we u aan een meer up-to-date browser te gebruiken (of de compatibiliteitsmodus in Internet Explorer uit te schakelen).Om voortdurende ondersteuning te garanderen, geven we de site in de tussentijd weer zonder stijlen en JavaScript.Scientific Reports volume 12, Artikelnummer: 12346 (2022 ) Citeer dit artikelMenselijke activiteiten veranderen de kwaliteit en kwantiteit van het rivierwater, met gevolgen voor de ecosystemen van verstedelijkte rivieren.Het kwantificeren van de rol van door de mens veroorzaakte drijfveren bij het beheersen van tijdsruimtelijke patronen in de waterkwaliteit is van cruciaal belang om succesvolle strategieën te ontwikkelen voor het verbeteren van de ecologische gezondheid van stedelijke rivieren.Hier analyseren we hoogfrequente elektrische geleidbaarheid en temperatuurgegevens die zijn verzameld uit de River Chess in Zuidoost-Engeland tijdens een Citizen Science-project.Door gebruik te maken van machine learning, ontdekken we dat gebooste bomen beter presteren dan GAM en de dynamiek van de waterkwaliteit nauwkeurig beschrijven met een fout van minder dan 1%.SHapley Additive ExPlanations onthullen het belang van en de (inter)afhankelijkheden tussen de individuele variabelen, zoals rivierpeil en afvalwaterzuiveringsinstallaties (WWTW) uitstroom.WWTW-uitstroom leidt tot dagelijkse variaties in elektrische geleidbaarheid, die het hele jaar door waarneembaar zijn, en tot een stijging van de gemiddelde watertemperatuur van 1 \(\rm{^o}C\) in een bereik van 2 km stroomafwaarts van de afvalwaterzuiveringsinstallaties tijdens lage stromen.Over het algemeen laten we zien hoe hoogfrequente waterkwaliteitsmetingen die zijn geïnitieerd door een Citizen Science-project, samen met machine learning-technieken, kunnen helpen de belangrijkste drijfveren van de dynamiek van de waterkwaliteit in een verstedelijkte krijtstroom te ontwarren.Over de hele wereld veroorzaken menselijke activiteiten, zoals verstedelijking, veranderingen in de kringlopen van stroomgebieden die grote gevolgen hebben voor de waterkwantiteit, kwaliteit en ecologie van rivieren1,2.Verstedelijking verandert de hydrologie van een stroomgebied op meerdere manieren3.De introductie van ondoordringbare oppervlakken, samen met kunstmatige drainagesystemen, kan de piekafvoeren in rivieren3 vergroten, de hydrologische responstijden op regenval verminderen4,5 en de basisstroom en grondwateraanvulling verminderen6.In veel landen voeren gemengde rioolstelsels huishoudelijk en industrieel afvalwater onder droge omstandigheden naar afvalwaterzuiveringsinstallaties, samen met regenwaterafvoer van verharde gebieden als het regent.De lozing van behandeld afvalwater kan door menselijke activiteit bepaalde stromingspatronen in rivieren veroorzaken7,8.De menselijke activiteiten die verband houden met verstedelijking hebben ook gevolgen voor de chemische waterkwaliteit, waarbij veel inspanningen zijn gericht op het karakteriseren van veranderingen in de waterkwaliteit in stedelijke rivieren tijdens stormen9,10,11 en het fenomeen 'first flush'12,13.Gemengde riooloverstorten kunnen ook een aanzienlijke impact hebben op de waterkwaliteit na hevige regenval wanneer de capaciteit van afvalwaterzuiveringsinstallaties is overschreden14,15,16,17.We weten ook dat stedelijke stromen doorgaans een hogere gemiddelde elektrische geleidbaarheid en grote ionenconcentraties hebben in vergelijking met hun landelijke tegenhangers18,19,20, die het gevolg zijn van een combinatie van puntige en diffuse bronnen van vervuiling.Zo zijn chloride, sulfaat, natrium en kalium veel voorkomende elektrolyten in urine en daarom geconcentreerd in afvalwater19.Het bepalen van de belangrijkste bronnen van individuele ionen in stedelijke systemen is echter een uitdaging gebleken21.Dergelijke verhoogde niveaus van opgeloste stoffen leiden er nu toe dat ecologen hypothesen opstellen over mogelijke implicaties van verhoogde ionconcentraties voor de gezondheid en veerkracht van stedelijke stroomecosystemen22.Menselijke activiteiten veroorzaken wijdverbreide achteruitgang van de waterkwaliteit in rivieren met gevolgen voor de ecologische gezondheid23.Deze activiteiten leiden tot veranderingen in de waterkwaliteit van ontvangende wateren die werken volgens geneste tijdschalen van uren (in reactie op regenval) tot dagelijkse, seizoensgebonden en interjaarlijkse cycli24,25.Om de impact van menselijke activiteiten op rivieren volledig te begrijpen, moeten we door de mens veroorzaakte en natuurlijke variaties in de waterkwaliteit uit elkaar halen.Om dit te doen hebben we toegang nodig tot monitoringgegevens met hoge resolutie en lange termijn van verstedelijkte systemen, zoals die beschikbaar komen door het gebruik van realtime hoogfrequente waterkwaliteitssensoren26.Nu gedetailleerde gegevens beschikbaar zijn, wordt machine learning (ML) een belangrijk alternatief voor procesgebaseerde of traditionele statistische modellen.Deze ontwikkeling wordt verder versneld wanneer ML-modellen superieure voorspellende prestaties vertonen27 in vergelijking met traditionele benaderingen.Bijvoorbeeld28, onlangs aangetoond dat machine learning kan worden gebruikt om onbehandelde afvalwaterlozingen te detecteren wanneer getraind met 15 minuten stroomgegevens van afvalwaterzuiveringsinstallaties (WWTW).Specifieke technieken voor machine learning zijn onder meer Generalized Additive Models (GAM) en boosted trees.Er zijn ABM-technieken gebruikt om correlaties tussen chlorofyl a en andere waterkwaliteitsparameters te onderzoeken29.Ondertussen is er gebruik gemaakt van boosted tree analysis om bijvoorbeeld het belang van factoren die van invloed zijn op de nitraatconcentratie in grondwater te rangschikken en om nitraatkwetsbaarheidskaarten te maken30.Het onderliggende idee van versterkte bomen is om veel "zwakke leerlingen", namelijk eenvoudige regressiebomen, te combineren in één ensemble-voorspeller31.Gebooste bomen presteren vaak beter dan neurale netwerken, met name op tabelgegevens32, maar ze hebben problemen met het voorspellen van toekomstige gebeurtenissen en extrapoleren buiten eerder vastgelegde waarden.Bij het toepassen van machine learning is het belangrijk om black-box-oplossingen te vermijden, aangezien deze geen procesmatig wetenschappelijk inzicht verschaffen33.Met de komst van 'eXplainable' of 'Interpretable' machine learning (IML), is machine learning verbeterd om het begrip van relevante relaties in de gegevens te benadrukken.Deze IML-methoden zijn tot nu toe echter niet op grote schaal gebruikt voor de analyse van de waterkwaliteit27,34,35.Hier laten we zien hoe IML kan worden gebruikt om het relatieve belang te bepalen van verschillende omgevings- en menselijke factoren die de dynamiek van de waterkwaliteit beheersen, en om de aard van de relaties tussen rivierniveau en elektrische geleidbaarheid of temperatuur te achterhalen.In dit geval gebruiken we versterkte bomen en interpreteren we deze traditionele black-boxen via Shapley-waarden36,37, waarbij we hun algehele prestaties vergelijken met een meer traditionele GAM-benadering.We benadrukken dat onze analyse op zich transparant en reproduceerbaar is: we stellen onze code online beschikbaar en al onze resultaten zijn gebaseerd op openbaar beschikbare en open source-pakketten, bijvoorbeeld in Python en R.In het VK zijn de met grondwater gevoede krijtstromen een van de riviertypen die schijnbaar onder de meeste druk van menselijke activiteit staan.De meeste krijtstromen ter wereld (224 rivieren) bevinden zich in Engeland38 en worden van internationaal belang geacht vanwege hun karakteristieke hydrologie, waterkwaliteit, ecologie en esthetiek.77% van deze rivieren voldoet echter niet aan de 'goede' ecologische toestand zoals gedefinieerd door de Kaderrichtlijn Water van de Europese Unie (EU)39, met druk als gevolg van overmatige onttrekking, landbouwactiviteiten en verstedelijking.Ondanks dat ze zijn aangewezen op grond van bijlage 1 van de Habitatrichtlijn, is de kans groter dat ze in een 'arme' of 'slechte' status verkeren dan de gemiddelde rivier in Engeland en Wales38.Krijtstromen op de helling van de Chilterns Area of ​​Outstanding Natural Beauty (AONB) typeren de problemen waarmee veel Britse rivieren worden geconfronteerd die zich in snel verstedelijkende gebieden bevinden, waar behandeld afvalwater een groot deel van de totale rivierstroom uitmaakt.Bovendien bedreigt klimaatverandering de veerkracht van deze rivierecosystemen40.Bij klimaatveranderingsscenario's van warmere, drogere zomers kan het aandeel behandeld afvalwater in deze systemen verder stijgen.Bovendien kan de voorspelde toename van de frequentie van hevige regenval extra druk uitoefenen op rioolwaterzuiveringsinstallaties die water ontvangen van gemengde rioleringsnetwerken, wat leidt tot frequentere lozingen van stormtanks, waardoor de waterkwaliteit verder wordt gewijzigd.Dergelijke mogelijkheden geven ons een extra impuls om manieren te ontwikkelen om de betekenis van verschillende (natuurlijke en menselijke) bijdragen aan waterkwaliteitspatronen in verstedelijkte rivieren te begrijpen.Van deze bijdragen is afvalwaterbeheer een van de meest urgente problemen voor de waterkwaliteit41,42, met name in situaties met laag debiet.Ten slotte heeft ons onderzoek ook betrekking op Citizen Science-inspanningen die steeds meer bekendheid en interesse krijgen in academische literatuur vanwege mogelijkheden om datasets te verzamelen die mogelijk niet mogelijk waren geweest zonder lokale en publieke steun.Deze grote datasets zijn van cruciaal belang om elke machine learning-toepassing mogelijk te maken.Bovendien promoten burgerwetenschappers het onderwerp in de lokale gemeenschap en vergroten ze zo het bewustzijn, met name voor milieukwesties43,44.Hier richten we ons op de River Chess, een proefstroomgebied voor 'The Smarter Water Catchment Initiative', gecreëerd door Thames Water, dat tot doel heeft het beheer van stroomgebieden te verbeteren door middel van partnerschapsprojecten die meerdere uitdagingen aanpakken en Citizen Science omarmen.Het initiatief heeft ons de mogelijkheid geboden om met tussenpozen van vijftien minuten een langdurige tijdreeks van temperatuur en elektrische geleidbaarheid te verzamelen met behulp van sensoren die worden onderhouden door Citizen Scientists.In dit artikel ligt de nadruk op variaties in tijdreeksen van temperatuur en elektrische geleidbaarheid (als een proxy voor totaal opgeloste opgeloste stoffen) omdat dit waterkwaliteitsparameters zijn die kunnen worden gewijzigd door antropogene factoren met belangrijke effecten op andere kritieke ecologische processen zoals metabolisme26, 45 en omdat ze goedkoop en gemakkelijk te controleren zijn voor Citizen Science-groepen.Ons algemene doel is om het gebruik van machine learning-tools te demonstreren, in het bijzonder GAM, boosted tree en SHAP-analyse, om de tijdruimtelijke patronen in temperatuur en elektrische geleidbaarheid te analyseren die voortkomen uit puntige en diffuse stedelijke afvoer in een met grondwater gevoede rivier.We gebruiken deze machine-learningtools om de invloed van een afvalwaterzuiveringsinstallatie op de waargenomen ruimte-tijdpatronen te ontrafelen.Ten slotte beoordelen we in het licht van onze bevindingen de manieren waarop datasets voor elektrische geleidbaarheid zoals de onze nuttig kunnen zijn voor Citizen Science-groepen die waterkwaliteitsproblemen in verstedelijkte rivieren onderzoeken.Onze monitoringperiode omvat een periode van droogte met uitzonderlijk lage afvoeren (september 2019) en lage grondwaterstanden in het stroomgebied;toenemend tot uitzonderlijk hoge afvoeren in februari/maart 2020, aangezien de grondwaterstanden stegen als reactie op de hoge totale herfst- en winterregen in 2020, vergezeld van hevige regenval.De grondwater- en rivierstanden vertonen een duidelijke seizoenscyclus als reactie op de veranderende neerslagpatronen in het stroomgebied (Fig. 1).Tijdreeksgrafieken van (a) dagelijkse totale regenval (Chenies, EA-station);(b) grondwaterpeil (Ashley Green, EA-station);en (c) Rivierniveau van River Chess in Rickmansworth van 1 juni 2019 tot 1 juni 2020 (EA-meetstation)46.Seizoensdynamiek wordt ook waargenomen in de elektrische geleidbaarheidsdataset op de locaties stroomafwaarts van Chesham WWTW (LP en WB), zie ook Methoden voor een kaart.Op deze locaties is het elektrische geleidingsvermogen het hoogst terwijl het grondwater- en rivierpeil laag zijn, en neemt het af zodra het grondwater- en rivierpeil stijgt (Fig. 2a), terwijl er geen duidelijk seizoenspatroon is in het elektrisch geleidingsvermogen op de locaties stroomopwaarts van de WWTW (BH en LC).De watertemperatuur van de rivier vertoont op alle locaties een sterk seizoenssignaal, waarbij hogere watertemperaturen in de zomer (juli tot september 2019) in de herfst dalen tot een winters dieptepunt en dan weer stijgen in de lente (Fig. 3a).Als we een week aan elektrische geleidbaarheidsgegevens plotten (Fig. 2b), kunnen we ook dagelijkse cycli in elektrische geleidbaarheid stroomafwaarts van de WWTW waarnemen die niet waarneembaar zijn op de stroomopwaartse locaties (Fig. 2b).De temperatuur van het rivierwater vertoont ook duidelijke dagelijkse variaties op alle locaties (Fig. 3b).Tijdreeksen voor elektrische geleidbaarheid (a) juni 2019 tot 2020;en (b) 23 augustus tot 30 augustus 2019.Temperatuurtijdreeks (a) juni 2019 tot 2020;en (b) 23 augustus tot 30 augustus 2019.De tijdreeks kan systematischer worden geanalyseerd via de PDF (geëxtraheerd uit histogrammen), om algemene verschillen tussen locaties te tonen (Fig. 4), met belangrijke statistische parameters samengevat in Tabel 1. De gemiddelde elektrische geleidbaarheid is het hoogst op de locatie 2 km stroomafwaarts van de WWTW (734 \(\rm{\mu S cm^{-1}}\) bij LP) en ligt 5 km verder stroomafwaarts (648 \(\rm{\mu S cm^{-1}}\) bij WB).Dit in tegenstelling tot een lagere elektrische geleidbaarheid stroomopwaarts van de WWTW (565 en 575 \(\rm{\mu S cm^{-1}}\) bij respectievelijk LC en BH).De elektrische geleidbaarheidsdatasets volgen geen Gauss-verdelingen, maar vertonen in plaats daarvan zware staarten, vooral stroomopwaarts van de WWTW waar de kurtosis \(\kappa >3=\kappa _\text {Gaussian}\) 47. Daarentegen is de rivierwatertemperatuur toont een geleidelijke toename van de gemiddelde waarden met toenemende afstand stroomafwaarts van Chesham, met een \(1.1^{\rm{\circ } C}\) verschil tussen BH en WB, en kurtosis \(\kappa < 3\) .Genormaliseerde histogrammen van (a) elektrische geleidbaarheid;en (b) temperatuur voor alle sensorlocaties.Let op de log-schaal op de y-as, die de zware staarten in BH benadrukt.Merk op dat de meetperiode de lente van 2020 omvat, dat wil zeggen het begin van de Covid-19-pandemie in Groot-Brittannië.Bij het analyseren van de gegevens vinden we kleine maar niet significante gevolgen van de afsluiting van maart in het VK, zie code voor details.We zien een duidelijke afstemming tussen de lozing van gezuiverd effluent van de afvalwaterzuiveringsinstallaties (WWTW) en de elektrische geleidbaarheid van rivierwater (Fig. 5).Om rekening te houden met de tijdsvertraging tussen de WWTW-afvoer die wordt geregistreerd in de fabriek en het water dat onze stroomafwaartse sensoren op de LP- en WB-locaties bereikt, verschuiven we de metingen van de elektrische geleidbaarheid van rivierwater met respectievelijk ongeveer 2,5 en 8,5 uur.Genormaliseerde tijdreeksen van afvalwaterzuiveringsinstallaties (WWTW) behandelde afvalwaterlozingen en elektrische geleidbaarheid (EC).EC werd gemeten bij LP en WB en verschoven met respectievelijk 2,5 en 8,5 uur om rekening te houden met de tijdvertraging van de rioolwaterzuiveringsafvoer om de sensorlocatie te bereiken.Om de relatie tussen behandeld afvalwater uit de WWTW en EC verder te kwantificeren, voeren we een Fourier-transformatieanalyse uit om de belangrijkste frequenties in het systeem bloot te leggen (Fig. 6).We vergelijken de Fourier-analyses van de behandelde effluentlozing met de Fourier-analyse van het rivierwater EC op alle vier de meetplaatsen.Met name zowel de WWTW-ontlading als de elektrische geleidbaarheid op de twee stroomafwaartse locaties (LP en WB) vertonen uitgesproken pieken bij frequenties van 24, 12, 8 en 6 uur, terwijl we dergelijk cyclisch gedrag bij LC of BH niet waarnemen.Fourier-analyse van afvalwaterzuiveringsinstallaties behandeld effluentlozing en EC.We plotten de Fourier-amplituden van zowel de elektrische geleidbaarheid (EC) als de lozing van afvalwaterzuiveringsinstallaties (WWTW) op alle locaties.We merken relevante frequentiepieken op 24, 12, 8 en 6 uur in de WWTW-afvoer en in geleidbaarheid voor LP en WB.Vervolgens volgen we twee datagestuurde benaderingen om de elektrische geleidbaarheid (EC) te beschrijven als een doelvariabele (y) die wordt gekenmerkt door \(p=7\) kenmerken: Twee lokale variabelen: temperatuur, pH (lokale sensorvariabelen) en vijf globale variabelen variabelen: regenval, rivierpeil en tijdstempels, opgesplitst in maand, dag en uur.Voor alle tijdreeksen gebruiken we gegevens van 1 juni 2019 tot 1 juni 2020, verwijderen NaN-invoer waar nodig, daarna voeren we zowel een GAM als een boosted tree-analyse uit, zie ook Methoden.Merk op dat het rivierpeil op alle locaties de waarden gebruikt die zijn geregistreerd bij Rickmansworth, dat enkele kilometers stroomafwaarts van alle meetlocaties ligt.We beschouwen later ook een modelrun waarbij we de lokale tijdreeks van een sensor afstemmen op het station in Rickmansworth.We hebben op alle locaties een GAM-analyse (generalized additive model) uitgevoerd, maar richten ons hier op de twee stroomafwaartse locaties, terwijl de resultaten voor de twee stroomopwaartse locaties in het supplement worden gegeven.De belangrijkste kenmerken, gebaseerd op de grootte van hun bijdragende splines, zijn de pH-waarde en rivierniveaus, die beide negatief gecorreleerd zijn met elektrische geleidbaarheid (Fig. 7).De afwijking tussen model en testset is \(\text {SMAPE}\circa 1...2\%\) , waarbij SMAPE staat voor de symmetrische gemiddelde absolute procentuele fout48.Resultaten van de GAM-analyse voor LP (a) en WB (b).Best passende splines van de verschillende kenmerken \(x_{i}\) en hun invloed op de elektrische geleidbaarheid (EC) in de volledig aangepaste GAM-benadering.De blauwe curve geeft de beste pasvorm en de rode stippellijnen omhullen een enkel betrouwbaarheidsinterval (\(68\%\) uitgaande van een onderliggende Gaussiaanse onzekerheid).Ten slotte rapporteren we de symmetrische gemiddelde absolute procentuele fout (SMAPE)48 wanneer het model wordt toegepast op de eerder ingehouden testset.Vervolgens passen we een versterkte boombenadering toe, waarbij we SHAP gebruiken om de resultaten te interpreteren.Laten we eerst bespreken hoe een individuele verklaring wordt verkregen (Fig. 8): De "basiswaarde" (gemiddelde geleidbaarheid voor LP) van ongeveer 723 \(\rm{\mu S/cm}\) wordt gewijzigd in deze specifieke gegevens wijzen op de positieve impact van de "dag"-functie (welke dag in de week), terwijl "maand", "rivierniveau", "temperatuur" en "uur" de voorspelling allemaal naar een lagere waarde duwen.Het model voorspelt dus een waarde van 662,7 \(\rm{\mu S/cm}\) , met als meest invloedrijke eigenschap de maand.Uitleg van gebooste boomresultaten via SHAP.Uitgaande van een basiswaarde (hier ongeveer 723), duwt elke functie de voorspelling voor de elektrische geleidbaarheidswaarde naar lagere (blauwe) of hogere (rode) waarden ten opzichte van de basiswaarde (ensemblegemiddelde).Hier lichten we één EC-meting op de LP-meetplaats toe via SHAP.We gaan verder met een meer systematische studie, door de impact van elk kenmerk op de voorspelling te rangschikken, waardoor we van een enkele lokale verklaring naar globale modeleigenschappen gaan .Hier behoren rivierpeil, temperatuur, pH en de tijd (maand of uur) tot de belangrijkste beschrijvende kenmerken (Fig. 9).Zoals eerder duwen negatieve SHAP-waarden de elektrische geleidbaarheidsvoorspelling naar lagere hoeveelheden, terwijl positieve waarden de voorspelling naar hogere EC's duwen die wijzen op grotere totale waarden voor opgeloste opgeloste stoffen.De kleuren geven de kenmerkwaarde aan, gaande van hoog (rood) naar laag (blauw).Daardoor krijgen we hier een eerste indruk van de afhankelijkheden: Het rivierpeilkenmerk is meestal rood voor negatieve waarden en blauw voor positieve SHAP-waarden, dwz het is negatief gecorreleerd met de geleidbaarheid.Ten slotte berekenen we de afwijking tussen model en testset als \(\text {SMAPE}\circa 0.2...0.4\%\) .Functierangschikking van de versterkte boom via SHAP.De kenmerken zijn gesorteerd op hun belang bij het voorspellen van afwijkingen van de gemiddelde EC voor LP (a) en WB (b), zie ook Fig. 8. Net als bij de GAM-benadering rapporteren we de symmetrische gemiddelde absolute procentuele fout (SMAPE) van de model toegepast op de testset.Om te onderzoeken hoe elk kenmerk bijdraagt ​​aan het model, analyseren we partiële afhankelijkheidsgrafieken van de drie belangrijkste kenmerken;rivierpeil, maand en watertemperatuur voor LP en rivierpeil, pH en uur van de dag bij WB (Fig. 10).In elke partiële afhankelijkheidsgrafiek geeft de kleur de waarden weer van het interactief kenmerk dat het grootste deel van de waargenomen variantie verklaart (in (afb. 10a de maand). We observeren consequent een negatief verband tussen elektrische geleidbaarheid en het rivierniveau (afb. 10a, e), evenals de elektrische geleidbaarheid en de pH-waarde (Fig. 10d), dwz een hoger rivierniveau of een hogere pH-waarde leiden tot een lagere EC-voorspelling. Merk op dat alle grafieken kleurcodes gebruiken om een ​​secundair kenmerk weer te geven dat de meeste varianties van de voorspelling van het primaire kenmerk. We kunnen dus waarnemen dat lage rivierstanden in de maanden 8 tot en met 12 (augustus tot december) geassocieerd zijn met de hoogste elektrische geleidbaarheid van rivierwater bij LP (Fig. 10a). Bij WB zijn de hoogste elektrische geleidbaarheidswaarden in rivierwater geassocieerd met een lage pH van 7,4 tot 7,8 gedurende de maanden 8 tot en met 12 (augustus tot december). Verder zijn er interessante temporele trends in de uur- en maandkenmerken. Bij WB waren bijvoorbeeld de middagen (13:00 tot 16:00 uur) karakterveroorzaakt door een lagere elektrische geleidbaarheid in rivierwater op momenten dat de pH de neiging had hoger te zijn (7,8 tot 8,1).Functierangschikking en gedeeltelijke afhankelijkheidsgrafieken voor stroomopwaartse sites worden weergegeven in het supplement.Gedeeltelijke afhankelijkheidsgrafieken van de EC-versterkte boom voor LP (ac) en WB (df).We plotten de drie belangrijkste kenmerken van beide stroomafwaartse meetlocaties.De kleuren (en linker zijas) markeren tweede-orde interacties tussen het geplotte object en een secundair object.Door de eerder afgeleide resultaten uit te breiden, nemen we drie nieuwe kenmerken op: De totale rivierafvoer, de totale WWTW-afvoer en de WWTW-fractie (verhouding van de WWTW-afvoer en de totale stroom), gecorrigeerd voor de tijdvertraging tussen de verschillende meetstations (zie Supplementen voor details).We benadrukken dat het opnemen van dergelijke extra handige functies de prestaties van het model verbetert, zie Fig. 11. Met name de belangrijkste functies, rivierniveau en maand blijven belangrijk in deze uitgebreide functieset.Bovendien blijft de gedeeltelijke afhankelijkheid (Fig. 11b) voor het rivierniveau vrijwel ongewijzigd door een nieuwe functie toe te voegen.Merk ten slotte op dat de EC-waarde binnen het model bijna lineair afhankelijk is van de fractie van de stroom die wordt toegeschreven aan de WWTW (Fig. 11c), zeer in lijn met de uitlijning in het Fourier-spectrum en eerder waargenomen tijdreeksen: Hogere WWTW-ontlading duidt op een hogere EC.Deze lineaire afhankelijkheid is veel duidelijker in het model in vergelijking met een eenvoudige spreidingsplot.Functierangschikking en gedeeltelijke afhankelijkheidsgrafieken van het uitgebreide EC-model op de LP-site.We plotten de feature ranking (a), de belangrijkste feature (b) en de afhankelijkheid van de fractie van de stroom uit de WWTW (c).Merk op dat de uitwisseling van oppervlaktewater-grondwater in de rivier tussen de WWTW en het meetstationterrein kan leiden tot een waarde voor de WWTW-fractie \(> 1\) .Nadat we EC in detail hebben geanalyseerd, onderzoeken we vervolgens de temperatuurafhankelijkheid.Met behulp van de uitgebreide dataset (dus inclusief absolute stromen en de WWTW-fractie) bereiken we zeer goede passingen, zie Fig. 12: \(\text {SMAPE}\circa 0,5\%\) afwijking gemiddeld.Net als in de EC-analyse staat het totale rivierpeil zeer hoog in onze lijst met kenmerken, maar de maand staat zelfs nog hoger, wat wijst op de sterke seizoensafhankelijkheid van de temperatuur.Hoewel de WWTW-fractie hier niet tot de top drie van kenmerken behoort, leiden kleine variaties van de hyperparameters tot een herschikking van de kenmerkrangen (zie Code voor details) en blijft de afhankelijkheid van temperatuur van de WWTW-fractiekenmerken robuust.Een stijging van de WWTW-fractie gaat gepaard met een stijging van de temperatuur.In het hier getoonde model kan een verhoogde WWTW-afvoer de temperatuurvoorspelling tot \(1^{\rm{\circ }}C\) beïnvloeden wanneer het rivierpeil het laagst is (blauwe datapunten, Fig. 12c).Bij hoge rivierstanden (rode tot paarse datapunten, Fig. 12c) is de WWTW-fractie laag en is er minder effect op de temperatuur.Temperatuuranalyse van de LP-site.We plotten de feature ranking (a), de belangrijkste feature (b) en de afhankelijkheid van de fractie van de stroom uit de WWTW (c).De bijdragen van de afvoer naar de rivier vanuit de RWZI in Chesham schommelen van 40 tot 70\(\%\) afhankelijk van de grondwaterstanden en van de kortetermijneffecten van regenval.Deze belangrijke bijdrage van de puntbron aan de rivierstroming leidt ook tot een aanzienlijk hogere gemiddelde elektrische geleidbaarheid in oppervlaktewater stroomafwaarts van de AWW-afvoer (Fig. 4a, Tabel 1).Deze studie levert dus verder bewijs van de rol die behandelde WWTW-ingangen spelen bij het veroorzaken van verhoogde elektrische geleidbaarheid in verstedelijkte rivieren18,19,20,21.Hoewel de WWTW-afvoer een puntbron is van opgeloste stoffen naar het riviersysteem, ontvangt de WWTW water uit een gemengd rioolsysteem dat bestaat uit huishoudelijk en industrieel afvalwater, samen met wegafvoer uit diffuse bronnen, zoals gebruikelijk is in Engeland.Daarom zal de samenstelling van opgeloste stoffen in het behandelde afvalwater van de WWTW variëren afhankelijk van menselijke activiteiten en regenval.Bovendien is het bijdragende rioolnetwerk onderhevig aan het binnendringen van grondwater tijdens perioden van verhoogde grondwaterstanden (bijv. vanaf maart 2020), wat bijdraagt ​​aan de lijst van factoren die de elektrische geleidbaarheid van het effluent regelen.Desalniettemin zien we, ondanks deze mogelijke oorzaken van variaties in elektrische geleidbaarheid in het afvalwater van WWTW (determinand wordt niet gecontroleerd door het waterbedrijf), consistente temporele trends in de elektrische geleidbaarheid van rivieren die voortkomen uit deze puntbronbijdrage aan de rivier.In een natuurlijk riviersysteem wordt het basisdebiet in EC als relatief hoog beschouwd omdat grondwater rijk is aan opgeloste stoffen in vergelijking met de snelstromende componenten van de hydrograaf, die worden gedomineerd door de regenval en ondiepe ondergrondse stromingen49.In dit grondwatergevoede systeem worden de seizoens- en meerjaarlijkse variaties in rivierpeil en afvoer voornamelijk beheerst door grondwaterstand (Fig. 1).We zien dat de EC het hele jaar door stabiel blijft in onze grondwaterbronlocatie (LC) stroomopwaarts van de WWTW, wat wijst op weinig variatie in EC als gevolg van veranderende diepten of bronnen van grondwater (Fig. 2a, Tabel 1).Onze upstream stedelijke site (BH) heeft een meer variabel EC-signaal.Deze variabiliteit komt voort uit regenwaterinvoer naar het kanaal van snelle stedelijke afvoer, die scherpe dalingen in EC veroorzaakt als reactie op regenval met hoge intensiteit (Fig. 2a, Tabel 1).De grootste variaties in EC worden echter waargenomen op de terreinen stroomafwaarts van de RWZI.Op deze locaties (LP en WB) is de invloed van het rivierpeil en de fractie van het afvalwater van RWZI's op de seizoenscycli van de EC duidelijk, waarbij de hoogste EC wordt geregistreerd wanneer het rivierpeil het laagst is (Fig. 10), en de bijdrage van het afvalwater van RWZI's naar de basisstroom is het hoogst (Fig. 11b,c).Er zijn niet alleen duidelijke seizoensveranderingen in EC, maar ook duidelijke patronen op 24 uur en kortere tijdschalen veroorzaakt door veranderingen in de lozing van behandeld afvalwater van de RWZI (Fig. 5, 6c,d, 10f).De WWTW kent twee periodes van piekafvoer;om 13:00 tot 14:00 GMT en 21:00 tot 22:00 GMT in verband met patronen in menselijke huishoudelijke activiteiten in het stroomgebied.Deze elektrische geleidbaarheidssignatuur van deze pieken in activiteit wordt stroomafwaarts verzwakt, maar blijft 5 km stroomafwaarts van de afvoer waarneembaar;en zelfs wanneer het rivierpeil hoog is in de lente (februari tot mei 2020).Deze 'handtekening' kan worden gebruikt om een ​​gemiddelde waterreistijd of -snelheid tussen locaties te schatten.De geschatte reistijd van water van de RWZI naar LP en WB is respectievelijk 2,5 en 8,5 uur.Daarom komen de omstandigheden overdag (09:00 tot 17:00) in de rivier bij WB overeen met een periode met de laagste dagelijkse bijdragen van de WWTW.Hier bekijken we of dagelijkse veranderingen in elektrische geleidbaarheid meetbaar zijn op andere verstedelijkte rivieren in het VK en hoe overdraagbaar onze waarnemingen zouden kunnen zijn?In dit opzicht is een nuttige parameter om in overweging te nemen de 'verdunningsfactor', die wordt gedefinieerd als de verhouding van het rivierdebiet bij de uitmonding van het stroomgebied tot het totale afvalwater van huishoudelijk afvalwater50.Verdunningsfactor wordt gebruikt in ecologische risicobeoordelingen onder EU-wetgeving om een ​​'worst case blootstelling' van oppervlaktewater aan chemicaliën uit behandeld afvalwater te voorspellen51.Voor deze analyses wordt een vaste verdunningsfactor van tien gehanteerd.Op basis van gegevens over de behandelde effluentstroom van Chesham en de rivierstroom bij het meetstation van Rickmansworth schatten we een gemiddelde verdunningsfactor van 2,67 tijdens onze studie, met een minimum van 0,87 tijdens de droogteperiode aan het begin van onze studie en een maximum van 6,81 in februari/maart 2020. Gedurende deze hele periode waren dagelijkse cycli van elektrische geleidbaarheid waarneembaar in de rivier.50 schat dat naar schatting 25\(\%\) van de Britse rivieren een gemiddelde verdunningsfactor van \(< 6,26\) hebben, en deze rivieren zijn vooral te vinden in dichtbevolkte regio's zoals Zuidoost-Engeland.Op basis hiervan voorspellen we dat dagelijkse veranderingen in elektrische geleidbaarheid waarneembaar kunnen zijn in veel laaglandrivieren in het VK, hoewel deze cycli bemoeilijkt kunnen worden door het effect van meer dan één afvalwaterzuiveringsinstallatie stroomopwaarts van een riviermeetstation.Er is geen uitgebreid overzicht van verdunningsfactoren in Europese rivieren, maar een recente analyse van grote Duitse WWTW's met een omvang van \(> 10.000\) bevolkingsequivalenten heeft gesuggereerd dat 60\(\%\) van de verdunningsfactoren onder de 10 vallen, wat suggereert dat dagelijkse veranderingen in elektrische geleidbaarheid is mogelijk breder waarneembaar52.De partiële afhankelijkheidsgrafieken van de versterkte boomanalyse stellen ons ook in staat om de relatie tussen het aandeel van de stroom van de WWTW (met behulp van elektrische geleidbaarheid als onze proxy) en pH bij WB te beschouwen.Figuur 10e laat zien dat de perioden met de hoogste bijdragen van de WWTW aan het totale debiet in de rivier geassocieerd zijn met de laagste pH-omstandigheden.Figuur 10f geeft aan dat de dagcondities in de rivier bij WB (09:00-17:00), wanneer de bijdrage van de afvoer van de RWZI het laagst is, geassocieerd zijn met de hoogste pH-condities.Overdag zal fotosynthese ook leiden tot meer alkalisch rivierwater, maar deze analyse suggereert dat een combinatie van fotosynthese en behandeld afvalwater de amplitude van de pH-cyclus in de rivier zou kunnen vergroten.Ten slotte stelt de analyse ons ook in staat om de kenmerken te ontrafelen die de temperatuur van het rivierwater regelen.De SHAP-analyses bevestigen het eerder bekende belangrijke samenspel tussen seizoen en rivierniveau op temperatuur53.54 hebben bijvoorbeeld eerder luchttemperatuur en waterniveau gebruikt om uurlijkse veranderingen in watertemperatuur te voorspellen met behulp van een kunstmatige neurale netwerkmodelleringsaanpak.Onze modellering laat ook zien dat de fractie van de stroom van de bovenstroomse WWTW positief gecorreleerd is met een verandering in rivierwatertemperatuur van ca.1\(\rm{^{o}C}\) tijdens perioden van lage rivierstanden die verder onderzoek op dit gebied rechtvaardigen.Vooral gezien het feit dat de watertemperaturen in de zomer tijdens lage stroomomstandigheden hoger waren dan 20 \(\rm{^{o}C}\) ;temperaturen die van invloed kunnen zijn op het rekruteringssucces van zalmachtigen zoals beekforel, salmo trutta en vlagzalm, Thymallus thymallus55.Afvalwaterzuiveringsinstallaties zijn een bron van warm water die tot nu toe weinig aandacht heeft gekregen, maar een analyse op nationale schaal in het VK door56 heeft aangetoond dat er potentieel is om warmte terug te winnen van afvalwaterzuiveringsinstallaties om de klimaatveranderingsdoelstellingen te helpen halen, met als bijkomend voordeel milieueffecten op rivieren te verminderen.Onze analyse geeft aan dat een mitigerende optie, zoals warmteterugwinning uit de lozing van behandeld afvalwater, gunstig kan zijn voor krijtstromen, zoals de rivier de Chess, die een groot deel van hun stroom uit behandeld afvalwater halen.Mach.Mach.Adv.