Auf dem Weg zu einer erklärbaren Vorhersage von Wärmelastmustern für Fernwärme

Scientific Reports Band 13, Artikelnummer: 7434 (2023) Diesen Artikel zitieren

562 Zugriffe

Details zu den Metriken

Wärmenetze spielen eine wichtige Rolle im Energiesektor, indem sie den Bewohnern bestimmter Länder Wärmeenergie anbieten. Eine effektive Verwaltung und Optimierung von Wärmenetzen erfordert ein tiefes Verständnis der Wärmenutzungsmuster der Nutzer. Unregelmäßige Muster, wie z. B. Spitzennutzungszeiten, können die Auslegungskapazitäten des Systems überschreiten. Bisherige Arbeiten haben die Analyse von Wärmenutzungsprofilen jedoch meist vernachlässigt oder nur in kleinem Maßstab durchgeführt. Um diese Lücke zu schließen, schlägt diese Studie einen datengesteuerten Ansatz zur Analyse und Vorhersage der Wärmelast in einem Fernwärmenetz vor. Die Studie nutzt Daten aus über acht Heizperioden einer Wärme-Wärme-Kopplungsanlage in Cheongju, Korea, um Analyse- und Prognosemodelle mithilfe von Algorithmen für überwachtes maschinelles Lernen (ML) zu erstellen, einschließlich Support Vector Regression (SVR), Boosting-Algorithmen und Multilayer Perceptron (MLP). ). Als Eingangsvariablen nutzen die Modelle Wetterdaten, Feiertagsinformationen und die historische stündliche Wärmebelastung. Die Leistung dieser Algorithmen wird anhand unterschiedlicher Trainingsstichprobengrößen des Datensatzes verglichen. Die Ergebnisse zeigen, dass Boosting-Algorithmen, insbesondere XGBoost, geeignetere ML-Algorithmen mit geringeren Vorhersagefehlern als SVR und MLP sind. Schließlich werden verschiedene Ansätze der erklärbaren künstlichen Intelligenz angewendet, um eine tiefgreifende Interpretation des trainierten Modells und der Bedeutung von Eingabevariablen zu ermöglichen.

Fernwärme (DH) hat sich in den letzten Jahrzehnten zu einer entscheidenden Energieversorgungsinfrastruktur entwickelt, um Verbraucher effektiv mit Wärme und Kälte zu versorgen1. DH ist anderen Energieversorgungsoptionen in vielerlei Hinsicht überlegen, darunter ein geringerer CO2-Fußabdruck, die Integration mehrerer Wärmequellen und ein hoher Energiedurchsatz. Die neuesten DH-Generationen der vierten und fünften Generation können mehrere Wärmequellen nutzen, darunter Kraft-Wärme-Kopplung (KWK), Gaskessel, Wasserwärmepumpen (WP), erdgekoppelte WP und auf Solarenergie basierende WP. Die neuere Literatur konzentrierte sich mehr auf die Entwicklung von Simulationsrahmen und effektiven Ansätzen für den Entwurf und die Optimierung von DH-Systemen im Hinblick auf wirtschaftliche und energetische Faktoren, was auf die schnelle Entwicklung von DH-Technologien zurückzuführen ist2,3. Auch die Speichertechnologie ist ein heißes Thema, da sie dazu beiträgt, die Wärmeerzeugung und den Bedarf zur Steigerung der DH-Effizienz zu entkoppeln4. Die folgenden Artikel1,5 wurden überprüft, um die neuesten Informationen über DH-Netzwerke zu erhalten.

Die Analyse des Wärmenutzungsmusters wird mit zunehmender Zahl der Endnutzer immer wichtiger, da sie großen Einfluss auf die Effizienz des gesamten Netzwerks hat. Schwankungen im Wärmenutzungsverhalten seitens der Verbraucher führen zu Schwankungen im Wärmenutzungsmuster einer einzelnen Umspannstation, was für ein genaues und effizientes DH-Management und -Betrieb von entscheidender Bedeutung ist6. Beispielsweise hat der große Temperaturunterschied zwischen Sommer und Winter einen erheblichen Einfluss auf den Wärmebedarf der Nutzer. Darüber hinaus variiert auch der stündliche Wärmebedarf zwischen den Haushalten, was zu Schwankungen des Wärmebedarfs im Umspannwerk führt7.

Für ein effektives Management von Fernwärmenetzen ist ein genauer Rahmen für die Vorhersage des Wärmebedarfs unerlässlich8. Erstens ermöglicht es die Optimierung der gesamten Wärmeerzeugung, minimiert den Wärmeverlust und optimiert die Betriebskosten. Zweitens wird die Verteilungstemperatur in einem geeigneten Bereich bereitgestellt, um mithilfe des Wärmebedarfsprognosemodells den Echtzeit-Wärmeverbrauch vorherzusagen. Infolgedessen nimmt die Zahl der vorgeschlagenen Studien zur Vorhersage des Wärmebedarfs zu. Eine Wärmebedarfsanalyse lässt sich grundsätzlich in modellbasierte und datenkorrelierte Kategorien unterteilen9. Der Datenkorrelationsansatz basiert hauptsächlich auf der Erstellung funktionaler Korrelationen der DH-Parameter, um ein Wärmenutzungsprofil für jedes Umspannwerk oder Gebäude zu entwickeln. Die modellbasierte Technik basiert auf Algorithmen des maschinellen Lernens (ML), um die repräsentativen Muster mithilfe der historischen Wärmelastdaten effektiv zu lernen10. Der Datenkorrelationsansatz bietet eine höhere Genauigkeit als der modellbasierte Ansatz, ist jedoch zeitaufwändig und mühsam, da für jedes Gebäude/Umspannwerk ein einzigartiges Wärmenutzungsprofil erstellt werden muss. Die Leistung des modellbasierten Wärmenutzungsvorhersagealgorithmus ist deutlich besser geworden, was auf die enormen Fortschritte bei künstlicher Intelligenz (KI) und Big Data in den letzten Jahrzehnten zurückzuführen ist9,10.

Die Vorhersage des Wärmeverbrauchs, die Schätzung des Wärmeverlusts und die Analyse von Anomalien auf der Grundlage der Energiesignatur (ES) wurden in den letzten Jahren zunehmend untersucht und haben vielversprechende Ergebnisse gezeigt11,12. Diese Studien verwendeten jedoch hauptsächlich die Außentemperatur als Hauptmerkmal, um das Muster des Wärmebedarfs zu ermitteln. Andere Studien konzentrierten sich auf die Vorhersage von Spitzenlasten mit dem ultimativen Ziel, den Energieverbrauch und das DH-Management zu optimieren13. Diese Studien, die den ES ähneln, berücksichtigten weder die meteorologischen Daten noch das Verhalten der Endnutzer. Potenzielle Einflussfaktoren auf die Wärmebedarfsmuster können in drei Hauptfaktoren unterteilt werden, darunter Meteorologie, Verhalten und Zeit14. Einige häufige meteorologische Daten, die sich möglicherweise auf den Wärmebedarf auswirken, sind Luftfeuchtigkeit, Sonneneinstrahlung, Außentemperaturen und die Windgeschwindigkeit15. Der Zeitfaktor umfasst alle zeitbezogenen Parameter, darunter Stunden, Tage, Monate und Jahre. Auch das Sozialverhalten der Endnutzer hat einen entscheidenden Einfluss auf die Variation der Wärmelast, die sowohl durch meteorologische als auch durch zeitliche Faktoren beeinflusst werden kann16. Diese drei Hauptfaktoren beeinflussen die Wärmenachfragemuster erheblich.

Wie aus zahlreichen neueren Studien hervorgeht, besteht großes Interesse am Forschungsbereich der Wärmelastvorhersage für Fernwärme. Idowu et al.17 untersuchten eine Reihe überwachter ML-Algorithmen, um eine Wärmelastvorhersage bis zu 48 Stunden im Voraus durchzuführen. Die experimentellen Ergebnisse zeigten, dass herkömmliche ML-Algorithmen wie SVM und lineare Regression im Vergleich zu anderen Algorithmen den niedrigsten normalisierten quadratischen Mittelfehler erzielten. In einer anderen Studie haben Boudreau et al. fanden heraus, dass Ensemble-Modelle eine deutlich bessere Vorhersagegenauigkeit als Basis-ML-Modelle lieferten, wenn es um die Vorhersage des Spitzenstrombedarfs und des Energieverbrauchs des Gebäudes am nächsten Tag ging18.

Mehrere Studien haben sich mit spezifischen Aspekten von DH-Systemen befasst. Beispielsweise haben Saloux et al. untersuchte die Anwendung von ML-Algorithmen zur Vorhersage des aggregierten Heizverbrauchs einer Gemeinde. Sie kamen zu dem Schluss, dass die Leistung der Modelle durch die Berücksichtigung anderer entscheidender Faktoren wie Tageszeit, systematische Variablen und Temperatur erheblich verbessert werden könnte19. López et al. konzentrierte sich auf die Auswirkungen bestimmter Tage, wie Feiertage oder Feiertage, auf die Lastkurve und stellte fest, dass solche Ereignisse das Wärmenutzungsmuster erheblich beeinflussen könnten20. Darüber hinaus ergab eine Fallstudie eines großen Fernwärmenetzes über mehrere Heizperioden hinweg, dass die Hauptursache für den Wärmebedarf die verschiedenen Betriebseinstellungen während des Tages (Nachtabschaltung und Nachttemperaturabsenkung) und die Außentemperatur waren21.

Trotz der zahlreichen angesprochenen Probleme und Methoden, die in der vorhandenen Literatur zur Wärmelastvorhersage in Fernwärmenetzen diskutiert werden, sind weitere Untersuchungen erforderlich, um wichtige externe Faktoren wie Feiertage und Wetterbedingungen zu untersuchen, die als Input zur Verbesserung der Modellgenauigkeit genutzt werden könnten6. Darüber hinaus haben frühere Arbeiten zwar die hohe Vorhersageleistung von ML-Algorithmen für den Wärmebedarf gezeigt, jedoch keine klare Erklärung dafür geliefert, warum das Modell eine gute Leistung erzielte und welche Funktionen wichtig sind und welche Korrelation sie mit den Modellen haben10.

Diese Forschung wird vorgeschlagen, um die Vorhersage des Wärmeverbrauchs durch eine eingehende Analyse des Datensatzes zu verbessern, um die potenziellen Faktoren herauszufinden, die sich auf den Wärmebedarf auswirken. Zu den Hauptbeiträgen gehören (a) die Durchführung einer Datenanalyse vor dem Trainingsprozess, um ein gründliches Verständnis des Datensatzes zu ermöglichen, (b) das Training und der Vergleich verschiedener ML-Modelle, um das beste stündliche Wärmelastvorhersagemodell zu erhalten, und (c) das Angebot detaillierter Erklärungen dazu, welche Merkmale für die Modellvorhersage unbedingt erforderlich sind, die in den vorherigen Studien übersehen wurden.

Der Rest des Manuskripts ist wie folgt umrissen. Der Abschnitt „Beschreibung des Datensatzes“ enthält eine detaillierte Beschreibung des vorgeschlagenen Wärmebedarfsdatensatzes. Anschließend werden im Abschnitt „Methodik“ alle Prozesse beschrieben, die bei der Vorhersage des Wärmebedarfs eine Rolle spielen. Im Abschnitt „Experimentelle Ergebnisse“ werden mehrere Experimente durchgeführt, um den vorgeschlagenen Rahmen umfassend zu bewerten. Anschließend werden im Abschnitt „Diskussion“ die Ergebnisse diskutiert und eine detaillierte Analyse der Studie bereitgestellt. Abschließend schließen wir die Studie ab und bieten im Abschnitt „Schlussfolgerung“ zukünftige Arbeiten an.

Der in dieser Studie beschriebene Datensatz war der stündliche Wärmebedarf einer umweltfreundlichen Kraft-Wärme-Kopplungsanlage auf Basis von Flüssigerdgas (LNG) in der Region Cheongju, Korea. Die Anlage produziert rund 76,5 Gigakalorien (Gcal) lokale Wärme für das Verteilungsnetz. Gcal ist eine gängige Wärmelasteinheit, die die Wärmeenergie in Heizwerken misst. Die mit LNG betriebene Anlage ist effizienter und umweltfreundlicher bei der Erzeugung thermischer Energie, die Berichten zufolge über 70 % weniger Emissionen verursacht als Kohle- oder Ölquellen.

Der in dieser Studie eingeführte Datensatz umfasst den stündlichen Wärmeverbrauch der Bewohner einer Region von Januar 2012 bis Dezember 2020, der sich über acht Heizperioden von November bis April erstreckt. Das Wärmenutzungsprofil gibt an, wie viel Wärme in einem bestimmten Zeitraum von der Anlage an die Verbraucher übertragen wird, wobei es sich hauptsächlich um Raumheizung (SH) und Warmwasser (Warmwasser) handelt. Ergänzend zu den Wärmelastdaten wurden auch die entsprechenden stündlichen historischen Wetterdaten erhoben, um mögliche Zusammenhänge mit den Wärmelastverläufen aufzudecken. Außerdem wurde eine Feiertagsfunktion hinzugefügt, die anzeigt, ob der betrachtete Tag ein Feiertag ist, um das Verhalten der Endbenutzer zu untersuchen. Zu den drei Hauptmerkmalen der Wetterdaten gehören Windgeschwindigkeit, Luftfeuchtigkeit und Außentemperatur. Der gesammelte Wärmenutzungsdatensatz wird zur Untersuchung der stündlichen Wärmelastmuster verwendet und liefert einige Erklärungen für die Vorhersagen des Modells. Das Minimum, das Maximum, der Mittelwert und die Standardabweichung für jede Variable sind in Tabelle 1 beschrieben.

Zusammenfassend werden jährlich 8760 stündliche Wärmelastprofile und die entsprechenden historischen Temperaturdaten erfasst. Daher werden insgesamt 87.672 Einträge, darunter Datum und Uhrzeit, Feiertag, Windgeschwindigkeit, Luftfeuchtigkeit und Temperatur, als Eingangsgrößen und die Wärmelastprofile als Zielgrößen verwendet. Als Trainingsdatensatz dienten die Dateneinträge von 2012 bis 2020, während zum Testen der Modellleistung der stündliche Wärmeverbrauch von 2021 herangezogen wurde.

Abbildung 1 zeigt die drei Komponenten des stündlichen Wärmeverbrauchsvorhersagesystems: (a) Datenvorverarbeitung, (b) Musteranalyse und Datenpartitionierung und (c) erklärbare Wärmelastvorhersage.

Datenvorverarbeitung: Es besteht eine hohe Wahrscheinlichkeit, dass die strukturierten Daten einige häufige Probleme bei der Datenvorverarbeitung enthalten, z. B. doppelte Daten, fehlende Daten und negative Daten aufgrund menschlicher Fehler, die die Leistung des Systems beeinträchtigen können. Daher ist es eine Voraussetzung vor den Datenanalyse- und Trainingsprozessen, alle Fehler zu beheben und die Daten zu standardisieren.

Musteranalyse und Datenpartitionierung: Wärmenutzungsmuster spielen eine wichtige Rolle, wenn es darum geht, Fachleuten die Untersuchung des Verbraucherverhaltens zu ermöglichen. Die charakteristischen Muster des Datensatzes werden in diesem Abschnitt mithilfe verschiedener Datenanalyseansätze entdeckt, um den Datensatz vor der Trainingsphase gründlich zu analysieren. Der Datensatz wird dann in Trainings- und Testsätze unterteilt.

Erklärbare Wärmelastvorhersage: Verschiedene ML-Algorithmen wurden trainiert, um den stündlichen Wärmeverbrauch vorherzusagen. Einige Ansätze der erklärbaren künstlichen Intelligenz (XAI) werden schließlich implementiert, um die Vorhersagen des Modells zu interpretieren.

Beschreibung der Hauptkomponenten des Analyserahmens für Wärmenutzungsmuster.

Die strukturierten datenbezogenen Probleme, wie z. B. fehlende und doppelte Daten, sind während der Datenerfassung unvermeidbar und können sich negativ auf die Leistung des Modells auswirken, wenn sie nicht entsprechend korrigiert werden. Daher wird eine Datenbereinigung durchgeführt, um Fehleraufzeichnungen in Bezug auf die Daten zu Luftfeuchtigkeit, Windgeschwindigkeit, Außentemperatur und stündlichem Wärmeverbrauch zu erkennen und zu beheben. Es gibt verschiedene Datenbereinigungsprozesse, und die beiden Hauptprozesse, die in dieser Studie durchgeführt wurden, umfassen das Entfernen von Duplikaten und das Korrigieren fehlender Werte. Der Datensatz wird mithilfe von Pandas, einer bekannten Datenbearbeitungs- und Analysebibliothek, als Datenrahmen geladen. Anschließend können Dateninkonsistenzen mithilfe von Pandas unterstützter Funktionen automatisch erkannt werden.

Um die fehlenden Daten zu korrigieren, werden in der Regel Standardtechniken wie der gleitende Durchschnitt (MA) und die Imputation eingesetzt. In dieser Studie wurde die Technik des exponentiellen gewichteten gleitenden Durchschnitts (EWMA)22 angewendet, die eine Erweiterung des MA-Algorithmus ist. EWMA erachtet die jüngsten Datenpunkte mit einem höheren Gewicht als signifikant wichtig, wohingegen die Datenpunkte in der weiteren Vergangenheit ein exponentiell geringeres Gewicht erhalten. Darüber hinaus kann die EWMA-Methode aufgrund der Art des Datensatzes effektiv angewendet werden und die Unterschiede zwischen den beiden aufeinanderfolgenden Datenpunkten werden als gering angesehen. Die EWMA kann wie folgt beschrieben werden.

wobei \({E}_{t}\) den berechneten Wert zum Zeitpunkt t basierend auf der EWMA-Technik angibt. \({x}_{t}\) ist der Wert der Reihe in der aktuellen Periode. \({E}_{t-1}\) ist der EWMA im vorherigen Zeitraum. Schließlich ist \(\alpha \) der Glättungsfaktor, der zwischen 0 und 1 liegt und den Einfluss des aktuellen Werts \({x}_{t}\) auf den \({E}_{t}\) steuert. ). Ein größeres \(\alpha \) legt mehr Gewicht auf aktuelle Beobachtungen und führt zu einem reaktiveren EWMA, während ein kleineres \(\alpha \) zu einem glatteren EWMA führt.

Unter Feature Engineering versteht man den Prozess der Auswahl, Extraktion und Transformation relevanter Features oder Variablen aus Rohdaten, um die Leistung von ML-Algorithmen zu verbessern. Das Ziel des Feature Engineering besteht darin, ML-Algorithmen mit informativen und diskriminierenden Merkmalen auszustatten, die ihnen helfen können, die zugrunde liegenden Muster und Beziehungen in den Daten besser zu verstehen. Zwei Hauptprozesse im Feature-Engineering-Prozess sind Standardisierung und Feature-Transformation.

Die Anpassung des Regressionsmodells und die erlernte Funktion können durch strukturierte Daten negativ beeinflusst werden und führen schließlich zu einer Verzerrung, wenn numerische Merkmale mit unterschiedlichen Maßstäben in das Modell eingespeist werden23. Daher müssen die Normalisierungs-/Standardisierungstechniken implementiert werden, um die Eingabemerkmale zu normalisieren. Min-Max-Normalisierung und Standardisierung sind zwei gängige Ansätze zur Merkmalsskalierung24. Der Wärmeverbrauchsdatensatz, der zur Anpassung an das Modell verwendet wird, enthält die Spitzenwärmelast in bestimmten bestimmten Zeiträumen, bei denen es sich um Ausreißer handelt, und spielt während des Trainingsprozesses eine wesentliche Rolle. Die Min-Max-Normalisierung verringert wahrscheinlich die Auswirkungen dieser Outliner, indem sie alle Merkmale in einen Bereich zwischen 0 und 1 umwandelt. Die Standardisierung skaliert daher die Merkmale, um einen Mittelwert von Null zu erhalten, und in dieser Studie wird eine Standardabweichung von 1 implementiert.

Bei strukturierten Daten ist eine Merkmalstransformation erforderlich, um kategoriale Eingaben in numerische Eingaben umzuwandeln, da die meisten ML-Modelle mit numerischen Daten arbeiten. Die Feiertagsvariable ist kategorisch, da sie über zwei unterschiedliche Werte verfügt, die angeben, ob ein bestimmter Tag ein normaler Tag oder ein Feiertag ist. Infolgedessen wird eine One-Hot-Codierung angewendet, die eine binäre Darstellung des kategorialen Merkmals erstellt, um das Feiertagsmerkmal zu transformieren25. Wenn ein bestimmter Tag beispielsweise ein Feiertag ist, wird der Wert für die Feiertags-Binärvariable auf 1 gesetzt und die reguläre Binärvariable ist 0.

Die Untersuchung des Wärmenetzes in der Sommersaison, die von Juni bis August reicht, liefert spannende Einblicke in die Wärmenutzung der Stadt. Abbildung 2 zeigt die Verteilungsdichte des stündlichen Wärmebedarfs für die Sommermonate 2012 bis 2021. Der durchschnittliche Wärmebedarf im Sommer umfasst hauptsächlich den Warmwasserverbrauch und die Netzwärmeverluste. Generell ist zu erkennen, dass in der fernen Vergangenheit im Vergleich zu den letzten Jahren ein geringerer Wärmebedarf bestand. Beispielsweise ist für die Folgejahre, also von 2012 bis 2016, eine etwa ähnliche Verteilung zu beobachten, wobei der durchschnittliche Wärmebedarf bei etwa 20 Gcal liegt. Der durchschnittliche Wärmebedarf stieg jedoch auf etwa 30 Gcal, was die jüngeren Jahre 2019 bis 2021 umfasste, wobei ein teilweise höherer Wärmebedarf mit bestimmten Wärmenutzungsmustern zusammenhängt. Darüber hinaus ist in den letzten Jahren ein allmählich steigender Trend beim durchschnittlichen Wärmeverbrauch von über 40 Gcal zu verzeichnen, und das Jahr 2021 weist die höchste Dichte auf.

Verteilungsdichtediagramm des stündlichen Wärmebedarfs während der Sommersaison (Juni–August).

Das Diagramm in Abb. 3 zeigt den stündlichen Energieverbrauch des Netzes während der Wintersaison von November bis März. Das Diagramm zeigt drei unterschiedliche Muster für drei verschiedene Zeiträume: Tageszeit (06:00–18:00 Uhr), Nachtzeit (22:00–05:00 Uhr) und Spitzenzeiten (19:00–21:00 Uhr). Das Streudiagramm zeigt, dass die Verbraucher in der Spitzenzeit bei gleichem Temperaturniveau tendenziell mehr Wärme verbrauchen als in der Nacht und am Tag. Zudem ist die erforderliche Heizlast umso höher, je niedriger die Außentemperatur ist.

Streudiagramm der Außentemperatur und des Wärmeverbrauchs während der Wintersaison (November–März).

Ein typisches stündliches Wärmelastmuster für jede Jahreszeit ist in Abb. 4 zu sehen. Die Frühlings-, Herbst- und Wintersaison weist ähnliche Schwankungen in der stündlichen Zeitskala auf, die durch das soziale Verhalten der Endnutzer verursacht werden. Tagsüber sind reduzierte Wärmelasten zu beobachten, die auf die Sonneneinstrahlung zurückzuführen sind, die zu höheren Tagestemperaturen führt. Die höchste Wärmebelastung entsteht tagsüber gegen 8 Uhr morgens, um die Raumheizung in Büros und Gewerbegebäuden bereitzustellen. Der Wärmebedarf erreicht aufgrund der niedrigen Nachttemperaturen normalerweise zwischen 19:00 und 21:00 Uhr seinen Höhepunkt, wodurch mehr Wärme für Warmwasser und Warmwasser benötigt wird. Warmwasser stellt einen Großteil des Wärmebedarfs im Sommer dar, wenn ein geringfügiger Unterschied in der Wärmeschwankung zu beobachten ist.

Durchschnittliche wöchentliche Wärmelastmuster während der vier Jahreszeiten.

Die Datenpartitionierung ist ein grundlegender Schritt, der vor dem Training und der Bewertung des Modells erforderlich ist. Nach der Vorverarbeitung werden die Daten in zwei Sätze aufgeteilt: den Trainingssatz und den Testsatz. Der Trainingssatz wird zum Trainieren und Optimieren des Modells verwendet, während der Testsatz normalerweise dazu verwendet wird, die Leistung der Algorithmen in verschiedenen Szenarien zu bewerten. Als Trainingssatz wurden in dieser Studie die Wärmenutzungsprofile zwischen 2012 und 2020 verwendet, während für die Tests die Wärmelastprofile aus dem Jahr 2021 verwendet wurden. Jede Trainings- oder Testprobe besteht aus Tag, Stunde, Außentemperatur, Luftfeuchtigkeit, Windgeschwindigkeit und Feiertag als Eingabevariablen, während die Ausgabe der stündliche Wärmeverbrauch ist, der dieser bestimmten Eingabe entspricht.

In diesem Abschnitt werden die Hauptkonzepte hinter den Algorithmen Boosting, Support Vector Regression (SVR)26 und Multilayer Perceptron (MLP)27 vorgestellt, die für die Wärmebedarfsprognose implementiert wurden.

Der Boosting-Algorithmus gehört zum Ensemble-Ansatz, der nacheinander mehrere schwache Lernende hinzufügt. Jeder schwache Lernende wird hinzugefügt, indem er die gelernten Informationen seines Vorgängers nutzt und versucht, die von ihm vorhergesagten Fehler zu korrigieren. Ein schwacher Lerner kann jeder Lernalgorithmus sein, der eine etwas bessere Leistung als zufälliges Raten bietet. Zwei Standard-Boosting-Ansätze sind Gradient Boosting und adaptive Boosting28.

Adaptives Boosting: Der adaptive Boosting-Algorithmus (AdaBoost) wurde vorgeschlagen, indem nacheinander schwache Lernende hinzugefügt wurden, was die Verwendung von Entscheidungsbäumen beinhaltete, und versucht wurde, die falsch vorhergesagten Stichproben zu korrigieren, indem ihnen während des Trainingsprozesses der letzteren schwachen Lernenden ein größeres Gewicht zugewiesen wurde . Die endgültige Ausgabe des AdaBoost-Modells ist der gewichtete Median.

Gradient Boosting: AdaBoost weist immer dann neue Instanzgewichte zu, wenn ein neuer schwacher Lernender hinzugefügt wird, aber das Gradient Boosting zielt darauf ab, den neuen Prädiktor an die Restfehler anzupassen, die vom vorherigen Prädiktor verursacht werden, mit dem Hauptziel, eine Verlustfunktion zu minimieren29. Zu den beliebten Algorithmen zur Gradientenverstärkung gehören LightGBM und XGBoost.

XGBoost nutzt die Feature-Verteilung über alle Datenpunkte hinweg, um den Suchraum potenzieller Feature-Aufteilungen einzugrenzen. Das Ziel des XGBoost-Algorithmus kann wie folgt ausgedrückt werden:

wobei die Vorhersagefähigkeit von XGBoost durch die Verlustfunktion \(L\) bestimmt wird, während der Regularisierungsterm \(\mu \) zur Verwaltung der Überanpassung verwendet wird. \(\mu \) wird durch die Anzahl der Beobachter und deren Vorhersageschwelle im Ensemblemodell bestimmt. Da es sich bei dem betreffenden Problem um eine Regressionsanalyse handelt, wird als Verlustfunktion \(L\) der quadratische Mittelwert (Root Mean Square Error, RMSE) verwendet.

Im Gegensatz zu typischen Regressionsalgorithmen, die darauf abzielen, die Summe der quadratischen Fehler zwischen tatsächlichen und vorhergesagten Werten zu minimieren, versucht SVR, die optimale Hyperebene innerhalb eines benutzerdefinierten Schwellenwerts zu identifizieren. Der Schwellenwert ist der Abstand zwischen der Grenzlinie und der Hyperebene. Die Vorhersage des Wärmebedarfs ist ein komplexes nichtlineares Thema, da es mehrere Eingabevariablen hat. Um die Nichtlinearität im anfänglichen Merkmalsraum anzugehen und sie als lineares Problem im hochdimensionalen Merkmalsraum zu behandeln, erfordert SVR die Verwendung eines nichtlinearen Kernels. Der Gaussian Radial Basis Kernel (RBF) wurde in dieser Studie als Standardkernel für SVR verwendet.

Multilayer Perceptron (MLP) gehört zur Kategorie der Feedforward Artificial Neural Networks (ANN). Die Grundstruktur von MLP besteht aus einer Eingabeschicht, einer oder mehreren verborgenen Schichten mit Neuronen und einer Ausgabeschicht, die nacheinander gestapelt sind. Das Neuron ist die primäre Rechenkomponente von MLP, und Neuronen aus den aktuellen Schichten sind vollständig mit Neuronen aus der nächsten Schicht verbunden. Die Eingaben werden zu den Anfangsgewichten addiert, in eine Aktivierungsfunktion eingespeist und an die nächste Ebene weitergegeben.

In diesem Abschnitt werden alle Experimente aufgeführt, die durchgeführt wurden, um den am besten geeigneten Algorithmus zur Vorhersage des Wärmeverbrauchs zu ermitteln. Darüber hinaus wurden auch verschiedene XAI-Techniken durchgeführt, um eine tiefgreifende Analyse der trainierten Modelle zu ermöglichen.

Die Modelle zur Vorhersage der Wärmelast wurden auf scikit-learn30, einer Python-basierten Open-Source-ML-Bibliothek, erstellt und trainiert. Zu den drei wichtigsten erklärbaren KI-Bibliotheken zur Analyse der Daten gehören Partial Dependence Plot31 (PDP), ein globaler und modellagnostischer XAI-Algorithmus, und lokal interpretierbare modellagnostische Erklärungen32 (LIME), die eine lokale Modellnäherung des Modells um die Vorhersage herum erstellen von Interesse und Shapley Additive Erklärungen33 (SHAP), die einen spieltheoretischen Ansatz verwenden.

Zur Bewertung der Wärmebedarfsprognose wurden drei Standardbewertungsmetriken berechnet, darunter das Bestimmtheitsmaß (\({R}^{2}\)), der mittlere quadratische Fehler (MSE) und der mittlere absolute Fehler (MAE). MSE wird berechnet, indem die quadrierte Differenz zwischen den vorhergesagten Werten und den tatsächlichen Werten für alle Trainingsstichproben gemittelt wird34. Andererseits ist MAE der Durchschnitt der absoluten Differenzen zwischen den vorhergesagten Werten und den wahren Werten. Während MSE die Standardabweichung der Residuen misst, berechnet MAE den Durchschnitt der Residuen im Datensatz. \({R}^{2}\) wird berechnet, indem der Anteil der vom Algorithmus vorhergesagten Varianz der abhängigen Variablen bestimmt wird. Je niedriger die MSE- und MAE-Werte sind, desto besser ist die Leistung des Modells. Allerdings gilt ein höherer Wert von \({R}^{2}\) als besser. Die drei Metriken lassen sich wie folgt formulieren.

Dabei ist \(N\) die Gesamtzahl der Trainingsbeispiele. \({y}_{i}\) gibt den tatsächlichen Wert an, \({\widehat{y}}_{i}\) bedeutet den vorhergesagten Wert des \(i\)-ten Profils und \(\overline {y }\) ist der Mittelwert von \(y\).

In dieser Studie wurden fünf Regressionsmodelle implementiert, um die Wärmebedarfsprognose durchzuführen, darunter SVR, AdaBoost, XGBoost, LightGBM und MLP. Jedes Modell hat seine entscheidenden Hyperparameter, die vor dem Training bestimmt werden müssen. Die Hyperparameter steuern das Trainingsverhalten der Lernalgorithmen und haben erheblichen Einfluss auf die Leistung des Modells.

Tabelle 2 zeigt die Hyperparameter und den Wertebereich für jeden Hyperparameter, der von den fünf Modellen benötigt wird. Als nächstes wurde eine Rastersuchmethode für die verschiedenen Kombinationen der Hyperparameter jedes Algorithmus durchgeführt, um die am besten geeignete Hyperparameterkombination zu ermitteln, die dem Algorithmus dabei hilft, die beste Leistung zu erzielen.

Abbildung 5 zeigt den Leistungs- und Skalierbarkeitsvergleich von fünf verschiedenen Lernalgorithmen anhand der Lernkurven, um den Effekt des Hinzufügens weiterer Proben während des Trainingsprozesses zu zeigen. Das Experiment umfasste die zufällige Auswahl von Stichproben aus dem Trainingsdatensatz. Ein Trainingsbeispiel umfasst als Merkmale Datum, Außentemperatur, Windgeschwindigkeit, Luftfeuchtigkeit, Feiertag und stündlichen Wärmebedarf.

Leistung bei der Prognose des Wärmebedarfs mithilfe von fünf verschiedenen Algorithmen.

Im Allgemeinen lässt sich der Schluss ziehen, dass SVR und MLP sehr empfindlich auf die Datensatzgröße reagierten, da sie stark schwankten, je mehr Trainingsstichproben hinzugefügt wurden. Andererseits zeigten die Boosting-Algorithmen, zu denen AdaBoost, LightGBM und XGBoost gehörten, ihre Vorteile und Wirksamkeit bei einem größeren Datensatz. Die drei Ensemble-Algorithmen zeigten ähnliche Variationstendenzen; Der Fehler nahm allmählich ab und stabilisierte sich schließlich. Für die drei Boosting-Algorithmen wurden niedrige MSE-Werte von weniger als 0,02 erzielt, wenn die Größe des Trainingsdatensatzes über 2000 Stichproben betrug. XGBoost erreichte den niedrigsten mittleren quadratischen Fehler von weniger als 0,01 unter den drei Algorithmen und zeigte seine Robustheit, als die Anzahl der Trainingsbeispiele 7000 erreichte. Daher wurde XGBoost als primäres Modell für die folgenden Experimente verwendet.

Tabelle 3 zeigt die Leistung der Wärmebedarfsprognose unter Verwendung von fünf ML-Algorithmen für den Testdatensatz. Alle Modelle erzielten im Allgemeinen gute Leistungen im Datensatz. Die Boosting-Algorithmen schnitten besser ab als SVR und MLP. Der XGBoost-Algorithmus erreichte die höchsten Werte für \({\mathrm{R}}^{2}\), MSE und MAE mit 0,95, 0,12 bzw. 0,15. Andererseits zeigte MLP mit einem MSE-Wert von 0,25 und R2 von 0,89 die niedrigste Leistung bei der Vorhersage des Wärmeverbrauchs.

Abbildung 6 vergleicht den tatsächlichen und den prognostizierten Wärmebedarf für 2021 anhand des XGBoost-Modells. Die vom Modell vorhergesagten Wärmenutzungswerte, die durch die rote Linie dargestellt sind, ähneln in etwa den tatsächlichen Wärmenutzungswerten, die durch die blaue Linie dargestellt sind. Darüber hinaus wurde der Spitzen- und Unterhitzeverbrauch jedes Monats genau vorhergesagt. Allerdings wurde die Modellleistung erheblich beeinträchtigt, was auf einige ungewöhnliche Wärmenutzungsverhaltensweisen der Endbenutzer zurückzuführen ist.

Ergebnisse der täglichen Wärmelastvorhersage für den Testdatensatz.

Im vorherigen Abschnitt wurde erläutert, welches Modell die höchste Prognoseleistung für den Wärmeverbrauch erzielte. Es ist jedoch schwierig aufzudecken, welche Merkmale Einfluss haben und wie sie sich auf die Modellvorhersagen auswirken. Daher werden in diesem Abschnitt einige interessante XAI-Ansätze implementiert, um zu erklären, wie ML-Modelle die Ergebnisse vorhersagen.

Zunächst wurden drei verschiedene Merkmalsrankingtechniken implementiert, um die Bedeutung jedes Merkmals im Hinblick auf die Vorhersage des Ausgangswärmeverbrauchs durch das Modell zu bewerten, wie in Abb. 7 dargestellt. Abbildung 7a berechnet die relative Bedeutung eines Merkmals durch Untersuchung des Mittelwerts und der Standardabweichung von Reduzierung der Verunreinigungen in jedem Baum. Abbildung 7b ordnet die Feature-Wichtigkeit ein, indem die theoretisch optimalen Shapley-Werte des Spiels berechnet werden33. Die resultierenden Shapley-Werte liefern ein Maß für die relative Bedeutung jedes Merkmals in der Modellvorhersage für einen bestimmten Datenpunkt. Dazu ist es erforderlich, jede mögliche Merkmalskombination zu untersuchen und den marginalen Einfluss jedes Merkmals auf die Vorhersage zu bewerten. Merkmale mit höheren Shapley-Werten werden als bedeutsamer angesehen. Die Einstufung beider Ansätze zeigt, dass die Temperatur- und Monatsmerkmale von entscheidender Bedeutung sind. Dies gilt auch deshalb, weil das Wärmebedarfsmuster der Endnutzer von diesen beiden Merkmalen erheblich beeinflusst wird.

Merkmalswichtigkeitsanalyse für das Wärmenutzungsvorhersagemodell.

Schließlich visualisiert Abb. 7c die von LIME bewertete Merkmalsbedeutung. Positive Gewichtungen zeigen an, dass ein Merkmal eine positive Vorhersage fördert, während negative Gewichte das Gegenteil anzeigen. Die Größe des Gewichts repräsentiert die Wichtigkeit des Merkmals. Auffällig ist, dass eine Temperatur von 4 °C oder niedriger (kalte Jahreszeit) das Modell dazu drängt, einen höheren Wärmeverbrauch abzugeben.

Das vorherige Experiment zeigte, dass die Temperatur- und Monatsmerkmale einen großen Einfluss auf die Vorhersagen des Modells hatten, erklärte jedoch nicht genau, wie das Modell beeinflusst wurde. Daher wurde PDP implementiert, um den marginalen Einfluss eines Merkmals auf die Vorhersage der Modelle zu demonstrieren.

Abbildung 8 zeigt in Form von Höhenlinien, wie sich Temperatur und Monat zusammen auf den Wärmeverbrauch auswirken. Es hat sich gezeigt, dass Contour am besten für die Analyse der Auswirkung kontinuierlicher Merkmale im PDP-Interaktionsdiagramm geeignet ist35.

PDP-Interaktionsdiagramm für die Temperatur- und Monatsfunktionen.

Die Höhenlinien im Bereich von 0,000 bis 150,000 zeigen an, wie sich bestimmte Bereiche der beiden Merkmale auf den Wärmeverbrauch auswirken. Ein höherer Wert der Konturlinie impliziert einen größeren Einfluss der beiden Merkmale auf den Wärmeverbrauch. Während der Sommersaison beispielsweise, wenn die Durchschnittstemperatur über 22 °C liegt, haben die Merkmale einen negativen Einfluss auf die Modellvorhersage, was zu einem durchschnittlichen Wärmebedarf von weniger als 50 Gcal und einem Konturlinienwert von unter 25.000 führt. Andererseits wirken sich Konturlinienwerte über 125.000, die der Wintersaison mit einer Durchschnittstemperatur von weniger als 2 °C entsprechen, positiv auf die Modellvorhersage aus und führen zu einem durchschnittlichen Wärmeverbrauch von über 120 Gcal.

Abbildung 9 veranschaulicht, wie sich die Temperaturfunktion auf den Wärmebedarf durch die Verteilung des tatsächlichen Wärmebedarfs über feste Werte der Temperaturvariablen auswirkt. Es war zu beobachten, dass die stündliche Wärmebelastung den größten Durchschnittswert erreichte, der bei etwa 150 Gcal lag, wenn die Temperaturkurve zwischen -16,5 °C und -0,6 °C lag, was auf die Wintersaison hinweist. Darüber hinaus sank der stündliche Wärmebedarf mit zunehmender Temperatur allmählich. Der niedrigste stündliche Wärmebedarf, etwa 21 Gcal, wurde bei einer Temperatur zwischen 26,9 und 38,1 °C gemessen, was der Sommersaison entspricht.

Diagramm der tatsächlichen Vorhersagen für die Temperaturvariable. Verteilung der tatsächlichen Vorhersage über verschiedene Variablenwerte.

Basierend auf den Daten können wir schließen, dass der stündliche Wärmebedarf direkt proportional zur Temperatur ist. Im Sommer macht Warmwasser den Großteil des Wärmebedarfs aus. Im Winter hingegen tragen sowohl Warmwasser als auch Warmwasser zum Wärmebedarf bei. Darüber hinaus ist der stündliche Wärmebedarf im Winter bei Temperaturen unter 10 °C höher und im Sommer bei Temperaturen über 26 °C niedriger.

In der Vergangenheit wurden zahlreiche Studien durchgeführt, um den DH-Kopfbedarf vorherzusagen und zu analysieren. Direkte Vergleiche mit diesen Studien sind jedoch aufgrund der Unterschiede in den DH-Netzwerkdesigns, Eingabedaten und Architekturimplementierungen oder Versuchsaufbauten schwierig. Wir verwenden Betriebsdaten des DHS, um Wärmenutzungsmuster vorherzusagen und vergleichen unsere Ergebnisse mit dem XGBoost-Modell, das die beste Vorhersageleistung aufweist. Der in dieser Studie aufgezeichnete MAE-Wert betrug 15 %, was kleiner ist als der von Huang et al.36 berichtete MAE-Wert von 18,07 %. Darüber hinaus sind die berechneten Bewertungsmetriken auch den folgenden Untersuchungen überlegen37,38. Insbesondere übertrifft das vorgeschlagene XGBoost-Modell die von Ivanko et al.38 vorgeschlagene Studie in Bezug auf MSE und Korrelationskoeffizient und erreicht 12 % bzw. 0,95 im Testsatz, verglichen mit MSE von 45,04 % und einem Bestimmtheitsmaß von 0,81. In Bezug auf den Korrelationskoeffizienten zeigt die XGBoost-Methode auch eine bessere stündliche Vorhersageleistung als das von Bünning et al.37 vorgeschlagene ANN-Modell mit einem Korrelationskoeffizienten von 0,95 für eine Stunde im Vergleich zu 0,88.

Dieser Abschnitt bietet eine Diskussion basierend auf unserem Ansatz und den erzielten Ergebnissen. Darüber hinaus wird auch eine Diskussion über die Interpretierbarkeit der Studie vorgestellt.

Um das beste Modell zur Vorhersage des Wärmebedarfs zu ermitteln, wurden fünf verschiedene Modelle mit unterschiedlich großen Trainingsdatensätzen evaluiert. Anschließend wurden drei Bewertungsmetriken (MSE, MAE und \({\mathrm{R}}^{2}\)) berechnet. Abbildung 5 zeigt den Lerntrend dieser Modelle mit zunehmender Anzahl von Trainingsbeispielen. Wenn die Größe des Trainingsdatensatzes weniger als 2000 beträgt, weisen MLP und SVR die höchste Genauigkeit auf. Allerdings weisen diese Modelle Nachteile auf, wie z. B. die Notwendigkeit sequenzieller Daten und verlängerter Trainingszeiten, wodurch sie besser für Anwendungen geeignet sind, die längere Trainingszeiten bewältigen können. Andererseits ist die Genauigkeit der drei Boosting-Algorithmen bei größeren Trainingsdatensätzen (über 2000 Stichproben) höher. Boosting-Algorithmen wie AdaBoost und XGBoost eignen sich aufgrund ihrer kurzen Trainingszeit, Stabilität und Prognosegenauigkeit besser für eine detaillierte Steuerung und häufige Aktualisierung. Dennoch können alle Modelle nach dem Training schnell (innerhalb einer Sekunde) Vorhersagen generieren. Daher ist die für das Training und Umschulung der Modelle erforderliche Zeit die Hauptbeschränkung für ihre Gesamtimplementierung.

Kollinearität, die sich auf die Korrelation zwischen Prädiktorvariablen bezieht, ist in realen Daten immer vorhanden29. Allerdings variiert der Einfluss der Kollinearität auf Vorhersagemodelle aufgrund unterschiedlicher Prinzipien. Zuvor wurden mehrere Ansätze zur Lösung von Kollinearitätsproblemen eingeführt, beispielsweise eine Vorauswahl auf der Grundlage von Schwellenwerten, Clustering-Prädiktoren und Regularisierungstechniken. Die Regularisierung ist eine Methode zur Reduzierung der Komplexität des SVM-Modells und zur Verhinderung einer Überanpassung14. In ähnlicher Weise können auf Boosting basierende Modelle wie AdaBoost, Im Gegensatz dazu ist die Fähigkeit von MLP, Kollinearität zu widerstehen, relativ schwach, was seine relativ geringe Genauigkeit erklären könnte.

Die Art und Weise der Wärmeverteilung variiert stark je nach Größe des Fernwärmenetzes, und der vorgeschlagene Rahmen ist für kleinere Netze geeignet, bei denen das Verhalten der Kunden einen Einfluss auf das Lastmuster hat. Es ist möglich, das Rahmenwerk auf andere kleine Fernwärmenetze anzuwenden, um den stündlichen Wärmebedarf vorherzusagen, sofern Aufzeichnungen über den stündlichen Wärmebedarf und Umweltfaktoren wie Windgeschwindigkeit, Luftfeuchtigkeit und Temperatur verfügbar sind.

Unter Modellinterpretierbarkeit für KI-Modelle versteht man die Fähigkeit, die Trainings- und Testprozesse in logische Regeln umzuwandeln. Die Fähigkeit des Modells, die Signifikanz und Rangfolge von Eingabevariablen39 anzuzeigen, ermöglicht eine Interpretierbarkeit. Die Interpretierbarkeit eines Vorhersagemodells ist entscheidend für die Bewertung der Rationalität des Wärmebedarfs in einem Fernwärmenetz. Eine mangelnde Konformität mit anerkannten Grundsätzen in variabler Bedeutung kann auf eine Modellinstabilität oder eine Systemstörung hinweisen4. Boosting-basierte Methoden sind gut interpretierbar, da sie keine Interpretation von Baumstrukturen durch ML-Experten erfordern und jede Entscheidung einer logischen Regel entspricht14. Diese Modelle können visuelle Ergebnisse variabler Bedeutung ausgeben, wobei Gewicht und Rang der Variablen je nach den inhärenten Prinzipien des Modells unterschiedlich sind, wie in Abb. 7 dargestellt. Temperatur und Monat waren jedoch durchweg die einflussreichsten Variablen, wobei Luftfeuchtigkeit und Feiertag einen Einfluss hatten vernachlässigbare Auswirkungen, was auf den begrenzten Einfluss dieser Variablen auf den Wärmeverbrauch hinweist.

Andererseits waren SVR und MLP weniger interpretierbar, da MLP aufgrund seiner Schwierigkeit bei der Identifizierung der aus jeder Schicht des Netzwerks extrahierten Merkmale als Black-Box-Methode angesehen wurde. Die Verwendung einer linearen Kernelfunktion in SVR führt zu einem besser interpretierbaren Modell, Modelle mit anderen Kerneln können jedoch schwierig zu interpretieren sein39.

Die stündliche Prognose des Wärmebedarfs ist für Wärmeversorger unerlässlich, um die Wärmeproduktion und den Wärmeversorgungsbetrieb zu optimieren. In dieser Studie wird ein System zur Vorhersage des stündlichen Wärmeverbrauchs vorgestellt, das auf Standard-Regressionsalgorithmen basiert und den Einfluss der Eingabemerkmale auf die Ergebnisse der Modelle systematisch untersucht.

Zunächst wurden während des Datenerfassungsprozesses zusätzliche Wetterinformationen extrahiert, zu denen die Außentemperatur, die Windgeschwindigkeit und die Luftfeuchtigkeit des entsprechenden stündlichen historischen Wärmebedarfs gehören, und diese wurden als Eingabemerkmale verwendet. Anschließend wurden verschiedene Datenvorverarbeitungsverfahren implementiert, um den Datensatz zu bereinigen. Der vorverarbeitete Datensatz wurde verwendet, um die allgemeinen Wärmebedarfsmuster gründlich zu analysieren. Schließlich wurde der Datensatz in fünf bekannte Regressionsalgorithmen eingegeben, nämlich SVR, MLP, XGBoost, AdaBoost und LightGBM, um anhand von Standardbewertungsmetriken zu bestimmen, welches Modell für die Wärmenutzungsvorhersageaufgabe am besten geeignet ist.

Das XGBoost-Modell erreichte in verschiedenen Experimenten den niedrigsten MSE, der unter 0,01 lag, und war robust, als die Anzahl der Proben im Trainingsdatensatz zunahm. Schließlich wurden verschiedene XAI-Methoden wie SHAP und PDP angewendet, um gründlich zu analysieren, wie das Modell eine bestimmte Vorhersage lieferte. Die Ergebnisse zeigten, dass temperatur- und zeitbezogene Variablen die kritischsten Merkmale sind, die zu den Vorhersagen des Modells beitragen.

Künftig wird mehr Aufmerksamkeit auf neuartige Techniken zur Wärmelastvorhersage gerichtet, beispielsweise auf die Multi-Step-Ahead-Vorhersage. Darüber hinaus kann das Sammeln eines größeren Datensatzes mit zusätzlichen Variablen die Leistung und Effizienz des Modells verbessern.

Die während der aktuellen Studie verwendeten und/oder analysierten Datensätze sind auf begründete Anfrage beim entsprechenden Autor erhältlich.

Der Quellcode für alle in dieser Studie vorgestellten Analysen ist in diesen GitHub-Repositories zu finden: https://github.com/minhdl93/HeatLoadAnalysis.

Lund, H. et al. Der Stand der Fernwärme der 4. Generation: Forschung und Ergebnisse. Energie 164, 147–159 (2018).

Artikel Google Scholar

Barone, G., Buonomano, A., Forzano, C. & Palombo, A. Ein neuartiges dynamisches Simulationsmodell für die thermoökonomische Analyse und Optimierung von Fernwärmesystemen. Energiewandler. Verwalten. 220, 113052 (2020).

Artikel Google Scholar

Dorotić, H., Pukšec, T. & Duić, N. Multi-Ziel-Optimierung von Fernwärme- und Fernkältesystemen für einen Zeithorizont von einem Jahr. Energie 169, 319–328 (2019).

Artikel Google Scholar

Guelpa, E. & Verda, V. Wärmeenergiespeicherung in Fernwärme- und Fernkühlsystemen: Ein Überblick. Appl. Energie 252, 113474 (2019).

Artikel Google Scholar

Buffa, S., Cozzini, M., D'antoni, M., Baratieri, M. & Fedrizzi, R. Fernwärme- und Fernkältesysteme der 5. Generation: Ein Überblick über bestehende Fälle in Europa. Erneuern. Aufrechterhalten. Energy Rev. 104, 504–522 (2019).

Artikel Google Scholar

Dang, LM et al. Analyse täglicher und saisonaler Wärmenutzungsmuster in Wärmenetzen. Wissenschaft. Rep. 12, 1–12 (2022).

Google Scholar

Xue, P. et al. Mehrstufige Vorhersage der Wärmelast in Fernwärmesystemen mithilfe von Algorithmen für maschinelles Lernen. Energie 188, 116085 (2019).

Artikel Google Scholar

Zhao, Y., Zhang, C., Zhang, Y., Wang, Z. & Li, J. Ein Überblick über Data-Mining-Technologien in Gebäudeenergiesystemen: Lastvorhersage, Mustererkennung, Fehlererkennung und Diagnose. Energie gebaute Umwelt. 1, 149–164 (2020).

Artikel Google Scholar

Guo, Y. et al. Auf maschinellem Lernen basierende Vorhersage des thermischen Reaktionszeit-Energiebedarfs für Gebäudeheizungssysteme. Appl. Energie 221, 16–27 (2018).

Artikel Google Scholar

Wang, Z., Hong, T. & Piette, MA Vorhersage der thermischen Belastung von Gebäuden durch flaches maschinelles Lernen und tiefes Lernen. Appl. Energie 263, 114683 (2020).

Artikel Google Scholar

Nageler, P. et al. Vergleich dynamischer städtischer Gebäudeenergiemodelle (UBEM): Sigmoid-Energiesignatur und physikalischer Modellierungsansatz. Energieaufbau. 179, 333–343 (2018).

Artikel Google Scholar

Westermann, P., Deb, C., Schlüter, A. & Evins, R. Unüberwachtes Lernen von Energiesignaturen zur Identifizierung des Heizsystems und des Gebäudetyps mithilfe von Smart-Meter-Daten. Appl. Energie 264, 114715 (2020).

Artikel Google Scholar

Luo, X. et al. Merkmalsextraktion und genetischer Algorithmus verbesserten adaptives tiefes neuronales Netzwerk zur Vorhersage des Energieverbrauchs in Gebäuden. Erneuern. Aufrechterhalten. Energy Rev. 131, 109980 (2020).

Artikel Google Scholar

Ntakolia, C., Anagnostis, A., Moustakidis, S. & Karcanias, N. Maschinelles Lernen im Fernwärme- und Fernkältesektor: Ein Rückblick. Energiesystem. 13, 1–30 (2022).

Artikel Google Scholar

Guelpa, E., Marincioni, L., Capone, M., Deputato, S. & Verda, V. Vorhersage der thermischen Belastung in Fernwärmesystemen. Energie 176, 693–703 (2019).

Artikel Google Scholar

Rouleau, J. & Gosselin, L. Auswirkungen der COVID-19-Sperre auf den Energieverbrauch in einem kanadischen Sozialwohnungsgebäude. Appl. Energie 287, 116565 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Idowu, S., Saguna, S., Åhlund, C. & Schelén, O. Angewandtes maschinelles Lernen: Prognose der Wärmelast im Fernwärmesystem. Energieaufbau. 133, 478–488 (2016).

Artikel Google Scholar

Bourdeau, M., Qiang Zhai, X., Nefzaoui, E., Guo, X. & Chatellier, P. Modellierung und Prognose des Energieverbrauchs von Gebäuden: Ein Überblick über datengesteuerte Techniken. Aufrechterhalten. Städte Soc. 48, 101533 (2019).

Artikel Google Scholar

Saloux, E. & Candanedo, JA Prognose des Fernwärmebedarfs mithilfe von Algorithmen für maschinelles Lernen. Energy Procedia 149, 59–68 (2018).

Artikel Google Scholar

López, M., Sans, C., Valero, S. & Senabre, C. Klassifizierung besonderer Tage in der kurzfristigen Lastvorhersage: Die spanische Fallstudie. Energies 12(7), 1253 (2019).

Artikel Google Scholar

Noussan, M., Jarre, M. & Poggio, A. Reale Betriebsdatenanalyse zu Fernwärmelastmustern. Energie 129, 70–78 (2017).

Artikel Google Scholar

Sukparungsee, S., Areepong, Y. & Taboran, R. Exponentiell gewichteter gleitender Durchschnitt – Diagramme mit gleitendem Durchschnitt zur Überwachung des Prozessmittelwerts. PLoS ONE 15, e0228208 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Harrell, FE Allgemeine Aspekte der Anpassung von Regressionsmodellen 13–44 (Springer, 2015).

Google Scholar

Munkhdalai, L. et al. Mischung aus Aktivierungsfunktionen mit erweiterter Min-Max-Normalisierung für die Forex-Marktvorhersage. IEEE Access 7, 183680–183691 (2019).

Artikel Google Scholar

Okada, S., Ohzeki, M. & Taguchi, S. Effiziente Partitionierung ganzzahliger Optimierungsprobleme mit One-Hot-Codierung. Wissenschaft. Rep. 9, 1–12 (2019).

Artikel Google Scholar

Zhang, F. & O'Donnell, LJ Support Vector Regression 123–140 (Elsevier, 2020).

Google Scholar

Liu, Y., Liu, S., Wang, Y., Lombardi, F. & Han, J. Ein stochastisches rechnerisches mehrschichtiges Perzeptron mit Rückwärtsausbreitung. IEEE Trans. Berechnen. 67, 1273–1286 (2018).

Artikel MathSciNet Google Scholar

Azmi, SS, Baliga, S. Ein Überblick über Boosting-Entscheidungsbaumalgorithmen unter Verwendung der AdaBoost- und XGBoost-Boosting-Strategien. Int. Res. J. Eng. Technol. 2020, 7.

Bentéjac, C., Csörgő, A. & Martínez-Muñoz, G. Eine vergleichende Analyse von Gradienten-Boosting-Algorithmen. Artif. Intel. Rev. 54, 1937–1967 (2021).

Artikel Google Scholar

Pedregosa, F. et al. Scikit-learn: Maschinelles Lernen in Python. J. Mach. Lernen. Res. 12, 2825–2830 (2011).

MathSciNet MATH Google Scholar

Moosbauer, J., Herbinger, J., Casalicchio, G., Lindauer, M. & Bischl, B. Erklären der Hyperparameteroptimierung mittels partieller Abhängigkeitsdiagramme. Adv. Neuronal. Inf. Verfahren. Syst. 34, 2280–2291 (2021).

Google Scholar

Visani, G., Bagli, E., Chesani, F., Poluzzi, A. & Capuzzo, D. Statistische Stabilitätsindizes für LIME: Zuverlässige Erklärungen für Modelle des maschinellen Lernens erhalten. J. Oper. Res. Soc. 73(1), 91–101 (2022).

Artikel Google Scholar

Sundararajan, M., Najmi, A. Die vielen Shapley-Werte zur Modellerklärung. In Proceedings of the International Conference on Machine Learning, 2020, 9269–9278.

Chicco, D., Warrens, MJ & Jurman, G. Das Bestimmtheitsmaß R-Quadrat ist bei der Auswertung der Regressionsanalyse aussagekräftiger als SMAPE, MAE, MAPE, MSE und RMSE. PEERJ. Berechnen. Wissenschaft. 7, e623 (2021).

Artikel PubMed PubMed Central Google Scholar

Greenwell, BM pdp: ein R-Paket zum Erstellen partieller Abhängigkeitsdiagramme. RJ. 9(1), 421 (2017).

Artikel Google Scholar

Huang, Y. et al. Eine neuartige Strategie zur Vorhersage des Energiebedarfs für Wohngebäude basierend auf Ensemble-Lernen. Energy Procedia 158, 3411–3416 (2019).

Artikel Google Scholar

Bünning, F., Heer, P., Smith, RS & Lygeros, J. Verbesserte Tagesvorhersage für den Wärmebedarf durch Online-Korrekturmethoden. Energieaufbau. 211, 109821 (2020).

Artikel Google Scholar

Ivanko, D., Sørensen, Å. L. & Nord, N. Auswahl des Modells und der Einflussvariablen für die Vorhersage der Warmwasser-Wärmenutzung in Hotels in Norwegen. Energieaufbau. 228, 110441 (2020).

Artikel Google Scholar

Minh, D., Wang, HX, Li, YF und Nguyen, TN Erklärbare künstliche Intelligenz: Eine umfassende Übersicht. Artif. Intel. Rev. 2022, 1–66.

Referenzen herunterladen

Diese Arbeit wurde durch das Basic Science Research Program über die National Research Foundation of Korea (NRF) unterstützt, finanziert vom Bildungsministerium (2020R1A6A1A03038540) und durch einen Zuschuss (20212020900150) von „Development and Demonstration of Technology for Customers Bigdata-based Energy Management“. im Bereich der Wärmeversorgungskette“, finanziert vom Ministerium für Handel, Industrie und Energie der koreanischen Regierung und vom Institute of Information and Communications Technology Planning and Evaluation (IITP), finanziert von der koreanischen Regierung (MSIT) (Nr. 2022-0). -00106, Entwicklung eines erklärbaren KI-basierten Diagnose- und Analyserahmens unter Verwendung von Big Data zum Energiebedarf in mehreren Bereichen.

Abteilung für Informations- und Kommunikationstechnik und Konvergenztechnik für intelligente Drohnen, Sejong-Universität, Seoul, Republik Korea

L. Minh Dang & Hyoung-Kyu Song

Abteilung für Künstliche Intelligenz, Sejong-Universität, Seoul, Republik Korea

Staat Shin

Fakultät für Informatik und Ingenieurwesen, Sejong-Universität, Seoul, Republik Korea

Yanfen Li & Hyeonjoon Moon

School of Computing, Gachon University, 1342 Seongnam-daero, Sujeong-gu, Seongnam-si, Gyeonggi-do, 13120, Republik Korea

Lilia Tightiz

Abteilung für Architekturingenieurwesen, Sejong-Universität, 209 Neungdong-ro, Gwangjin-gu, Seoul, 05006, Republik Korea

Tan Nguyen

Sie können diesen Autor auch in PubMed Google Scholar suchen

HM und HS akquirierten die Finanzierung und betreuten die Studie. YL, LT und TN führten die Datenerfassung, Vorverarbeitung und experimentelle Validierung durch. LD hat den Originalentwurf geschrieben. JS hat das Manuskript überarbeitet. Alle Autoren haben die Version des Manuskripts gelesen und der Veröffentlichung zugestimmt.

Korrespondenz mit Hyeonjoon Moon.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Dang, LM, Shin, J., Li, Y. et al. Auf dem Weg zu einer erklärbaren Vorhersage von Wärmelastmustern für Fernwärme. Sci Rep 13, 7434 (2023). https://doi.org/10.1038/s41598-023-34146-3

Zitat herunterladen

Eingegangen: 06. Januar 2023

Angenommen: 25. April 2023

Veröffentlicht: 08. Mai 2023

DOI: https://doi.org/10.1038/s41598-023-34146-3

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.