neue Gliederung

Daten einfügen geschrieben
This commit is contained in:
Henrik Mertens 2022-05-29 09:51:12 +02:00
parent fab128fa0e
commit 0f36c31593
9 changed files with 35 additions and 106 deletions

View file

@ -42,5 +42,6 @@
},
],
"terminal.integrated.shell.linux": null,
"latex-workshop.view.pdf.viewer": "tab"
"latex-workshop.view.pdf.viewer": "tab",
"cSpell.language": "de-DE,de"
}

Binary file not shown.

View file

@ -87,7 +87,7 @@
\include{chapter/InfluxDB}
\include{chapter/Praxisteil}
%\include{chapter/Praxisteil}
\include{chapter/Zusammenfassung}

View file

@ -67,6 +67,12 @@ auf Platz 29.\footnote{\cite[vgl.][]{dbranking}}
\end{minipage}
\end{figure}
Allerdings haben Datenbanken die nur auf das verarbeiten von Time Series Data ausgelegt sind deutliche Performance Vorteile
gegenüber Multi Model Datenbanken. In einem Vergleich von InfluxDB und MongoDB hat InfluxDB eine 2,4 mal bessere
Schreibperformance als MongoDB und ist beim lesen sogar 5,7 mal schneller. InfluxDB benötigt außerdem 20 mal weniger
Speicherplatz auf der Festplatte um die gleiche Menge an Daten zu speichern.\footnote{\cite[vgl.][]{InfluxDBvsMongo}}
% Der Teil kommt in die Arbeit wenn ich zu wenig Seiten habe
%Wie in \cref{fig:tsdb-ranking} zu sehen ist influxDB die mit Abstand belibteste \gls{TSDB}. Unter den gezeigten Datenbanken ist Prometheus eine
%besonderheit denn dieses Datenbanksystem ist d
@ -81,3 +87,17 @@ auf Platz 29.\footnote{\cite[vgl.][]{dbranking}}
%\end{minipage}
%\end{figure}
\subsection{{Entwicklungsumgebung}}
\subsubsection{{Docker}}
%Docker und Docker Compose
\subsubsection{{Python und Jupyter Notebooks}}
% Python
% Jupyter Notebooks
\subsubsection{{InfluxDB installation}}

Binary file not shown.

View file

@ -1,103 +1 @@
\section{Wetterdaten verarbeiten}
\subsection{{Entwicklungsumgebung}}
\subsubsection{{Docker}}
%Docker und Docker Compose
\subsubsection{{Python und Jupyter Notebooks}}
% Python
% Jupyter Notebooks
\subsubsection{{InfluxDB installation}}
\subsection{{Wetterdaten}}
\subsubsection{{Wetterdaten Aufbau}}
Die Wetterdaten des DWD können über den CDC OpenData Bereich heruntergeladen werden. Hier werden die Wetterdaten über FTP und HTTPS zum Download angeboten.
Unter der URL \url{https://www.dwd.de/DE/leistungen/cdc/cdc_ueberblick-klimadaten.html} wird eine gute übersicht über die zum Download angeboten Daten geboten.
Die Werte für die aktuelle Lufttemperatur können über \url{https://opendata.dwd.de/climate_environment/CDC/observations_germany/climate/10_minutes/air_temperature/now/}
abgerufen werden. Historische Daten können über \url{https://opendata.dwd.de/climate_environment/CDC/observations_germany/climate/10_minutes/air_temperature/now/}
abgerufen werden.
Aktuell werden auf der Webseite für die aktuelle Lufttemperatur ca 480 Datein zum Download angeboten. Die meisten dieser Datein entspricht einer Messstatione
und je nach Tageszeit kann deswegen die Menge der Daten varieiren, weil immer um 00:00 eine neue Datei angefangen wird. In den Zip Dateinen finden sich außerdem
Metadaten über die Messtationen. Die eigentlichen Daten sind als CSV formatiert und sehen aus wie in Listing~\ref{list:wetter_csv} dargestellt
\begin{figure}[bht]
\begin{lstlisting}[caption=Wetterdaten CSV, label=list:wetter_csv]
STATIONS_ID;MESS_DATUM; QN;PP_10;TT_10;TM5_10;RF_10;TD_10;eor
73;202205120000; 2; -999; 12.9; 11.2; 84.2; 10.3;eor
73;202205120010; 2; -999; 12.7; 11.2; 84.9; 10.2;eor
73;202205120020; 2; -999; 12.9; 11.4; 83.0; 10.1;eor
73;202205120030; 2; -999; 12.4; 10.7; 86.9; 10.3;eor
73;202205120040; 2; -999; 12.4; 10.5; 86.2; 10.2;eor
73;202205120050; 2; -999; 12.3; 10.3; 85.5; 9.9;eor
73;202205120100; 2; -999; 12.1; 10.1; 88.1; 10.2;eor
73;202205120110; 2; -999; 11.7; 9.9; 90.1; 10.1;eor
73;202205120120; 2; -999; 11.7; 10.0; 89.0; 10.0;eor
73;202205120130; 2; -999; 11.9; 10.2; 86.3; 9.7;eor
73;202205120140; 2; -999; 12.3; 10.6; 83.5; 9.6;eor
73;202205120150; 2; -999; 12.4; 10.9; 83.3; 9.7;eor
73;202205120200; 2; -999; 11.7; 9.8; 86.2; 9.5;eor
73;202205120210; 2; -999; 11.6; 9.6; 88.5; 9.8;eor
73;202205120220; 2; -999; 11.4; 9.4; 88.6; 9.6;eor
73;202205120230; 2; -999; 11.8; 9.9; 88.7; 10.0;eor
73;202205120240; 2; -999; 11.4; 9.9; 88.7; 9.6;eor
73;202205120250; 2; -999; 11.5; 9.7; 89.5; 9.8;eor
73;202205120300; 2; -999; 11.6; 10.0; 88.4; 9.8;eor
73;202205120310; 2; -999; 11.4; 10.3; 87.5; 9.4;eor
73;202205120320; 2; -999; 11.6; 9.9; 89.0; 9.9;eor
73;202205120330; 2; -999; 12.1; 10.4; 87.3; 10.1;eor
73;202205120340; 2; -999; 12.1; 10.6; 87.2; 10.0;eor
73;202205120350; 2; -999; 11.9; 10.2; 87.2; 9.8;eor
...
\end{lstlisting}
\end{figure}
In der CSV Datei gibt es 9 Felder.
%Quelle einfügen
\begin{tabular}{l|p{13.0cm}}
STATION\_ID & Gibt an von welcher Station die Werte stammen \\ \hline
MESS\_DATUM & Gibt an wann gemessen wurde im Format "\%Y\%m\%d\%H\%M" Also Jahr Monat Tag Stunde Minute als eine zusammengeschriebene Zahl. \\ \hline
QN & Gibt die Qualität der Messwerte an. Hier gibt es die Werte 1 bis 3
\begin{compactenum}
\item nur formale Kontrolle bei Dekodierung und Import
\item Kontrolle mit individuell festgelegten Kriterien
\item ROUTINE automatische Kontrolle und Korrektur mit QUALIMET
\end{compactenum} \\ \hline
PP\_10 & Luftdruck auf Stationshöhe \\ \hline
TT\_10 & Lufttemperatur auf 2 Meter höhe \\ \hline
TM5\_10 & Lufttemperatur auf 5cm höhe \\ \hline
TD\_10 & relative Luftfeuchtigkeit auf 2m höhe \\ \hline
eor & END OF RECORD kann ignriert werden.
\end{tabular}
In dieser CSV Datei sind die Daten mit einem Semikoln voneinander getrennt. Der erste Wert in der CSV Datei ist die STATIONS\_ID auf die später noch weiter eingegangen wird.
Danach folgt das Feld Mess\_Datum Formatiert nach dem
\subsubsection{{Wetterdaten abrufen}}
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua.
At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat,
sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.
\section{Wetterdaten verarbeiten}

View file

@ -6,4 +6,5 @@
\newacronym{CRUD}{CRUD}{Create, Read, Update, Delete}
\newacronym{HTTP}{HTTP}{HyperText Transfer Protocol}
\newacronym{API}{API}{Application Programming Interface}
\newacronym{CLI}{CLI}{Command Line Interface}
\newacronym{CLI}{CLI}{Command Line Interface}
\newacronym{UI}{UI}{User Interface}

View file

@ -86,6 +86,15 @@ year = {2021},
keywords = {web}
}
@misc{InfluxDBvsMongo,
author = {Hajek Vlasta, Pour Ales, Kudibal Ivan},
title = {{Why Time Series Matters for Metrics, Real-Time Analytics and Sensor Data}},
url = {http://get.influxdata.com/rs/972-GDU-533/images/why%20time%20series.pdf},
urldate = {2022-05-27},
year = {2019},
keywords = {web}
}
@misc{SamFangman2019,
author = {Sam Fangman},
title = {{The Time Has Come for a New Type of Database}},

Binary file not shown.