added Grundlagen
This commit is contained in:
parent
8b0beb5686
commit
7d388446e7
Binary file not shown.
|
@ -1,8 +1,92 @@
|
||||||
%!TEX root = ../Thesis.tex
|
%!TEX root = ../Thesis.tex
|
||||||
\section{Grundlagen}
|
\section{Grundlagen}
|
||||||
|
|
||||||
Das ist ein Test
|
\subsection{Verbreitete \gls{DBMS}}
|
||||||
|
|
||||||
|
Aktuell gibt es wie in \cref{fig:db-ranking} zu sehen einige beliebte Mulit-Model Datenbanken die als \gls{TSDB} gentuzt werden können.
|
||||||
|
So können die Datenbanken MongoDB, Redis, Teradata und Couchbase mit Time Series Daten arbeiten. Die erste reine \gls{TSDB} im Ranking ist InfluxDB
|
||||||
|
auf Platz 29.\footnote{\cite[vgl.][]{dbranking}} %ist das eine Quelle die ich nutzen darf?
|
||||||
|
|
||||||
|
|
||||||
|
\begin{figure}[hbt]
|
||||||
|
\centering
|
||||||
|
\begin{minipage}[t]{0.9\textwidth} % Breite, z.B. 1\textwidth
|
||||||
|
\caption{DB-Engines Ranking} % Überschrift
|
||||||
|
\includegraphics[width=1\textwidth]{img/DB-Engines-Ranking}\\ % Pfad
|
||||||
|
\source{https://db-engines.com/de/ranking?msclkid=4f2a29e5d08811ec95ccd74f8f5146ab} % Quelle
|
||||||
|
\label{fig:db-ranking}
|
||||||
|
\end{minipage}
|
||||||
|
\end{figure}
|
||||||
|
|
||||||
|
- Ranking TSDB\\
|
||||||
|
- Graph InfluxDB vs MySQL
|
||||||
|
|
||||||
|
\subsection{Time Series Data}
|
||||||
|
|
||||||
|
Wie der Name schon sagt ist Time Series Data eine Reihe von Daten die über einen Zeitraum gesammelt wordern sind. Es wird also nicht nur der Endwert aufgezeichnet
|
||||||
|
sonder die Veränderung über einen Zeitraum. Diese Daten können z.B. Servermetriken, Anwendungs Leistungsüberwachung, Netzwerkdaten, Sensordaten,
|
||||||
|
Ereignisse, Klicks, Marktgeschäfte und viele andere Arten von Daten sein. Time Series Data können gut daran erkannt, dass die Zeit eine Wichtige
|
||||||
|
Axe bei der Darstellung der Werte ist.\footnote{\cite[vgl.][]{PaulDix}}
|
||||||
|
|
||||||
|
Manchmal ist es nicht notwendig alle Daten zu erfassen. Zum Beispiel wird in vielen Anwendungen nur der letze Login gespeichert und mehr ist auch für die
|
||||||
|
Funktion nicht notwendig. Allerdings können zusätzliche Informationen gewonnen werden wenn nicht nur die letzen Daten sondern die Veränderung aufgezeichnet werden.
|
||||||
|
So kann zum Beispeil festgestellt werden wie oft und wann sich der Kunde einloggt und ob es dabei ein Muster gibt. Anhand dieser Daten können Kunden dann Kategorisiert werden.\footnote{\cite[vgl.][]{DataScienceTeam2020}}
|
||||||
|
|
||||||
|
Eine besonderheit von Time Series Data ist das sie sich nicht verändert. Wenn die Daten einmal erfasst wurden wird an ihnen nichts mehr geändert.
|
||||||
|
Es werden nur neue Daten hinzugefügt\footnote{\cite[vgl.][]{SamFangman2019}}
|
||||||
|
|
||||||
|
\subsection{{Funktion Time Series Database}}
|
||||||
|
|
||||||
|
\subsection{Notizen}
|
||||||
|
|
||||||
|
sind dabei immer dann sinnvoll wenn Time Series Data gespeichert werden soll.\footnote{\cite[vgl.][]{DataScienceTeam2020}}
|
||||||
|
|
||||||
|
|
||||||
|
Diese Daten zeichnen sich besonders dadurch aus
|
||||||
|
das die Zeit eine wichtiger Faktor für diese Daten ist.
|
||||||
|
|
||||||
|
- Eine Reihe von Daten
|
||||||
|
- Timestamp als wichtiger Wert
|
||||||
|
- Meistens werden nur neue Daten hinzugefügt.
|
||||||
|
- Im vergleich zu einer MySQL Datenbank gibt es nur Inserts und keine Updates
|
||||||
|
- Es wird die Veränderung über die Zeit Aufgezeichnet.- Time SEries Data kann in einer SQL Datenbank gespeichert werden. Diese Datenbanken skalieren aber nur schlecht.
|
||||||
|
|
||||||
|
|
||||||
|
Die Meisten TSDB haben zusätzliche fUNKTIONEN Um mit den Daten zu arbeiten.
|
||||||
|
- alte Daten löschen
|
||||||
|
- durchgehende Abfragen
|
||||||
|
|
||||||
|
Daten:
|
||||||
|
- Server Monitoring
|
||||||
|
- Sensordaten
|
||||||
|
- Wissenschaftliche Daten
|
||||||
|
- Industrielle Daten / Events
|
||||||
|
- Log Data
|
||||||
|
|
||||||
|
- MySQL -> Beim Login wird LastLogin geupdatete
|
||||||
|
- TSDB -> Beim Login wird ein neuer Datenpunkt erstellt.
|
||||||
|
-> Mehr Informationen werden beibehalten. Wie oft eingeloggt. Wann eingeloggt u.s.w.
|
||||||
|
|
||||||
|
- Autos Sammeln 4,000 GB pro Tag
|
||||||
|
|
||||||
|
|
||||||
|
Use Cases
|
||||||
|
- Software Monitoring
|
||||||
|
- Hardware Überwachung
|
||||||
|
- IOT
|
||||||
|
- Wetterdaten
|
||||||
|
- Raumtemperatur
|
||||||
|
- Positionsaufzeichnung von Autos,Containern,Paletten
|
||||||
|
- Eventaufzeichnungen wie Benutzerinteraktion
|
||||||
|
- Business intelligence Überwachen von Kennzahlen
|
||||||
|
- alles weitere wo Zeitrelevante Daten anfallen.
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
Eine große Menge von Daten ist sehr stark an die Zeit gebunden in der sie erzeugt werden. So sind z.B. Sensordaten
|
||||||
|
sehr eng mit der Aufzeichungszeit verbunden. Weil sich die Werte sofort wieder verändern können.
|
||||||
|
|
||||||
|
|
||||||
\subsection{Schrift}
|
\subsection{Schrift}
|
||||||
|
|
|
@ -2,6 +2,9 @@
|
||||||
|
|
||||||
\newacronym{TSDB}{TSDB}{Time Series Database}
|
\newacronym{TSDB}{TSDB}{Time Series Database}
|
||||||
\newacronym{DWD}{DWD}{Deutscher Wetterdienst}
|
\newacronym{DWD}{DWD}{Deutscher Wetterdienst}
|
||||||
|
\newacronym{IOT}{IOT}{Internet of Things}
|
||||||
|
\newacronym{DBMS}{DBMS}{Datenbank Management System}
|
||||||
|
|
||||||
|
|
||||||
%%%%%%%%%%%%%%%% Alte Abkürzungen
|
%%%%%%%%%%%%%%%% Alte Abkürzungen
|
||||||
|
|
||||||
|
|
BIN
arbeit/img/DB-Engines-Ranking.PNG
Normal file
BIN
arbeit/img/DB-Engines-Ranking.PNG
Normal file
Binary file not shown.
After Width: | Height: | Size: 328 KiB |
|
@ -29,6 +29,44 @@ year = {2011},
|
||||||
keywords = {web}
|
keywords = {web}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
@misc{DataScienceTeam2020,
|
||||||
|
author = {Data-Science-Team},
|
||||||
|
title = {{What the heck is time-series data (and why do I need a time-series database)?}},
|
||||||
|
url = {https://datascience.eu/wiki/what-the-heck-is-time-series-data-and-why-do-i-need-a-time-series-database/},
|
||||||
|
urldate = {2022-05-09},
|
||||||
|
year = {2020},
|
||||||
|
keywords = {web}
|
||||||
|
}
|
||||||
|
|
||||||
|
@misc{PaulDix,
|
||||||
|
author = {Paul Dix},
|
||||||
|
title = {{Why Time Series Matters for Metrics, Real-Time Analytics and Sensor Data}},
|
||||||
|
url = {http://get.influxdata.com/rs/972-GDU-533/images/why%20time%20series.pdf},
|
||||||
|
urldate = {2022-05-10},
|
||||||
|
year = {2021},
|
||||||
|
keywords = {web}
|
||||||
|
}
|
||||||
|
|
||||||
|
@misc{SamFangman2019,
|
||||||
|
author = {Sam Fangman},
|
||||||
|
title = {{The Time Has Come for a New Type of Database}},
|
||||||
|
url = {https://medium.datadriveninvestor.com/the-time-has-come-for-a-new-type-of-database-47cf8df1667a},
|
||||||
|
urldate = {2022-05-10},
|
||||||
|
year = {2019},
|
||||||
|
keywords = {web}
|
||||||
|
}
|
||||||
|
|
||||||
|
@misc{dbranking,
|
||||||
|
author = {solid-IT-gmbh},
|
||||||
|
title = {{DB-Engines Ranking}},
|
||||||
|
url = {https://db-engines.com/de/ranking},
|
||||||
|
urldate = {2022-05-10},
|
||||||
|
year = {2022},
|
||||||
|
keywords = {web}
|
||||||
|
}
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
@inproceedings{Hocking2011a,
|
@inproceedings{Hocking2011a,
|
||||||
author = {Hocking, Christopher G. and Furnell, Steven M. and Clarke, Nathan L. and Reynolds, Paul L.},
|
author = {Hocking, Christopher G. and Furnell, Steven M. and Clarke, Nathan L. and Reynolds, Paul L.},
|
||||||
booktitle = {Proceedings of International Conference on Information Assurance and Security (IAS)},
|
booktitle = {Proceedings of International Conference on Information Assurance and Security (IAS)},
|
||||||
|
@ -36,4 +74,5 @@ pages = {304--310},
|
||||||
title = {{A Distributed and Cooperative User Authentication Framework}},
|
title = {{A Distributed and Cooperative User Authentication Framework}},
|
||||||
year = {2010},
|
year = {2010},
|
||||||
keywords = {mag}
|
keywords = {mag}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
|
Reference in a new issue