diff --git a/arbeit/Thesis.pdf b/arbeit/Thesis.pdf index eef357a..c636f49 100644 Binary files a/arbeit/Thesis.pdf and b/arbeit/Thesis.pdf differ diff --git a/arbeit/chapter/Grundlagen.tex b/arbeit/chapter/Grundlagen.tex index d5a2756..ca706f3 100644 --- a/arbeit/chapter/Grundlagen.tex +++ b/arbeit/chapter/Grundlagen.tex @@ -1,8 +1,92 @@ %!TEX root = ../Thesis.tex \section{Grundlagen} -Das ist ein Test +\subsection{Verbreitete \gls{DBMS}} +Aktuell gibt es wie in \cref{fig:db-ranking} zu sehen einige beliebte Mulit-Model Datenbanken die als \gls{TSDB} gentuzt werden können. +So können die Datenbanken MongoDB, Redis, Teradata und Couchbase mit Time Series Daten arbeiten. Die erste reine \gls{TSDB} im Ranking ist InfluxDB +auf Platz 29.\footnote{\cite[vgl.][]{dbranking}} %ist das eine Quelle die ich nutzen darf? + + +\begin{figure}[hbt] +\centering +\begin{minipage}[t]{0.9\textwidth} % Breite, z.B. 1\textwidth +\caption{DB-Engines Ranking} % Überschrift +\includegraphics[width=1\textwidth]{img/DB-Engines-Ranking}\\ % Pfad +\source{https://db-engines.com/de/ranking?msclkid=4f2a29e5d08811ec95ccd74f8f5146ab} % Quelle +\label{fig:db-ranking} +\end{minipage} +\end{figure} + +- Ranking TSDB\\ +- Graph InfluxDB vs MySQL + +\subsection{Time Series Data} + +Wie der Name schon sagt ist Time Series Data eine Reihe von Daten die über einen Zeitraum gesammelt wordern sind. Es wird also nicht nur der Endwert aufgezeichnet +sonder die Veränderung über einen Zeitraum. Diese Daten können z.B. Servermetriken, Anwendungs Leistungsüberwachung, Netzwerkdaten, Sensordaten, +Ereignisse, Klicks, Marktgeschäfte und viele andere Arten von Daten sein. Time Series Data können gut daran erkannt, dass die Zeit eine Wichtige +Axe bei der Darstellung der Werte ist.\footnote{\cite[vgl.][]{PaulDix}} + +Manchmal ist es nicht notwendig alle Daten zu erfassen. Zum Beispiel wird in vielen Anwendungen nur der letze Login gespeichert und mehr ist auch für die +Funktion nicht notwendig. Allerdings können zusätzliche Informationen gewonnen werden wenn nicht nur die letzen Daten sondern die Veränderung aufgezeichnet werden. +So kann zum Beispeil festgestellt werden wie oft und wann sich der Kunde einloggt und ob es dabei ein Muster gibt. Anhand dieser Daten können Kunden dann Kategorisiert werden.\footnote{\cite[vgl.][]{DataScienceTeam2020}} + +Eine besonderheit von Time Series Data ist das sie sich nicht verändert. Wenn die Daten einmal erfasst wurden wird an ihnen nichts mehr geändert. +Es werden nur neue Daten hinzugefügt\footnote{\cite[vgl.][]{SamFangman2019}} + +\subsection{{Funktion Time Series Database}} + +\subsection{Notizen} + +sind dabei immer dann sinnvoll wenn Time Series Data gespeichert werden soll.\footnote{\cite[vgl.][]{DataScienceTeam2020}} + + +Diese Daten zeichnen sich besonders dadurch aus +das die Zeit eine wichtiger Faktor für diese Daten ist. + +- Eine Reihe von Daten +- Timestamp als wichtiger Wert +- Meistens werden nur neue Daten hinzugefügt. +- Im vergleich zu einer MySQL Datenbank gibt es nur Inserts und keine Updates +- Es wird die Veränderung über die Zeit Aufgezeichnet.- Time SEries Data kann in einer SQL Datenbank gespeichert werden. Diese Datenbanken skalieren aber nur schlecht. + + +Die Meisten TSDB haben zusätzliche fUNKTIONEN Um mit den Daten zu arbeiten. + - alte Daten löschen + - durchgehende Abfragen + +Daten: +- Server Monitoring +- Sensordaten + - Wissenschaftliche Daten + - Industrielle Daten / Events + - Log Data + + - MySQL -> Beim Login wird LastLogin geupdatete + - TSDB -> Beim Login wird ein neuer Datenpunkt erstellt. + -> Mehr Informationen werden beibehalten. Wie oft eingeloggt. Wann eingeloggt u.s.w. + + - Autos Sammeln 4,000 GB pro Tag + + +Use Cases + - Software Monitoring + - Hardware Überwachung + - IOT + - Wetterdaten + - Raumtemperatur + - Positionsaufzeichnung von Autos,Containern,Paletten + - Eventaufzeichnungen wie Benutzerinteraktion + - Business intelligence Überwachen von Kennzahlen + - alles weitere wo Zeitrelevante Daten anfallen. + + + + + +Eine große Menge von Daten ist sehr stark an die Zeit gebunden in der sie erzeugt werden. So sind z.B. Sensordaten +sehr eng mit der Aufzeichungszeit verbunden. Weil sich die Werte sofort wieder verändern können. \subsection{Schrift} diff --git a/arbeit/config/Abkuerzungen.tex b/arbeit/config/Abkuerzungen.tex index 28396de..ab8bd49 100644 --- a/arbeit/config/Abkuerzungen.tex +++ b/arbeit/config/Abkuerzungen.tex @@ -2,6 +2,9 @@ \newacronym{TSDB}{TSDB}{Time Series Database} \newacronym{DWD}{DWD}{Deutscher Wetterdienst} +\newacronym{IOT}{IOT}{Internet of Things} +\newacronym{DBMS}{DBMS}{Datenbank Management System} + %%%%%%%%%%%%%%%% Alte Abkürzungen diff --git a/arbeit/img/DB-Engines-Ranking.PNG b/arbeit/img/DB-Engines-Ranking.PNG new file mode 100644 index 0000000..1ea9a14 Binary files /dev/null and b/arbeit/img/DB-Engines-Ranking.PNG differ diff --git a/arbeit/library/library.bib b/arbeit/library/library.bib index e2e1a3c..ad7a65b 100644 --- a/arbeit/library/library.bib +++ b/arbeit/library/library.bib @@ -29,6 +29,44 @@ year = {2011}, keywords = {web} } +@misc{DataScienceTeam2020, +author = {Data-Science-Team}, +title = {{What the heck is time-series data (and why do I need a time-series database)?}}, +url = {https://datascience.eu/wiki/what-the-heck-is-time-series-data-and-why-do-i-need-a-time-series-database/}, +urldate = {2022-05-09}, +year = {2020}, +keywords = {web} +} + +@misc{PaulDix, +author = {Paul Dix}, +title = {{Why Time Series Matters for Metrics, Real-Time Analytics and Sensor Data}}, +url = {http://get.influxdata.com/rs/972-GDU-533/images/why%20time%20series.pdf}, +urldate = {2022-05-10}, +year = {2021}, +keywords = {web} +} + +@misc{SamFangman2019, +author = {Sam Fangman}, +title = {{The Time Has Come for a New Type of Database}}, +url = {https://medium.datadriveninvestor.com/the-time-has-come-for-a-new-type-of-database-47cf8df1667a}, +urldate = {2022-05-10}, +year = {2019}, +keywords = {web} +} + +@misc{dbranking, +author = {solid-IT-gmbh}, +title = {{DB-Engines Ranking}}, +url = {https://db-engines.com/de/ranking}, +urldate = {2022-05-10}, +year = {2022}, +keywords = {web} +} + + + @inproceedings{Hocking2011a, author = {Hocking, Christopher G. and Furnell, Steven M. and Clarke, Nathan L. and Reynolds, Paul L.}, booktitle = {Proceedings of International Conference on Information Assurance and Security (IAS)}, @@ -36,4 +74,5 @@ pages = {304--310}, title = {{A Distributed and Cooperative User Authentication Framework}}, year = {2010}, keywords = {mag} -} \ No newline at end of file +} +