From 26744a8a9edc532e34ab54824ab411c63a603d65 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Markus=20Clau=C3=9F?= <markus.clauss@tu-dresden.de>
Date: Mon, 22 Aug 2022 10:07:24 +0200
Subject: [PATCH] add structure and geosys io.py

---
 Makefile                      |   4 +
 pytestpavement/___init__.py   |   0
 pytestpavement/io/__init__.py |   1 +
 pytestpavement/io/io.py       | 215 ++++++++++++++++++++++++++++++++++
 setup.py                      |  15 +++
 5 files changed, 235 insertions(+)
 create mode 100644 Makefile
 create mode 100644 pytestpavement/___init__.py
 create mode 100644 pytestpavement/io/__init__.py
 create mode 100644 pytestpavement/io/io.py
 create mode 100644 setup.py

diff --git a/Makefile b/Makefile
new file mode 100644
index 0000000..ec299e5
--- /dev/null
+++ b/Makefile
@@ -0,0 +1,4 @@
+link:
+	pip install -e ./
+
+
diff --git a/pytestpavement/___init__.py b/pytestpavement/___init__.py
new file mode 100644
index 0000000..e69de29
diff --git a/pytestpavement/io/__init__.py b/pytestpavement/io/__init__.py
new file mode 100644
index 0000000..aecf717
--- /dev/null
+++ b/pytestpavement/io/__init__.py
@@ -0,0 +1 @@
+from .io import read_data
diff --git a/pytestpavement/io/io.py b/pytestpavement/io/io.py
new file mode 100644
index 0000000..6629b32
--- /dev/null
+++ b/pytestpavement/io/io.py
@@ -0,0 +1,215 @@
+from numpy import array
+from pandas import to_datetime, DataFrame
+import csv
+import os
+from sys import getsizeof
+from versuche.helper import normalice_header
+
+
+def detect_tabnum(filename, tabstr,encoding='utf-8'):
+    filename = os.path.normpath(filename)
+
+    tabstr = tabstr.lower()
+
+    #Einlesen
+    with open(filename,'r', encoding=encoding) as inFile:
+        reader = csv.reader(inFile, delimiter='\t')
+        counter = 0
+        for row in reader:
+
+            row = [r.lower() for r in row]
+            if any(tabstr in mystring for mystring in row):
+                if 'plain' in row:
+                    return row[1]
+
+            counter += 1
+
+            if counter>100:
+                return False
+
+
+
+def str2float(str):
+    try:
+        str = str.replace(',','.')
+        return float(str)
+    except:
+        return None
+
+
+def read_data(filename,
+              table,
+              pkdata = '001',
+              encoding='utf-8',
+              to_si = False,
+              debug=False):
+    '''
+
+    :param filename: File-Name
+    :param table: Table-Number
+    :param pkdata: Table-Number of speciment definitions, default: 1
+    :param encoding: Encoding, default: utf-8
+    :param debug: debug-mode
+    :return:
+
+    '''
+
+    #print('start read GEOSYS')
+    filename = os.path.normpath(filename)
+
+    try:
+        dictOut = {}
+        dictOut['durch'] = 0
+        dictOut['hoehe'] = 0
+
+        #---------------------------------------------------------------------
+        #Daten einlesen und umwandeln
+        #---------------------------------------------------------------------
+
+
+        data = []
+        zuordnung = []
+
+        #Einlesen
+        with open(filename,'r', encoding=encoding) as inFile:
+            reader = csv.reader(inFile, delimiter='\t')
+            for row in reader:
+                if len(row) > 2:
+                    data.append(row)
+
+        if debug:
+            print('Anz. Datensätze: ', str(len(data)), getsizeof(data))
+        #aufräumen
+        ##Datenstruktur anlegen
+
+
+        data_clean = {}
+        data_clean['head'] = []
+        data_clean['data'] = []
+
+        for idx, d in enumerate(data):
+            try:
+                v = d[0][0:3]
+                if v in pkdata: data_clean['head'].append(d)
+                if v in table: data_clean['data'].append(d)
+
+            except:
+                pass
+
+        # aufräumen
+        data = data_clean
+        del(data_clean)
+        if debug:
+            print('data_clean fin')
+
+        ## Header aufbereiten
+
+        for idx, row in enumerate(data['head']):
+            #print(idx,row)
+            if idx == 0:
+                id_durchmesser = None
+                id_hoehe = None
+                id_name = None
+
+                for idx_name, name in enumerate(row):
+                    if name in [r'Probekörberdurchmesser',r'Diameter of specimen', 'PK-Durchmesser', 'Probekörper-Durchmesser']:
+                        id_durchmesser = idx_name
+                    elif name in [r'Probekörperbezeichnung']:
+                        id_name = idx_name
+                    elif name in ['Probekörperhöhe','Gap length','PK-Höhe']:
+                        id_hoehe = idx_name
+
+                if debug:
+                    print(id_durchmesser, id_hoehe, id_name)
+            elif idx == 1:
+                unit_durch = None
+                unit_hoehe = None
+
+                try:
+                    unit_durch = row[id_durchmesser]
+                    unit_hoehe = row[id_hoehe]
+                except:
+                    pass
+
+            elif idx == 2:
+                durchmesser = None
+                hoehe = None
+                name = None
+                try:
+                    durchmesser = str2float(row[id_durchmesser])
+                    hoehe = str2float(row[id_hoehe])
+                    name = row[id_name]
+
+                except:
+                    pass
+
+        header = {'d': durchmesser,
+                  'h': hoehe,
+                  'name': name,
+                  'unit_h': unit_hoehe,
+                  'unit_d': unit_durch}
+
+        if debug:
+            print('header\n', header)
+
+        ## Daten in Pandas DataFrame umwandeln
+        if debug:
+            print('daten umwandel')
+
+        temp = []
+        for idx, row in enumerate(data['data']):
+            if idx == 0:
+                if debug:
+                    print('head')
+                data_head = []
+                for idx_name, name in enumerate(row):
+                    if idx_name <= 1: continue
+                    data_head.append(name)
+            elif idx == 1:
+                data_units = []
+                for idx_name, name in enumerate(row):
+                    if idx_name <= 1: continue
+                    data_units.append(name)
+            else:
+                t = []
+                for idx_col, value in enumerate(row):
+                    if idx_col <= 1:
+                        continue
+                    else:
+                        t.append(str2float(value))
+
+                temp.append(t)
+
+        data = array(temp)
+
+        if debug:
+            print(data_head,data_units)
+
+        ## Bezeichnungen der Daten normalisieren
+        data_head = normalice_header(data_head)
+
+        # Pandas DataFrame erstellen
+        data = DataFrame(data=data, columns=data_head)
+        if debug:
+            print(data.head())
+
+        data = data.set_index('t')
+
+        #data._units = data_units
+
+        # Zykelnzähler anpassen
+        if 'N' in data.columns:
+            data['N'] = data['N'].astype(int)
+
+        # Daten sortieren
+        data.sort_index()
+
+        # Index normieren
+        data.index = data.index - data.index[0]
+
+        return header, data
+
+
+    except:
+        print('Fehler beim lesen')
+        raise
diff --git a/setup.py b/setup.py
new file mode 100644
index 0000000..6ae79e3
--- /dev/null
+++ b/setup.py
@@ -0,0 +1,15 @@
+from setuptools import setup
+
+setup(
+   name='PyTestPavement',
+   version='0.1.0',
+   author='Markus Clauß',
+   author_email='markus.clauss@tu-dresden.de',
+   packages=['pytestpavement',],
+   #scripts=['bin/script1','bin/script2'],
+   #url='http://pypi.python.org/pypi/PackageName/',
+   #license='LICENSE.txt',
+   description='',
+   #long_description=open('README.txt').read(),
+   install_requires=['lmfit', 'pandas', 'numpy'],
+)