Forschung und Veröffentlichungen

Die Forschung an der Hochschule Wismar soll in hohem Maße die Studierenden einbinden. Sie geschieht darum bei mir durch eine studentische Forschergruppe. Die lösbare Herausforderung liegt im zwangsläufig geringen Vorwissen unserer fachlich jungen Studentinnen und Studenten. Die Arbeit mit neuronalen Netwerken hat sich als das Gebiet erwiesen, in dem bei leichtem Einstieg dennoch aktuelle Forschung möglich ist.

Ein weiteres Dauerthema ist die verbesserte Analyse von Meßdaten von Prozessen jenseits der eindimensionalen Regression und Korrelationsanalyse. Anwendungen waren z.B. Messdaten aus Raman-Spektros­kopie und Körperschall (beides in Zusammen­arbeit mit der Werkstofftechnik unter Prof. Schwerdt),  klassische spektrale Zerlegungen und  Dekomposition von Mischsignalen von Daten aus der Lichtabsorption (Prof. Hornberger) und einige verfahrenstechnische Prozesse und werden z.B. sein die von Schwingungen, Leistungsaufnahme uvm. an Werk­zeug­maschinen in Zusammen­arbeit mit der Gruppe der Fertigungseinrichtung/Qualitätsmanagement unter Prof. Schimmelpfennig.

In den vergangenen Jahren haben Studenten Know-How zu neuronalen Netzen erarbeitet. Ein Beispiel ist die Qualitätssicherung in der Funktenerosion durch Bilderkennung. Dazu gehörte außerdem die Erstellung  von Surrogat­modellen aus Regression mit neuronalen Netzwerken.

Die Erfahrungen mit Surrogatmodellen erlauben uns, diese nun in der Optimierung einzusetzen. Unser Schwerpunkt liegt auf der Multifidelity-Optimierung mit neuronalen Netzen als Surrogatmodellen, im Wesentlichen synonym zur Bezeichnung "Efficient Global Optimization". Gekennzeichnet ist diese Algorithmenklasse durch die wechselseitige Vorhersage von Optimalpunkten durch das neuronale Netzwerk und anschließender Verbesserung der Vorhersage unter Nutzung des vorgeschlagenen Punktes. Wir arbeiten an kombinatorischen und an kontinuierlichen Problemen. Die Anwendung für Ersteres ist die Optimierung von Eigenschaften gewebter Materialien über die moglichen Kombinationen von Fäden. Hier arbeiten wir mit der Gruppe von Prof. Szyniszewski, Durham, zusammen. Testprobleme funktionieren bereits sehr gut und als Vorarbeit wollen wir die Eigenschaften von Tragwerken über die möglichen Kombinationen von Stäben optimieren. Als Anwendung für die Optimierung über kontinuierliche Größen kann jeder beliebige Ferigungsprozeß dienen, notfalls ist Zeitverbrauch immer eine Zielgröße. Hier gibt es Zusammenarbeit mit Prof. Schimmelpfennig.
Ferner sollen in der Fertigungstechnik mittels neuronaler Netze versteckte Parameter identifiziert werden.

Um Kompetenz im Bereich der Zeitreihenvorhersage zu akkumulieren, läuft in diesem Jahr ein Projekt zur Vorhersage von Balkenholzfeuchten im
Schloss Bothmer in Zusammenarbeit mit dem Bereich Bau unserer Hochschule (Prof. Haroske) und dem Staatlichen Bau- und Liegenschaftsamt Schwerin. Es ist daran gedacht, in landwirtschaftliche Themen vorzustoßen.

Finding hidden-feature depending laws inside a data set and classifying it using Neural Network

Diese Veröffentlichung beschreibt eine Methode zum sukzessiven Finden von Gesetzen in einer Menge von Parameter-Messungs-Paaren, die aus mehreren a priori nicht unterscheidbaren Populationen stammen. In dem Zuge, in dem man die für die einzelnen Populationen gültigen Gesetze findet, unterscheidet man auch die Populationen, die diesen Gesetzen gehorchen. Ermöglicht wird dies durch Verwendung der Logcosh-Loss-Funktion, die eine Regression durch den jeweils schwersten Cluster durchführt anstatt durch das Mittel, wie dies quadratische Loss-Funktionen tun.

Autoren
Thilo Moshagen
Nihal Acharya Adde
Ajay Navilarekal Rajgopal

arXiv:2101.10427
Submitted 25 January, 2021; originally announced January 2021

Abstract

The logcosh loss function for neural networks has been developed to combine the advantage of the absolute error loss function of not overweighting outliers with the advantage of the mean square error of continuous derivative near the mean, which makes the last phase of learning easier. It is clear, and one experiences it soon, that in the case of clustered data, an artificial neural network
with logcosh  loss learns the bigger cluster rather than the mean of the two. Even more so, the ANN, when used for regression of a set-valued function, will learn a value close to one of the choices, in other words, one branch of the set-valued function, while a mean-square-error NN will learn the value in between. This work suggests a method that uses artificial neural networks with logcosh loss to find the branches of set-valued mappings in parameter-outcome sample sets and classifies the samples according to those branches.


Classification based on invisible features and thereby finding the effect of tuberculosis vaccine on COVID-19

Dies ist die Anwendung des Verfahrens aus Finding hidden-feature depending laws inside a data set and classifying it using Neural Network auf Daten des COVID-Infektionsgeschehens in Deutschland. Ziel war es, festzustellen, ob Ost- und Westdeutschland bezüglich des COVID-Infektionsgeschehens unter­schied­liche Populationen darstellen - der verdeckte Parameter wäre dann die Tuber­kuloseimpfung, die in Ostdeutschland häufiger ist. Ergebnis ist, dass ein Effekt der Tuberkuloseimpfung sicher ausgeschlossen werden kann.

Autoren
Nihal Acharya Adde
Thilo Moshagen

arXiv:2011.07332
Submitted 14 November, 2020; originally announced November 2020

Abstract

In the case of clustered data, an artificial neural network with logcosh loss function learns the bigger cluster rather than the mean of the two. Even more so, the ANN when used for regression of a set-valued function, will learn a value close to one of the choices, in other words, it learns one branch of the set-valued function with high accuracy. This work suggests a method that uses artificial neural networks with logcosh loss to find the branches of set-valued mappings in parameter-outcome sample sets and classifies the samples according to  those branches. The method not only classifies the data based on these branches but also provides an accurate prediction for the majority cluster. The method successfully classifies the data based on an invisible feature. A neural network was successfully established to predict the total number of cases, the logarithmic total number of cases, deaths, active cases and other relevant data of the coronavirus  for each German district from a number of input variables. As it has been speculated that the Tuberculosis vaccine provides protection against the virus and since East Germany was vaccinated before reunification, an attempt was made to classify the Eastern and Western German districts by considering the vaccine information as an invisible feature.


Weitere Forschungsinteressen/Weitere Veröffentlichungen:

Diffuse Grenzflächen thermodynamisch scharf: Ein voll physikalisch eingebettetes Multiphasenfeldmodell

Dissertationsschrift

Abstract

Motivated by the problem of distortion occuring during heat treatment of steel, the mutual influence of phase changes and stresses in metals is examined on the length scale of several grains, the mesoscopic length scale, using a multi phase field method. The metalurgical motivation of this work makes it necessary to derive governing equations from entropy maximization as well as from free energy minimization. The inner energy and the entropy of the system, thus the free energy, are as far as possible put together from well-known physical expressions. Commonly stated thermodynamical relations between the contributions are examined for their domain of validity, then this validities are proven between the chosen contributions to inner energy and entropy where they should account. New insights on the thermodynamics of phase changes are achieved. The phasefield itself is chosen such that one component of it symbolizes one phase in each grain, i.e. two components for each grain are needed. To deal with this amount of components and stresses and temperature, a FEM software with the capacity to deal with an arbitrary number of components is designed. Results of the simulations are presented.


Moshagen, Thilo. "Convergence of explicitly coupled simulation tools (co-simulations)" Journal of Numerical Mathematics, vol. 27, no. 1, 2019, pp. 23-36.
zur Publikation >>


On Meeting Energy Balance Errors in Co-Simulations
Thilo Moshagen (2019) On Meeting Energy Balance Errors in Co-Simulations, Mathematical and Computer Modelling of Dynamical Systems, 25:2, 139-166.
zur Publikation >>


Global Solver based on the Sperner-Lemma and Mazurkewicz-Knaster-Kuratowski-Lemma based proof of the Brouwer Fixed-Point Theorem

Global Solver based on the Sperner-Lemma and Mazurkewicz-Knaster-Kuratowski-Lemma based proof of the Brouwer Fixed-Point Theorem 

Dieser Beitrag schlägt eine Methode zum Finden von Fixpunkten von stetigen Abbildungen vom Einheitssimplex in den Einheitssimplex vor, eine Problemklasse, in welche gängige Nullstellenprobleme, z. B. aus der Optimierung, leicht überführt werden können. Die Methode trianguliert das Gebiet und verfeinert diejenigen Subsimplizes per Bisektion, bei denen das Bild jeder Ecke weiter oder gleich weit von einer Ecke des Ursprungssimplexes entfernt liegt als
das Urbild. Das Verfahren konvergiert gegen die Fixpunkte, deren Bild ja gleich weit von allen Simplexecken entfernt liegt wie das Urbild.
Vorteil des Verfahrens gegenüber newtonartigen Lösern ist in erster Linie die Globalität, zweitens, daß die Funktion global erkundet wird, wobei die Funktionsevaluationen um die Fixpunkte herum immer dichter liegen, und die gewonnenen Funktionswerte sinnvoll für Regression, auch durch neuronale Netzwerke, genutzt werden können.

Autoren
Thilo Moshagen

arXiv:2407.18816
submitted 26.7.2024

Abstract

In this paper a fixed-point solver for mappings from a Simplex into itself that is gradient-free, global and requires (d+12) function evaluations for halvening the error is presented. It is based on topological arguments and uses the constructive proof of the Mazurkewicz-Knaster-Kuratowski lemma when used as part of the proof for Brouwers Fixed-Point theorem.