Johannes Michael Tauscher, M.Sc.

Data Scientist und technischer Generalist

Interessiert an Marketing, Management, Politik, Technologie, Wirtschaft, Statistik und Innovation.

Über mich

Hi! Mein Name ist Johannes. Ich bin ein technischer Generalist, der sich für die Optimierung von Systemen und Workflows begeistert – sei es die Architektur von Microservices und DevOps, die Feinabstimmung von Machine Learning-Pipelines, die Suche nach der optimalen Badminton-Strategie oder dem perfekten Fahrrad-Setup.

Audio-Zusammenfassung

Hör Dir die Zusammenfassung von Johannes' Profil von Google's NotebookLM an.

Erfahrung

Mitgründer & CTO

Raumdeuter GbR • Leipzig, Deutschland

Nov. 2024 - Dez. 2025

Entwicklung einer modernen Kommunikations- und Engagement-Plattform für Mitglieder und Fans von Vereinen und Verbänden, um Beteiligung und Engagement zu ermöglichen — eine Möglichkeit, seine Meinung zu äußern. Ich leite die technische Entwicklung: von Konzept und Architektur bis zur Umsetzung des Produkts als kundenseitig ausgerolltes MVP mit einem 4-köpfigen Entwicklungsteam und Koordination externer IT-Partner.

  • Bei einer zunächst vagen Problemstellung leitete ich Product-Ideation-Workshops, um Team-Vision und Product-Solution-Fit-Roadmap auszurichten.
  • Aufbau der Engagement-Plattform von 0 → 1 in unter 12 Monaten mit 30.000 € Budget (voraussichtlich ca. 1,5 Mio. € Post-Money-Bewertung).
  • Verantwortlich für die Software-Architektur des SaaS: Design von Microservices mit Docker Containerization (Distroless, Multistage Build) und Service Mesh-Patterns, um schnelle Skalierbarkeit sicherzustellen und 'prototype slug' zu vermeiden.
  • Stabilisierung der Frontend-Delivery-Pipeline: Next.js-Builds im Multi-Workspace-Monorepo konfiguriert/optimiert und reproduzierbare Builds über Umgebungen sichergestellt, um Zeitaufwand und Kosten pro Dev für Plattform-Probleme zu senken.
  • Aufbau von DevEx/DevOps: CI/CD-Pipelines, Linting und Pre-commit Hooks sowie Logging und Testing für Next.js- und Python-Services; reduzierte Release-Reibung und beschleunigte Onboarding-Zeiten.
  • Verantwortlich für Systemadministration und Networking: Microsoft-Tenant-Administration, SSL/TLS/DNS-Management und nginx-Routing-Konfiguration.
  • Entwicklung von Machine Learning- und (agentic) NLP-Pipelines in Python: Semantic Text Chunking + RAG-Vektorisierung mit Qdrant, Sentiment Analysis, Topic Clustering und Content-Zusammenfassung als Analyse-Services und zentraler Werttreiber für den Kunden.
  • Etablierung GDPR-konformer Datenschutz- und Privacy by Design-Praktiken, um juristische Rahmenbedingungen zu adressieren und ein wertvolles Gütesiegel zu erhalten.
  • End-to-End technische Delivery verantwortet und Interns, Contractors und externe Partner koordiniert; enge Zusammenarbeit mit dem Frontend-Lead.
Docker
Backend & DevOps
proficient 2+ years experience Containerization, (distroless) multi-stage builds, orchestration
Used in:
  • Raumdeuter GbR
  • Master's Thesis
Python
Programming Languages
proficient 7+ years experience General-purpose programming, Analysis, ML & AI, ML/AI, backend development
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
  • Child and Adolescent Psychiatry
  • Master's Thesis
  • Bachelor's Thesis
Bash
Programming Languages
proficient 4+ years experience Shell scripting, automation, system administration
Used in:
  • Raumdeuter GbR
  • Master's Thesis
  • Linux System Administration
  • Linux
SpaCy
Analysis, ML & AI
competent; 1+ years experience NLP library for tokenization, tagging, and pipelines
Used in:
  • Raumdeuter GbR
pytest
Tools & Systems
competent 1+ years experience Python testing framework and test automation
Used in:
  • Raumdeuter GbR
FastAPI
Backend & DevOps
competent 1+ years experience Python web framework for APIs and services
Used in:
  • Raumdeuter GbR
gRPC
Backend & DevOps
beginner 1+ years experience High-performance RPC framework for, e.g., microservices
Used in:
  • Raumdeuter GbR
Protocol Buffers
Tools & Systems
competent 1+ years experience Schema-based data serialization for RPC and APIs
Used in:
  • Raumdeuter GbR
JavaScript
Programming Languages
competent 2+ years experience Frontend development, Node.js, modern frameworks
Used in:
  • Raumdeuter GbR
  • Github Page
  • The Odin Project
TypeScript
Programming Languages
competent 1+ years experience Type-safe JavaScript for scalable applications
Used in:
  • Raumdeuter GbR
  • Github Page
Next.js
Web & Creative
competent 1+ years experience React framework with server-side rendering and static site generation
Used in:
  • Raumdeuter GbR
  • Github Page
React
Web & Creative
beginner 1+ years experience Component-based UI library
Used in:
  • Raumdeuter GbR
Qdrant
Backend & DevOps
beginner 1+ years experience Vector database for semantic search and AI
Used in:
  • Raumdeuter GbR
RAG
Analysis, ML & AI
competent 1+ years experience Retrieval-augmented generation for LLM pipelines
Used in:
  • Raumdeuter GbR
MongoDB
Backend & DevOps
competent 2+ years experience Document-oriented NoSQL database
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
MariaDB
Backend & DevOps
competent 1+ years experience MySQL-compatible relational database
Used in:
  • Raumdeuter GbR
SQL
Programming Languages
competent 3+ years experience Relational database queries and management
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
  • Bachelor's Thesis
LLMs
Analysis, ML & AI
proficient 3+ years experience Large Language Models integration and deployment
Used in:
  • Raumdeuter GbR
  • Master's Thesis
  • Interests & Hobby
NLP/ML nginx
Backend & DevOps
competent 1+ years experience Web server, reverse proxy, load balancer
Used in:
  • Raumdeuter GbR
Linux
Tools & Systems
proficient 8+ years experience System administration, shell scripting, servers and personal use
Used in:
  • everywhere
CI/CD
Backend & DevOps
competent 2+ years experience Continuous Integration and Deployment pipelines
Used in:
  • Raumdeuter GbR
  • Github Page
GitHub
Tools & Systems
expert 5+ years experience Code hosting, collaboration, and workflows
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
  • Master's Thesis
  • Bachelor's Thesis
  • Child and Adolescent Psychiatry, Philipps University Marburg
Docker Hub
Tools & Systems
beginner 1+ years experience Container image registry and distribution
Used in:
  • Raumdeuter GbR
git
Tools & Systems
proficient 7+ years experience Version control, collaboration, workflows
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
  • Master's Thesis
  • Bachelor's Thesis
  • Child and Adolescent Psychiatry, Philipps University Marburg
  • everywhere

Mathematiklehrer (Vertretung)

Rahn Education (Privatschule) • Leipzig, Deutschland

Nov. 2022 - Juni 2023

Verantwortlich für die Betreuung talentierter Schülerinnen und Schüler (Gruppen von 4 bis 8).

  • Erstellung individuell angepasster Materialien auf Universitätsniveau, um Herausforderungen zu bieten und Interesse an Mathematik zu wecken
  • Initiierung einer von Schülern geleiteten Vortragsreihe über Künstliche Intelligenz und deren Anwendungsfälle
  • Unterricht der mathematischen Grundlagen hinter 3D-Druck und Programmierung
PowerPoint
Tools & Systems
wizard 12+ years experience Presentations, storytelling, visual design
Used in:
  • Red Bull Germany GmbH
  • Rahn Education
  • Raumdeuter GbR
  • everywhere
Algebra
Analysis, ML & AI
competent 3+ years experience Core algebra concepts and problem solving
Used in:
  • Rahn Education (Private School)
gcode
Tools & Systems
beginner 1+ years experience 3D printer toolpath commands and outputs
Used in:
  • Rahn Education (Private School)
STL
Tools & Systems
beginner 1+ years experience 3D model file format for printing and CAD
Used in:
  • Rahn Education (Private School)
MS Teams
Tools & Systems
proficient 2+ years experience Administration, Remote collaboration and communication
Used in:
  • Rahn Education
  • Raumdeuter GbR

Studentische Hilfskraft

Kinder- und Jugendpsychiatrie, Philipps-Universität Marburg • Marburg, Deutschland

Mai 2019 - Jan. 2021

Verantwortlich für die Validierung und Reproduktion früherer Forschungsergebnisse sowie für die Implementierung von Machine Learning-Algorithmen in R zur Lösung von Klassifikationsproblemen im Bereich der ASD-Diagnose.

  • Meine Analyseergebnisse unterstützten die Findings von 3 peer-reviewten Publikationen (im Publikationsbereich aufgeführt) und wurden ca. 70-mal zitiert.
  • Hochgradig interdisziplinäre Arbeit mit Psychologen und Medizinern, um den klinischen Hintergrund und die Implikationen der Daten zu verstehen + Erklärung der statistischen Methoden für Nicht-Data-Scientists
R
Programming Languages
proficient 5+ years experience Statistical computing, Analysis, ML & AI, visualization
Used in:
  • Child and Adolescent Psychiatry
  • Westphalia DataLab GmbH
Markdown
Tools & Systems
expert 6+ years experience Lightweight markup for docs and reports
Used in:
  • Raumdeuter GbR
  • Rahn Education (Private School)
  • Master's Thesis
  • Bachelor's Thesis
  • Westphalia DataLab GmbH
  • Child and Adolescent Psychiatry, Philipps University Marburg
HTML
Web & Creative
proficient 4+ years experience Semantic markup, accessibility, modern standards
Used in:
  • Github Page
  • The Odin Project
  • Raumdeuter GbR
  • Markdown
  • everywhere
Machine Learning
Analysis, ML & AI
proficient 8+ years experience Classification, regression, clustering algorithms
Used in:
  • Child and Adolescent Psychiatry
  • Master's Thesis
  • Bachelor's Thesis
  • Bachelor's Thesis (Economics)
  • Westphalia DataLab GmbH
Decision Trees
Analysis, ML & AI
expert 2+ years experience Tree-based classification and regression models
Used in:
  • Child and Adolescent Psychiatry, Philipps University Marburg
Random Forests
Analysis, ML & AI
expert 2+ years experience Ensemble of decision trees for prediction
Used in:
  • Child and Adolescent Psychiatry, Philipps University Marburg
Statistik Interdisziplinäre Zusammenarbeit

Praktikant, Data Analyst

Westphalia DataLab GmbH • Münster, Deutschland

Aug. 2019 - Okt. 2019

Als Data Analyst Praktikant bei Westphalia DataLab GmbH arbeitete ich an einem medizinischen Diagnostikprojekt, das 3D-Bildgebung und klinische Daten kombinierte; entwickelte und verbesserte ein Experiment-Tracking R/Shiny-Frontend und führte klinische Datenanalysen mit Python und R durch.

  • Implementierung und Verbesserung von Features für ein Experiment-Tracking R/Shiny-Frontend zur Verbesserung des Workflows und der Benutzerfreundlichkeit
  • Analyse von 3D-Bild- und klinischen Datensätzen mit Python und R zur Ableitung umsetzbarer diagnostischer Erkenntnisse
  • Integration und Verwaltung von Projektdaten mit MongoDB und PostgreSQL sowie Pflege von Code/Versionierung mit Git
Python
Programming Languages
proficient 7+ years experience General-purpose programming, Analysis, ML & AI, ML/AI, backend development
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
  • Child and Adolescent Psychiatry
  • Master's Thesis
  • Bachelor's Thesis
PyTorch
Analysis, ML & AI
competent 2+ years experience Deep learning framework and training loops
Used in:
  • Westphalia DataLab GmbH
  • Master's Thesis
Convolutional Neural Networks
Analysis, ML & AI
competent 1+ years experience CNN architectures for image modeling
Used in:
  • Westphalia DataLab GmbH
R
Programming Languages
proficient 5+ years experience Statistical computing, Analysis, ML & AI, visualization
Used in:
  • Child and Adolescent Psychiatry
  • Westphalia DataLab GmbH
R Shiny
Analysis, ML & AI
competent 2+ years experience Interactive web applications for data science
Used in:
  • Westphalia DataLab GmbH
  • Freelance Work
MongoDB
Backend & DevOps
competent 2+ years experience Document-oriented NoSQL database
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
PostgreSQL
Backend & DevOps
competent 2+ years experience Advanced open-source relational database
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
SQL
Programming Languages
competent 3+ years experience Relational database queries and management
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
  • Bachelor's Thesis
Git
Tools & Systems
proficient 7+ years experience Version control, collaboration, workflows
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
  • Master's Thesis
  • Bachelor's Thesis
  • Child and Adolescent Psychiatry, Philipps University Marburg
  • everywhere

Praktikant, Sport- und Athleten-Marketing

Red Bull Germany GmbH • München, Deutschland

März 2016 - Aug. 2016

In meiner Rolle als Sport- und Athleten-Marketing-Manager aktualisierte und pflegte ich das Athleten-Portfolio als wertvolles Asset für den Marketing-Mix von Red Bull. Außerdem nahm ich am Business-Planning-Prozess für 2017 teil, indem ich Ideen generierte, diese evaluierte und für BP-Präsentationen aufbereitete.

  • Team-Aktivierung von THW Kiel einschließlich personalisiertem Asset-Design und -Produktion sowie einem Flug in einem von Mateschitz' privaten Flugzeugen
  • Event-Supervision und organisatorische Rolle in Projekten wie dem Hospitality-Bereich für Red Bulls VIPs beim MotoGP 2016
Excel
Tools & Systems
expert 15+ years experience Advanced formulas, macros, Analysis, ML & AI
Used in:
  • Red Bull Germany GmbH
  • Goodgame Studios
  • Raumdeuter GbR
PowerPoint
Tools & Systems
wizard 12+ years experience Presentations, storytelling, visual design
Used in:
  • Red Bull Germany GmbH
  • Rahn Education
  • Raumdeuter GbR
  • everywhere
MS Office
Tools & Systems
expert 15+ years experience Word, Excel, PowerPoint, Outlook
Used in:
  • Red Bull Germany GmbH
  • Goodgame Studios
  • Raumdeuter GbR
  • everywhere
Creativity

Student Brand Manager

Red Bull Germany GmbH • Hamburg, Deutschland

Mai 2013 - Dez. 2016

Das Student Brand Manager Programm von Red Bull ist darauf ausgelegt, die nächste Generation von Red Bull Marketing-Experten zu finden und auszubilden. Als Student Brand Manager war ich verantwortlich für die Organisation von Guerilla-Marketing-Events und die Schaffung von Markenbekanntheit in der Studentengemeinschaft. Die Rolle als SBM ermöglichte es mir, starke Marketing- und Führungskompetenzen zu entwickeln und praktische Erfahrungen im Markenmanagement von einer der weltweit bekanntesten Marken zu sammeln.

  • Student Brand Manager des Jahres 2016 in Norddeutschland
  • Organisation eigener Campus-Events und Moderation von Campus-Events anderer Student Brand Manager
  • Teilnahme und Unterstützung diverser regionaler und nationaler Events wie Red Bull Seifenkistenrennen und Red Bull Coast2Coast
Excel
Tools & Systems
expert 15+ years experience Advanced formulas, macros, Analysis, ML & AI
Used in:
  • Red Bull Germany GmbH
  • Goodgame Studios
  • Raumdeuter GbR
PowerPoint
Tools & Systems
wizard 12+ years experience Presentations, storytelling, visual design
Used in:
  • Red Bull Germany GmbH
  • Rahn Education
  • Raumdeuter GbR
  • everywhere
MS Office
Tools & Systems
expert 15+ years experience Word, Excel, PowerPoint, Outlook
Used in:
  • Red Bull Germany GmbH
  • Goodgame Studios
  • Raumdeuter GbR
  • everywhere
Adobe Photoshop
Web & Creative
proficient 20+ years experience Image editing, graphic design, digital art. GNU's GIMP or photopea are alternatives.
Used in:
  • Red Bull Germany GmbH
  • Hobby Projects
  • Raumdeuter GbR
  • everywhere

Werkstudent, Human Resources

Goodgame Studios • Hamburg, Deutschland

Aug. 2011 - Sept. 2012

Angefangen als Praktikant unterstützte ich das HR-Team bei verschiedenen administrativen Aufgaben, Rekrutierungsprozessen und Mitarbeiter-Onboarding-Aktivitäten. Diese Rolle gab mir wertvolle Einblicke in HR-Abläufe innerhalb eines schnell wachsenden Startup-Unternehmens.

  • Der HR-Rekrutierungsprozess war verantwortlich für die Einstellung von 70 neuen Mitarbeitern (von 30) innerhalb eines Jahres und trug zum schnellen Wachstum des Unternehmens bei.
  • Ich war verantwortlich für das Scouting und die Auswahl von Kandidaten, die Terminplanung von Interviews und die Koordination der Kommunikation zwischen Bewerbern und Hiring Managern, wodurch die Effizienz des Rekrutierungsprozesses verbessert wurde.
Excel
Tools & Systems
expert 15+ years experience Advanced formulas, macros, Analysis, ML & AI
Used in:
  • Red Bull Germany GmbH
  • Goodgame Studios
  • Raumdeuter GbR
MS Office
Tools & Systems
expert 15+ years experience Word, Excel, PowerPoint, Outlook
Used in:
  • Red Bull Germany GmbH
  • Goodgame Studios
  • Raumdeuter GbR
  • everywhere

Projekte

AutoCoverletter

Agentengestuetzte Automatisierung von Anschreiben

Automatisiert den End-to-End-Prozess fuer Anschreiben mit Agenten, lokalen MCP-Ressourcen und Context Engineering, damit Prompts fokussiert bleiben und mit lokalen Bewerbungsdaten abgestimmt sind.

  • Rund 90% des Anschreiben-Prozesses automatisiert, inklusive Notion-Sync und Bewerbungs-Tracking
  • Starke Anschreiben ohne Übertreibungen oder Fehleinschätzungen dank smartem Context-Management
  • Einheitliches, cleanes Design mit Hilfe von Typst Templates
  • Über 10% Einladungsquote zu Erstgespraechen trotz schwachem Arbeitsmarkt
Agenten-Workflows Lokales MCP Context Engineering Python
Programming Languages
proficient 7+ years experience General-purpose programming, Analysis, ML & AI, ML/AI, backend development
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
  • Child and Adolescent Psychiatry
  • Master's Thesis
  • Bachelor's Thesis
Codex Typst Notion Connections

Raumdeuter

Fanrelationship Management Software

Zuhören. Verstehen. Handeln. Raumdeuter hilft Sportclubs, Fanmeinungen in datenbasierte Entscheidungen und nachhaltiges Wissen zu verwandeln

  • Raumdeuter steht für das Gespür, Chancen zu erkennen und zu verwandeln, wie Thomas Müller auf dem Platz. Die Software gibt Sportclubs das Werkzeug an die Hand, um die Stimmen ihrer Fans in Erfolge abseits des Platzes zu übersetzen.
  • Quantitaive Umfragen, Zusammenfassung ähnlicher Texte über embedded Vectors und Clustering-Verfahren in qualitativen Umfragen, Sentiment Analyse der Ergebnisse zur frühen Trenderkennung
  • Die Software lässt sich nahtlos in bestehende Systeme wie Websites, Club-Apps oder Mitgliederportale integrieren. Damit bleibt alles im vertrauten Umfeld des Vereins. Die Fans müssen keine neue Plattform erlernen, sondern können direkt dort teilnehmen, wo sie ohnehin schon aktiv sind.
  • Pilotprojekt (Website Integration+Nutzende) mit Fußballclub aus der Region (Chemie Leipzig)
viel zu wenig Ressourcen Überstunden Kreativität Teamarbeit Verantwortung

Neuronale Maschinenübersetzung mit Pivot-Strategien

Masterarbeit über ressourcenarme Sprachpaare

Die Masterarbeit zeigt, dass Pivot-Übersetzungsstrategien ähnliche Übersetzungsqualitäten erreichen, was jedoch mit 99% weniger parallelen Trainingsdaten erreicht werden kann, wodurch NMT für ressourcenarme Sprachpaare praktikabel wird.

  • Erreichte 70-80% der direkten Übersetzungsqualität mit nur 1% paralleler Daten durch die Nutzung von Englisch als Brückensprache zwischen Französisch und Deutsch
  • Das leistungsstärkste Pivot-Modell zeigte substanzielle Verbesserungen gegenüber der Baseline: +15,4% BLEU, +5,8% chrF und -4,7% TER-Scores
  • Demonstrierte klaren Zusammenhang zwischen Pivot-Ressourcenverfügbarkeit und Übersetzungsqualität mittels Transformer-Architektur
  • Lieferte grundlegende Erkenntnisse für ressourcenarme NMT und die Entwicklung großer Sprachmodelle
Neural Machine Translation Pivot-Based Translation Transformer-Architektur OpenNMT-Library Large Language Models Artificial Neural Networks Bash
Programming Languages
proficient 4+ years experience Shell scripting, automation, system administration
Used in:
  • Raumdeuter GbR
  • Master's Thesis
  • Linux System Administration
  • Linux
Python
Programming Languages
proficient 7+ years experience General-purpose programming, Analysis, ML & AI, ML/AI, backend development
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
  • Child and Adolescent Psychiatry
  • Master's Thesis
  • Bachelor's Thesis
Höre den Thesis-Podcast
0:00 / 0:00

Cook Up Kitchen

PopUp Restaurant

Ein paar Freunde und ich starteten ein wiederkehrendes PopUp-Restaurant in Hamburg, um herauszufinden, ob Food-Blogging eine echte Marketing-Strategie für Restaurants sein könnte, was zu einer seitdem anhaltenden Business-Opportunity für einen von uns führte.

  • 2. Event: Video produziert von professionellem Videografen verfügbar auf Vimeo
  • 3. Event: Catering für 100 Personen in einer Nacht auf 3-Gänge-Menü-Basis in einer Küche, die sehr eindeutig nicht dafür ausgelegt war
Heiße Pfanne Öl Kreativität Teamarbeit

Publikationen

Phenotypic differences between female and male individuals with suspicion of ASD

Sanna Stroth, Johannes Tauscher, Nicole Beyer, Charlotte Küpper, Luise Poustka, Stefan Roepke, Veit Roessner, Dominik Heider, Inge Kamp-Becker • Molecular Autism, 13 (1), 2022 • 16 Zitierungen

Abstract

Although autism spectrum disorder (ASD) is a common developmental disorder, our knowledge about a behavioral and neurobiological female Phenotype is still scarce. As the conceptualization and understanding of ASD are mainly based on the investigation of male individuals, females with ASD may not be adequately identified by routine clinical diagnostics. The present Machine Learning approach aimed to identify diagnostic information from the Autism Diagnostic Observation Schedule (ADOS) that discriminates best between ASD and non-ASD in females and males. Random Forests were used to discover patterns of symptoms in diagnostic data from the ADOS (modules 3 and 4) in 1057 participants with ASD (18.1% female) and 1230 participants with non-ASD (17.9% % female). Predictive performances of reduced feature models were explored and compared between females and males without Intellectual Disability. Reduced feature models relied on considerably fewer features from the ADOS in females compared to males, while still yielding similar classification performance (e.g., Sensitivity and Specificity). As in previous studies, the current sample of females with ASD is smaller than the male sample and thus, females may still be underrepresented, limiting the statistical power to detect small to moderate effects. Our results do not suggest the need for new or altered diagnostic algorithms for females with ASD. Although we identified some Phenotype differences between females and males, the existing diagnostic tools seem to sufficiently capture the core autistic features in both groups.

Is the Combination of ADOS and ADI-R Necessary to Classify ASD? Rethinking the 'Gold Standard' in Diagnosing ASD

Sanna Stroth, Johannes Tauscher, Nicole Beyer, Charlotte Küpper, Luise Poustka, Stefan Roepke, Veit Roessner, Dominik Heider, Inge Kamp-Becker • Frontiers of Psychiatry, 12, 2021 • 45 Zitierungen

Abstract

Diagnosing autism spectrum disorder (ASD) requires extensive clinical expertise and training as well as a focus on Differential Diagnosis. The diagnostic process is particularly complex given symptom overlap with other mental disorders and high rates of co-occurring physical and mental health concerns. The aim of this study was to conduct a data-driven selection of the most relevant diagnostic information collected from a behavior observation and an anamnestic interview in two clinical samples of children/younger adolescents and adolescents/adults with suspected ASD. Via Random Forests, the present study discovered patterns of symptoms in the diagnostic data of 2310 participants (46% ASD, 54% non-ASD, age range 4–72 years) using data from the combined Autism Diagnostic Observation Schedule (ADOS) and Autism Diagnostic Interview-Revised (ADI-R) and ADOS data alone. Classifiers built on reduced subsets of diagnostic features yield satisfactory Sensitivity and Specificity values. For adolescents/adults specificity values were lower compared to those for children/younger adolescents. The models including ADOS and ADI-R data were mainly built on ADOS items and in the adolescent/adult sample the classifier including only ADOS items performed even better than the classifier including information from both instruments. Results suggest that reduced subsets of ADOS and ADI-R items may suffice to effectively differentiate ASD from other mental disorders. The imbalance of ADOS and ADI-R items included in the models leads to the assumption that, particularly in adolescents and adults, the ADI-R may play a lesser role than current behavior observations.

Identification of the most indicative and discriminative features from diagnostic instruments for children with autism

Sanna Stroth, Johannes Tauscher, Nicole Wolff, Charlotte Küpper, Luise Poustka, Stefan Roepke, Veit Roessner, Dominik Heider, Inge Kamp-Becker • JCPP Advances, Volume 1, Issue 2, 2021 • 9 Zitierungen

Abstract

Diagnosing autism spectrum disorder (ASD) is complex and time-consuming. The present work systematically examines the importance of items from the Autism Diagnostic Interview-Revised (ADI-R) and Autism Diagnostic Observation Schedule (ADOS) in discerning children with and without ASD. Knowledge of the most discriminative features and their underlying concepts may prove valuable for the future training tools that assist clinicians to substantiate or extenuate a suspicion of ASD in nonverbal and minimally verbal children. In two samples of nonverbal (N = 466) and minimally verbal (N = 566) children with ASD (N = 509) and other mental disorders or developmental delays (N = 523), we applied Random Forests to (i) the combination of ADI-R and ADOS data versus (ii) ADOS data alone. We compared the predictive performance of reduced feature models against outcomes provided by models containing all features. For nonverbal children, the Random Forests classifier indicated social orientation to be most powerful in differentiating ASD from non-ASD cases. In minimally verbal children, we find language/speech peculiarities in combination with facial/nonverbal expressions and reciprocity to be most distinctive. Based on Machine Learning strategies, we carve out those symptoms of ASD that prove to be central for the differentiation of ASD cases from those with other developmental or mental disorders (high Sensitivity and Specificity in minimally verbal children). These core concepts ought to be considered in the future training tools for clinicians.

Ausbildung

M.Sc in Data Science, Fakultät für Mathematik und Informatik

Universität Leipzig • Leipzig, Deutschland

Apr. 2021 - Okt. 2024

  • Gesamtnote: 1,7
  • Masterarbeit (1,1): Neural Machine Translation mit Transformers - Nutzung der Pivot Technique für Sprachpaare mit geringen Ressourcen
  • weitere persönliche Schwerpunkte auf fortgeschrittener Statistik, Machine Learning, Data Privacy, LLMs

B.Sc. in Data Science, Fakultät für Mathematik und Informatik

Philipps-Universität Marburg • Marburg, Deutschland

Okt. 2017 - März 2021

  • Bachelorarbeit (1,7): Multidimensionale Datenexploration und Visualisierung von Membranprotein-Attributen
  • Schwerpunkte: Mathematik, Statistik, Informatik und Programmierung

B.A. in Marketing und Technische Betriebswirtschaft

HAW Hamburg • Hamburg, Deutschland

März 2012 - Okt. 2017

  • Bachelorarbeit (1,7): Einsatz der Linear Discriminant Analysis als Alternative zur Baumanalyse - methodologische Bewertung und exemplarische Implementierung anhand einer Umfrage zum Erfolg von Filmen.
  • Schwerpunkte: Marketing, Engineering und Betriebswirtschaftslehre

Fähigkeiten

Python
Programming Languages
proficient 7+ years experience General-purpose programming, Analysis, ML & AI, ML/AI, backend development
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
  • Child and Adolescent Psychiatry
  • Master's Thesis
  • Bachelor's Thesis
R
Programming Languages
proficient 5+ years experience Statistical computing, Analysis, ML & AI, visualization
Used in:
  • Child and Adolescent Psychiatry
  • Westphalia DataLab GmbH
Bash
Programming Languages
proficient 4+ years experience Shell scripting, automation, system administration
Used in:
  • Raumdeuter GbR
  • Master's Thesis
  • Linux System Administration
  • Linux
Java
Programming Languages
competent 3+ years experience General-purpose programming, backend development
Used in:
  • Introduction to Computer Science and Software Engineering during Bachelor's Degree
SQL
Programming Languages
competent 3+ years experience Relational database queries and management
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
  • Bachelor's Thesis
JavaScript
Programming Languages
competent 2+ years experience Frontend development, Node.js, modern frameworks
Used in:
  • Raumdeuter GbR
  • Github Page
  • The Odin Project
Docker
Backend & DevOps
proficient 2+ years experience Containerization, (distroless) multi-stage builds, orchestration
Used in:
  • Raumdeuter GbR
  • Master's Thesis
MongoDB
Backend & DevOps
competent 2+ years experience Document-oriented NoSQL database
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
PostgreSQL
Backend & DevOps
competent 2+ years experience Advanced open-source relational database
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
gRPC
Backend & DevOps
beginner 1+ years experience High-performance RPC framework for, e.g., microservices
Used in:
  • Raumdeuter GbR
nginx
Backend & DevOps
competent 1+ years experience Web server, reverse proxy, load balancer
Used in:
  • Raumdeuter GbR
FastAPI
Backend & DevOps
competent 1+ years experience Python web framework for APIs and services
Used in:
  • Raumdeuter GbR
Adobe Photoshop
Web & Creative
proficient 20+ years experience Image editing, graphic design, digital art. GNU's GIMP or photopea are alternatives.
Used in:
  • Red Bull Germany GmbH
  • Hobby Projects
  • Raumdeuter GbR
  • everywhere
Next.js
Web & Creative
competent 1+ years experience React framework with server-side rendering and static site generation
Used in:
  • Raumdeuter GbR
  • Github Page
Machine Learning
Analysis, ML & AI
proficient 8+ years experience Classification, regression, clustering algorithms
Used in:
  • Child and Adolescent Psychiatry
  • Master's Thesis
  • Bachelor's Thesis
  • Bachelor's Thesis (Economics)
  • Westphalia DataLab GmbH
Statistics
Analysis, ML & AI
proficient 5+ years experience Inferential and descriptive statistics, modeling
Used in:
  • Child and Adolescent Psychiatry
  • Tutoring
  • Economics Bachelor's Thesis
  • Westphalia DataLab GmbH
NLP
Analysis, ML & AI
proficient 4+ years experience Processing Natural Language computationally.
Used in:
  • Raumdeuter GbR
  • Master's Thesis
LLMs
Analysis, ML & AI
proficient 3+ years experience Large Language Models integration and deployment
Used in:
  • Raumdeuter GbR
  • Master's Thesis
  • Interests & Hobby
Decision Trees
Analysis, ML & AI
expert 2+ years experience Tree-based classification and regression models
Used in:
  • Child and Adolescent Psychiatry, Philipps University Marburg
Random Forests
Analysis, ML & AI
expert 2+ years experience Ensemble of decision trees for prediction
Used in:
  • Child and Adolescent Psychiatry, Philipps University Marburg
PyTorch
Analysis, ML & AI
competent 2+ years experience Deep learning framework and training loops
Used in:
  • Westphalia DataLab GmbH
  • Master's Thesis
SpaCy
Analysis, ML & AI
competent; 1+ years experience NLP library for tokenization, tagging, and pipelines
Used in:
  • Raumdeuter GbR
RAG
Analysis, ML & AI
competent 1+ years experience Retrieval-augmented generation for LLM pipelines
Used in:
  • Raumdeuter GbR
Excel
Tools & Systems
expert 15+ years experience Advanced formulas, macros, Analysis, ML & AI
Used in:
  • Red Bull Germany GmbH
  • Goodgame Studios
  • Raumdeuter GbR
Linux
Tools & Systems
proficient 8+ years experience System administration, shell scripting, servers and personal use
Used in:
  • everywhere
git
Tools & Systems
proficient 7+ years experience Version control, collaboration, workflows
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
  • Master's Thesis
  • Bachelor's Thesis
  • Child and Adolescent Psychiatry, Philipps University Marburg
  • everywhere
Markdown
Tools & Systems
expert 6+ years experience Lightweight markup for docs and reports
Used in:
  • Raumdeuter GbR
  • Rahn Education (Private School)
  • Master's Thesis
  • Bachelor's Thesis
  • Westphalia DataLab GmbH
  • Child and Adolescent Psychiatry, Philipps University Marburg
GitHub
Tools & Systems
expert 5+ years experience Code hosting, collaboration, and workflows
Used in:
  • Raumdeuter GbR
  • Westphalia DataLab GmbH
  • Master's Thesis
  • Bachelor's Thesis
  • Child and Adolescent Psychiatry, Philipps University Marburg
LaTeX
Tools & Systems
proficient 4+ years experience Scientific document preparation and typesetting
Used in:
  • Master's Thesis
  • Bachelor's Thesis
  • Academic Papers
pytest
Tools & Systems
competent 1+ years experience Python testing framework and test automation
Used in:
  • Raumdeuter GbR
Protocol Buffers
Tools & Systems
competent 1+ years experience Schema-based data serialization for RPC and APIs
Used in:
  • Raumdeuter GbR
Skill proficiency and experience radar chart across 5 categories Programming Languages Backend & DevOps Web & Creative Analysis, ML & AI Tools & Systems

Hover over a category for details

Self-Assessment:
Avg Experience:
Skills:
Self-Assessment
Years of Experience

Programme & Auszeichnungen

Programme

exist-Gründungsstipendium

2024-2025

exist · Leipzig, Deutschland

Verantwortlich für die Entwicklung und den Launch einer Startup-Idee im Rahmen des exist-Stipendienprogramms, finanziert vom Bundesministerium für Wirtschaft und Klimaschutz (BMWK).

  • Gewinner der Impulse Summit 2025.
  • Gewinner des TGFS Technologiegründerfonds Sachsen Awards im Rahmen des HHL Digitale Space Programms 2025.
  • Gewinner der TechStart Dresden 2025.
  • Top 5 von 150 Finalist bei Samsung: Solve for Tomorrow 2025.
  • Besuch ausgewählter Business-Seminare zu verschiedenen Themen an der Universität Leipzig und der Leipzig Graduate School of Management (HHL).

Auszeichnungen

DataFest 24h Hackathon

2019

DataFest Mannheim · Mannheim, Deutschland

Entwicklung eines Kollisionserkennungsalgorithmus und einer Visualisierung für Daten einer Frauen Rugby Saison.

  • 3. Platz von 19 Teams für beste Daten-Insight und beste Datenvisualisierung.

Kontakt

Ich bin derzeit auf der Suche nach neuen Möglichkeiten. Kontaktieren Sie mich gerne!