Peinl, René; Tischler, Vincent (2025)
Future Technologies Conference (FTC) 2025, Munich, Germany 2025.
This paper introduces a novel benchmark dataset designed to evaluate the capabilities of Vision Language Models (VLMs) on tasks that combine visual reasoning with subject-specific background knowledge in the German language. In contrast to widely used English-language benchmarks that often rely on artificially difficult or decontextualized problems, this dataset draws from real middle school curricula across nine domains including mathematics, history, biology, and religion. The benchmark includes over 2,000 open-ended questions grounded in 486 images, ensuring that models must integrate visual interpretation with factual reasoning rather than rely on superficial textual cues. We evaluate thirteen state-of-the-art open-weight VLMs across multiple dimensions, including domain-specific accuracy and performance on adversarial crafted questions. Our findings reveal that even the strongest models achieve less than 45% overall accuracy, with particularly poor performance in music, mathematics, and adversarial settings. Furthermore, the results indicate significant discrepancies between success on popular benchmarks and real-world multimodal understanding. We conclude that middle school-level tasks offer a meaningful and underutilized avenue for stress-testing VLMs, especially in non-English contexts. The dataset and evaluation protocol serve as a rigorous testbed to better understand and improve the visual and linguistic reasoning capabilities of future AI systems.
Koch, Christoph; Vivek Bedse, Sahil (2025)
10th International Conference on Operational Excellence in Porto (under review).
Markus, Heike; Cisneros Saldana, Shantall Marucia; Acharya, Sampat; Singh, Sonali; Punekar, Parth (2025)
Markus, Heike; Cisneros Saldana, Shantall Marucia; Acharya, Sampat; Singh, Sonali...
Industry 4.0 Science 41 (3), S. 62-68.
DOI: 10.30844/I4SD.25.3.62
Industrie 4.0 hat mit der Verschmelzung von physischen Systemen und digitalen Lösungen wie Künstliche Intelligenz (KI), Internet of Things (IoT) und Cloud-Computing einen tiefgreifenden Wandel in der Fertigung ausgelöst [1]. Im Zentrum dieser Entwicklung steht der Digitale Zwilling (DZ) [2] – eine virtuelle Abbildung physischer Objekte und Prozesse, welche Echtzeitüberwachung, Simulation und Optimierung ermöglichen. Trotz ihrer Vorteile stehen DZ in verschiedenen Sektoren vor erheblichen Herausforderungen bei der Einführung. Hohe Implementierungskosten sowie technische und organisatorische Probleme hindern die Industrie häufig daran, den vollen Nutzen aus diesen Lösungen zu schöpfen [3].
Ziel dieser Studie ist es, die Lücke zwischen neuen Technologien und deren praktischer Anwendung zu schließen. Sie verfolgt den Ansatz, ein kostengünstiges und leicht umsetzbares DZ-Modell mit TRL von 5 zu entwickeln, allein mithilfe frei verfügbarer Open-Source-Plattformen und gängiger kommerzieller Software.
Digitale Zwillinge verbessern die Echtzeit-Überwachung, die vorausschauende Wartung und die Automatisierung. Trotz des weitverbreiteten Einsatzes in der Fertigung, der Automobilindustrie und im Gesundheitswesen wird die Technologie in der Landwirtschaft nur begrenzt genutzt [4]. Generelle Hindernisse für die Einführung in Deutschland sind strenge Datenschutzgesetze (77 %), ein Mangel an Fachkräften (64 %) und finanzielle Zwänge [5]. In der Landwirtschaft kommen Unsicherheiten bezüglich der Rentabilität, hoher Anschaffungskosten und begrenztem technischen Support hinzu [6].
Trotz dieser Herausforderungen können DZ die Digitalisierung der Landwirtschaft verändern, indem sie virtuelle Darstellungen von Anlagen und Prozessen in Echtzeit liefern und so die Landwirtschaft nachhaltig unterstützen. Angesichts des hohen Anteils der Landwirtschaft an Treibhausgasemissionen und Energieverbrauch [7] können DZ dabei helfen, CO₂-Emissionen, Biodiversität und Bodenqualität systematisch zu erfassen und so die nachhaltige Entwicklung fördern [8].
Peinl, René; Eren, Özgür (2025)
11th International Conference of the Immersive Learning Research Network (iLRN2025), June 16-19, 2025, Chicago, IL, United States 2025.
Virtual reality has proven to be a valuable addition in the tool belt of teachers. Immersive learning environments are applied in various settings, including, but not limited to the medical and nursing domain. In this study we present “We care in VR”, a simulation for practicing nursing tasks for care at home, a part of nursing that is currently underrepresented in available VR applications. We investigate how realistic interactions are perceived by end users compared to consistent usage of buttons on the controllers and how they affect the ease of use of the simulation. We conduct an empirical study with 50 participants from three vocational schools of nursing and a university of applied sciences. Results suggest that our simulation already works quite well and is accepted by the target group, but still needs improvement regarding ease of use, especially for users without any previous experience with VR applications.
Drossel, Matthias; Feick, Frank; Gläßel, Daniel; Schmola, Gerald (2025)
Frontiers in Health Informatics 14 (2), S. 2398-2408.
Castillo, Lina; Permin, Eike; Jahn, Cornelius; Drossel, Matthias; Wohlgemuth, Carsten (2025)
Castillo, Lina; Permin, Eike; Jahn, Cornelius; Drossel, Matthias...
ELSEVIER - https://www.sciencedirect.com/journal/procedia-cirp 134, S. 181-186.
DOI: 10.1016/j.procir.2025.03.013
Peinl, René (2025)
9th International Conference on Advances in Artificial Intelligence (ICAAI 2025), September 11-13, 2025 in Manchester, UK (under review).
This study examines how Large Language Models (LLMs) can reduce biases in text-to-image generation systems by modifying user prompts. We define bias as a model's unfair deviation from population statistics given neutral prompts. Our experiments with Stable Diffusion XL, 3.5 and Flux demonstrate that LLM-modified prompts significantly increase image diversity and reduce bias without the need to change the image generators themselves. While occasionally producing results that diverge from original user intent for elaborate prompts, this approach generally provides more varied interpretations of underspecified requests rather than superficial variations. The method works particularly well for less advanced image generators, though limitations persist for certain contexts like disability representation. All prompts and generated images are available at https://iisys-hof.github.io/llm-prompt-img-gen/
Wolff, Dietmar (2025)
ForumPflege LIVE, Bayerisches Rotes Kreuz, online 30.04.2025..
Wagener, Andreas (2025)
Arbeitgeberverband der Ernährungsindustrie Baden-Württemberg & Baden-Württembergischer Brauerbund, Leinfelden-Echterdingen.
Drossel, Matthias (2025)
, S. 261-271.
DOI: 10.1007/978-3-031-78322-7
Buchmann, Thomas; Schwägerl, Felix; Peinl, René (2025)
20th International Conference on Software Technologies. 10-12.06.2025, Bilbao, Spain (accepted).
This paper considers three fundamental approaches to software development, namely manual coding, modeldriven software engineering, and code generation by large language models. All of these approaches have their individual pros and cons, motivating the desire for an integrated approach. We present MoProCo, a technical solution to integrate the three approaches into a single tool chain, allowing the developer to split a software engineering task into modeling, prompting or coding sub-tasks. From a single input file consisting of static model structure, natural language prompts and/or source code fragments, Java source code is generated using a two-stage approach. A case study demonstrates that the MoProCo approach combines the desirable properties of the three development approaches by offering the appropriate level of abstraction, determinism, and dynamism for each specific software engineering sub-task.
Peinl, René; Tischler, Vincent (2025)
21st International Conference on Artificial Intelligence Applications and Innovations, 26 – 29 June, 2025, Limassol, Cyprus (accepted).
Similar to LLMs, the development of vision language models is mainly driven by English datasets and models trained in English and Chinese language, whereas support for other languages, even those considered high-resource languages such as German, remains significantly weaker. In this work we present an analysis of open-weight VLMs on factual knowledge in the German and English language. We disentangle the image-related aspects from the textual ones by analyzing accuracy with jury-as-a-judge in both prompt languages and images from German and international contexts. We found that for celebrities and sights, VLMs struggle because they are lacking visual cognition of German image contents. For animals and plants, the tested models can often correctly identify the image contents according to the scientific name or English common name but fail in German language. Cars and supermarket products were identified equally well in English and German images across both prompt languages.
Muth, Claudia (2025)
In J. F. Popp & G. Foken (Eds.), Design als Kulturpraxis. Würzburger Beiträge zur Designforschung. Wiesbaden: Springer VS. 2025, S. 31-67.
DOI: 10.1007/978-3-658-46953-5_3
Wolff, Dietmar; Stock, Nele (2025)
Session „Anbindung an die TI, Entscheidungsunterstützung durch KI, … – Pflege im digitalen Aufbruch ?!“, DMEA 2025, Berlin 08.04.2025.
Finn, Markus (2025)
Sozialgerichtsbarkeit (SGb) – Zeitschrift für das aktuelle Sozialrecht 72 (4), S. 189 – 198.
Mundackal, Jasmine Rose; Frank, Julia; Müller-Czygan, Günter; Dörfler, Wiebke; Neuhaus, Wolfgang; Pöschl, Ulla (2025)
Mundackal, Jasmine Rose; Frank, Julia; Müller-Czygan, Günter; Dörfler, Wiebke...
Terra Green 04/2025, S. 49-52.
Drossel, Matthias (2025)
Kohlhammer.
Müller-Czygan, Günter (2025)
Treffpunkt Kommune .
Städte sehen sich durch den Klimawandel einer zunehmenden Komplexität und einer Vielzahl an Krisen gegenüber. Steigende Temperaturen und häufigere Extremwetterereignisse belasten die urbane Infrastruktur erheblich. Verstädterung und Bevölkerungswachstum verschärfen diese Herausforderungen, indem sie den Flächenbedarf erhöhen und die Ressourcennutzung intensivieren. Versiegelte Flächen verhindern die natürliche Wasserversickerung und verschärfen Hochwassergefahren. Zudem führen urbane Wärmeinseln zu erhöhtem Energieverbrauch und Gesundheitsrisiken.
Dieser Band rekapituliert empirische Projekte der Forschungsgruppe "Empirical Research and User Experience (ERUX)“ am Institut für Informationssysteme (iisys) der Hochschule Hof aus den Jahren 2023 bis 2024.
Im Fokus steht die Usability von Features im Fahrzeuginnenraum, nämlich Fahrerassistenzsysteme, Optionen für die Klimaanlage und Situational Awareness Interfaces.
Während im ersten Band dieser Reihe neben einer großzahligen Erhebung vor allem die apparative Beobachtung mittels Eyetracking Anwendung fand, verwenden die im aktuellen Band referierten Forschungsprojekte ein eher qualitatives
empirisches Methodenspektrum, von Expertenratings über die Analyse von Use Cases bis zu Konzepttests mit zahlenmäßig begrenzten Usergruppen. Daneben ist eine Conjoint-Studie enthalten.
Im Automobilsektor hat die „Markt“- oder „Kundenorientierung“ in den letzten Jahrzehnten kaum Fortschritte gemacht, die Zufriedenheit der Kunden mit dem Automobil ist eher rückläufig. Im Zeitablauf haben zuerst die Kosten-
einsparungswelle und nachfolgend die Erfordernisse und die Präferenzen der Softwareentwicklung die HMI im Fahrzeuginnenraum viel stärker determiniert als die Usability für die Autofahrer, die das fertige Produkt letztlich bezahlen müssen.
Und weiterhin haben bei einigen OEM mächtige Designabteilungen das letzte Wort bei allen Oberflächen, mit denen der Autofahrer in Kontakt kommt. Als Fazit einer Vielzahl von Detailerkenntnissen aus den hier berichteten Studien lässt
sich feststellen, dass für die Berücksichtigung von Useranforderungen in der Entwicklung weiterhin viele Ansatzpunkte bestehen. Zugleich zeigt sich, dass die Auskunftsfähigkeit von Usern in Bezug auf zukünftige Fahrsituationen begrenzt ist.
Dieser Band redet somit keineswegs einer einseitigen Dominanz „des Marketings“ oder „der Marketingforschung“ im Entwicklungsprozess das Wort. Richtig bleibt vielmehr, was schon seit Jahrzehnten bekannt ist: Es kommt darauf an, ingenieurbasierte Innovations-
leistungen, kreative Designentwürfe, kundenseitige Nutzenerwartungen und marktgegebene Kostenvorgaben in ein ausgewogenes Verhältnis zu bringen. Das Know-how über den dafür erforderlichen, laufenden Abstimmungsprozess entscheidet über den Markterfolg
This volume recaps selected empirical projects from the research group Empirical Research and User Experience (ERUX) at the Institute for Information Systems (iisys) at Hof University from 2023 to 2024. The focus is on the usability of features inside the vehicle, specifically driver assistance systems, climate control options, and situational awareness interfaces, which are designed to provide drivers with orientation and safety when transitioning from manual to automated driving modes. While the first volume of this series included a large-scale survey and primarily relied on apparatus observation using eye tracking, the research projects referenced in the current volume employ a more qualitative empirical method spectrum, ranging from expert ratings to the analysis of use cases and concept testing with numerically limited user groups. As in the first volume, a conjoint study is also included. In the automotive sector, the focus on "market" or "customer orientation" has made little noticeable progress in recent decades, and customer satisfaction with automobiles is declining. Over time, the cost-saving wave and, later, the demands and preferences of software development have determined HMI in the vehicle interior much more strongly than usability from the perspective of the drivers, who ultimately pay for the final product. Furthermore, at some OEMs, powerful design departments still have the final say on all surfaces that the driver interacts with. As a conclusion from a variety of detailed findings, it can be stated that there are still many areas for the consideration of user requirements in development. At the same time, the studies reported here show that users' ability to provide meaningful feedback on future driving situations and associated requirements is limited. This volume does not advocate for the one-sided dominance of "marketing" or "marketing research" in the development process. Rather, what has been known for decades remains true: It is essential to strike a balance between engineering-based innovations, creative design concepts, customer expectations of value, and market-driven cost requirements. The expertise required for the ongoing coordination process is what ultimately determines market success.
Alfons-Goppel-Platz 1
95028 Hof
T +49 9281 409 - 4690
valentin.plenk[at]hof-university.de