Kaum hat sich der Mensch an Text- und Bildgeneratoren gewöhnt, veröffentlichen OpenAI, Google, Microsoft und Meta ihre multimodalen Modelle, die beide Welten vereinen. Das ermöglicht praktischen KI-Anwendungen und sogar Robotern ein umfassenderes Verständnis der Welt.
| Titel | Mit allen Sinnen - Multimodale KIs kombinieren Bild und Text. |
|---|---|
| Medien | c't Magazin für Computertechnik |
| Verlag | Heise |
| Heft | 11 |
| Band | 2024 |
| ISBN | https://www.heise.de/select/ct/2024/11/2404614132254916448 |
| Verfasser | Prof. Dr. René Peinl |
| Seiten | 52-56 |
| Veröffentlichungsdatum | 31.05.2024 |
| Projekttitel | M4-SKI |
| Zitation | Peinl, René (2024): Mit allen Sinnen - Multimodale KIs kombinieren Bild und Text. . c't Magazin für Computertechnik 2024 (11), 52-56. |