OMG-LLaVA: Unifying Vision and Language Understanding, Step-DPO for LLMs Mathematical Reasoning, MUMU's Multimodal Image Generation
MP3•Thuis aflevering
Manage episode 426781828 series 3568650
Inhoud geleverd door PocketPod. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door PocketPod of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.
OMG-LLaVA: Bridging Image-level, Object-level, Pixel-level Reasoning and Understanding Step-DPO: Step-wise Preference Optimization for Long-chain Reasoning of LLMs MUMU: Bootstrapping Multimodal Image Generation from Text-to-Image Data Simulating Classroom Education with LLM-Empowered Agents SeaKR: Self-aware Knowledge Retrieval for Adaptive Retrieval Augmented Generation
…
continue reading
70 afleveringen