Artwork

Inhoud geleverd door PocketPod. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door PocketPod of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.
Player FM - Podcast-app
Ga offline met de app Player FM !

AI Models Get More Efficient, Video Understanding Makes Breakthroughs, and Digital Twins Transform Physical World

10:36
 
Delen
 

Manage episode 460183196 series 3568650
Inhoud geleverd door PocketPod. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door PocketPod of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.
Today's tech landscape is witnessing a dramatic shift in how artificial intelligence processes and understands our world, from streamlined language models to systems that can truly comprehend motion in videos. These advances are paving the way for AI to better interact with the physical world through digital twins, potentially revolutionizing everything from robotics to how we create and control digital content. Links to all the papers we discussed: REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models, MotionBench: Benchmarking and Improving Fine-grained Video Motion Understanding for Vision Language Models, Cosmos World Foundation Model Platform for Physical AI, LLaVA-Mini: Efficient Image and Video Large Multimodal Models with One Vision Token, Sa2VA: Marrying SAM2 with LLaVA for Dense Grounded Understanding of Images and Videos, Diffusion as Shader: 3D-aware Video Diffusion for Versatile Video Generation Control
  continue reading

94 afleveringen

Artwork
iconDelen
 
Manage episode 460183196 series 3568650
Inhoud geleverd door PocketPod. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door PocketPod of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.
Today's tech landscape is witnessing a dramatic shift in how artificial intelligence processes and understands our world, from streamlined language models to systems that can truly comprehend motion in videos. These advances are paving the way for AI to better interact with the physical world through digital twins, potentially revolutionizing everything from robotics to how we create and control digital content. Links to all the papers we discussed: REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models, MotionBench: Benchmarking and Improving Fine-grained Video Motion Understanding for Vision Language Models, Cosmos World Foundation Model Platform for Physical AI, LLaVA-Mini: Efficient Image and Video Large Multimodal Models with One Vision Token, Sa2VA: Marrying SAM2 with LLaVA for Dense Grounded Understanding of Images and Videos, Diffusion as Shader: 3D-aware Video Diffusion for Versatile Video Generation Control
  continue reading

94 afleveringen

Alle afleveringen

×
 
Loading …

Welkom op Player FM!

Player FM scant het web op podcasts van hoge kwaliteit waarvan u nu kunt genieten. Het is de beste podcast-app en werkt op Android, iPhone en internet. Aanmelden om abonnementen op verschillende apparaten te synchroniseren.

 

Korte handleiding

Luister naar deze show terwijl je op verkenning gaat
Spelen