[QA] From 128K To 4M: Efficient Training Of Ultra-Long Context Large Language Models Arxiv Papers podcast

Artwork

Science Igor Melnyk

Inhoud geleverd door Igor Melnyk. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door Igor Melnyk of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.

Arxiv Papers « »
[QA] From 128K to 4M: Efficient Training of Ultra-Long Context Large Language Models

8M ago 8:19

Delen

MP3•Thuis aflevering

Inhoud geleverd door Igor Melnyk. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door Igor Melnyk of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.

This paper presents an efficient training method for ultra-long context LLMs, extending context lengths to 4M tokens while maintaining performance on both long and short context tasks.

https://arxiv.org/abs//2504.06214

YouTube: https://www.youtube.com/@ArxivPapers

TikTok: https://www.tiktok.com/@arxiv_papers

Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016

Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers

… continue reading

2489 afleveringen

#Science #Igor Melnyk

Artwork

[QA] From 128K to 4M: Efficient Training of Ultra-Long Context Large Language Models

published 8M ago

Delen

MP3•Thuis aflevering

Inhoud geleverd door Igor Melnyk. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door Igor Melnyk of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.

This paper presents an efficient training method for ultra-long context LLMs, extending context lengths to 4M tokens while maintaining performance on both long and short context tasks.

https://arxiv.org/abs//2504.06214

YouTube: https://www.youtube.com/@ArxivPapers

TikTok: https://www.tiktok.com/@arxiv_papers

Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016

Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers

… continue reading

2489 afleveringen

#Science #Igor Melnyk

Alle afleveringen

×

Welkom op Player FM!

Player FM scant het web op podcasts van hoge kwaliteit waarvan u nu kunt genieten. Het is de beste podcast-app en werkt op Android, iPhone en internet. Aanmelden om abonnementen op verschillende apparaten te synchroniseren.

Luister naar 500+ onderwerpen

Luister naar deze show terwijl je op verkenning gaat