Artwork

Inhoud geleverd door Webredactie and BNR Nieuwsradio. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door Webredactie and BNR Nieuwsradio of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.
Player FM - Podcast-app
Ga offline met de app Player FM !

OpenAI gebruikte (of: misbruikte?) YouTube om AI-model GPT-4 te trainen

6:03
 
Delen
 

Manage episode 411253847 series 1711759
Inhoud geleverd door Webredactie and BNR Nieuwsradio. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door Webredactie and BNR Nieuwsradio of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.

OpenAI, de maker van ChatGPT, heeft miljoenen uren aan video's op YouTube gebruikt om eigen AI-taalmodellen te trainen. Joe van Burik legt in deze Tech Update uit wat er is gebeurt.

OpenAI heeft al eind 2021 (een jaar voor de lancering van ChatGPT, dus) volop YouTube-video's gebruikt om AI-taalmodel GPT-4 te trainen. Dat schrijft The New York Times. Dat deed de start-up die vooral gesteund wordt door Microsoft door hun eigen AI-systeem voor audiotranscriptie te ontwikkelen, Whisper genaamd. Door al die audio van video's op het videoplatform van Google om te zetten in tekst, konden ze het gebruiken.

Maar juridisch gezien is dat schimmig, want mogelijk mag dat niet. Hoewel Google zelf ook AI-taalmodellen trainen met behulp van video's, doet het dat naar eigen zeggen conform overeenkomsten met makers van video's. Al heeft Google daarvoor volgens de New York Times nog de voorwaarden aangepast in 2023.

Google zegt in een reactie tegen The Verge dat het ook daadwerkelijk activiteit van OpenAI op de systemen heeft gezien. OpenAI presenteerde onlangs AI-tool Sora om ook video's mee te generen, daarover zei eerder de CEO van YouTube dat OpenAI mogelijk YouTube zou hebben gebruikt (danwel misbruikt). OpenAI zegt in elk geval tegen The Verge dat ze daar 'unieke datasets' maken om 'AI-modellen te helpen de wereld te gebruiken', met 'vele bronnen inclusief publiek beschikbare data en samenwerkingen voor niet-publieke data'.

Verder in deze Tech Update:

  • Het voorstel om TikTok gedwongen te laten verkopen aan een Amerikaans bedrijf of anders te verbieden, wordt 'in de komende weken en maanden' verder besproken in de Amerikaanse Senaat
  • De veelbesproken zonsverduistering boven de Verenigde Staten vanavond is live te volgen via Twitch, waar de gebeurtenis in samenwerking met de NASA wordt gelivestreamd

See omnystudio.com/listener for privacy information.

  continue reading

2042 afleveringen

Artwork
iconDelen
 
Manage episode 411253847 series 1711759
Inhoud geleverd door Webredactie and BNR Nieuwsradio. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door Webredactie and BNR Nieuwsradio of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.

OpenAI, de maker van ChatGPT, heeft miljoenen uren aan video's op YouTube gebruikt om eigen AI-taalmodellen te trainen. Joe van Burik legt in deze Tech Update uit wat er is gebeurt.

OpenAI heeft al eind 2021 (een jaar voor de lancering van ChatGPT, dus) volop YouTube-video's gebruikt om AI-taalmodel GPT-4 te trainen. Dat schrijft The New York Times. Dat deed de start-up die vooral gesteund wordt door Microsoft door hun eigen AI-systeem voor audiotranscriptie te ontwikkelen, Whisper genaamd. Door al die audio van video's op het videoplatform van Google om te zetten in tekst, konden ze het gebruiken.

Maar juridisch gezien is dat schimmig, want mogelijk mag dat niet. Hoewel Google zelf ook AI-taalmodellen trainen met behulp van video's, doet het dat naar eigen zeggen conform overeenkomsten met makers van video's. Al heeft Google daarvoor volgens de New York Times nog de voorwaarden aangepast in 2023.

Google zegt in een reactie tegen The Verge dat het ook daadwerkelijk activiteit van OpenAI op de systemen heeft gezien. OpenAI presenteerde onlangs AI-tool Sora om ook video's mee te generen, daarover zei eerder de CEO van YouTube dat OpenAI mogelijk YouTube zou hebben gebruikt (danwel misbruikt). OpenAI zegt in elk geval tegen The Verge dat ze daar 'unieke datasets' maken om 'AI-modellen te helpen de wereld te gebruiken', met 'vele bronnen inclusief publiek beschikbare data en samenwerkingen voor niet-publieke data'.

Verder in deze Tech Update:

  • Het voorstel om TikTok gedwongen te laten verkopen aan een Amerikaans bedrijf of anders te verbieden, wordt 'in de komende weken en maanden' verder besproken in de Amerikaanse Senaat
  • De veelbesproken zonsverduistering boven de Verenigde Staten vanavond is live te volgen via Twitch, waar de gebeurtenis in samenwerking met de NASA wordt gelivestreamd

See omnystudio.com/listener for privacy information.

  continue reading

2042 afleveringen

所有剧集

×
 
Loading …

Welkom op Player FM!

Player FM scant het web op podcasts van hoge kwaliteit waarvan u nu kunt genieten. Het is de beste podcast-app en werkt op Android, iPhone en internet. Aanmelden om abonnementen op verschillende apparaten te synchroniseren.

 

Korte handleiding