107. LLMをゼロから作るということ w/ Takahiro Omi

fukabori.fm

Inhoud geleverd door iwashi. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door iwashi of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.

1+ y ago 38:22

MP3•Thuis aflevering

ストックマークの近江さんをゲストに、大規模言語モデルをゼロから作る方法、学習のデータセット、モデルアーキテクチャ、学習環境への取り組みなどについて語っていただきました。

話したネタ

どのような大規模言語モデルと作ったのか？特徴は何か？
データセットに何を使ったのか？
日本語と英語とのバランスは？
最終的なToken数は？
事前学習モデルを作りたいとして、何から考えるのか？
ノイズのクリーニングと、その方法
今回活用したモデルアーキテクチャ(Llama)
前回のアーキテクチャは GPT-NeoX
今回の学習環境は？
AWS Trainum 32コア x 16ノード
学習にかかった時間は？
学習時に大変だったこと・上手くいかなかったことは？
学習中のチェックポイントとは何か？
なぜ、Token生成が速いのか？
手元でLLMを動かすときの一番のネックは？
bit数を落とすFineTuning
Tokenizerとは何か？
日本語の単語区切りはどのように考えるのか？
今回のLLM作成のTokenizerは何を使ったのか？
ビジネスドメインでのLLM評価
ストックマーク株式会社のRecruitページ

See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

127 afleveringen

#テクノロジー #Fukabori #iwashi

107. LLMをゼロから作るということ w/ Takahiro Omi

fukabori.fm

23 subscribers

published 1+ y ago

MP3•Thuis aflevering

話したネタ

どのような大規模言語モデルと作ったのか？特徴は何か？
データセットに何を使ったのか？
日本語と英語とのバランスは？
最終的なToken数は？
事前学習モデルを作りたいとして、何から考えるのか？
ノイズのクリーニングと、その方法
今回活用したモデルアーキテクチャ(Llama)
前回のアーキテクチャは GPT-NeoX
今回の学習環境は？
AWS Trainum 32コア x 16ノード
学習にかかった時間は？
学習時に大変だったこと・上手くいかなかったことは？
学習中のチェックポイントとは何か？
なぜ、Token生成が速いのか？
手元でLLMを動かすときの一番のネックは？
bit数を落とすFineTuning
Tokenizerとは何か？
日本語の単語区切りはどのように考えるのか？
今回のLLM作成のTokenizerは何を使ったのか？
ビジネスドメインでのLLM評価
ストックマーク株式会社のRecruitページ

See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

127 afleveringen

#テクノロジー #Fukabori #iwashi

Alle afleveringen

Welkom op Player FM!

Player FM scant het web op podcasts van hoge kwaliteit waarvan u nu kunt genieten. Het is de beste podcast-app en werkt op Android, iPhone en internet. Aanmelden om abonnementen op verschillende apparaten te synchroniseren.

Luister naar 500+ onderwerpen

1
くりらじ Tech Avenue

くりらじ

1
トレンドウォッチ

くりらじ

1
Rebuild

Tatsuhiko Miyagawa

1
狭くて浅いやつら漫画（マンガ）・ゲーム・映画・アニメの感想

サワダシンヤ

1
backspace.fm

backspace.fm

1
そんない雑貨店

そんないプロジェクト

1
Apple News Radio ワンボタンの声

ワンボタンの声制作委員会

Podcasts die het beluisteren waard zijn

fukabori.fm « »
107. LLMをゼロから作るということ w/ Takahiro Omi

107. LLMをゼロから作るということ w/ Takahiro Omi

Podcasts die het beluisteren waard zijn

Alle afleveringen

Welkom op Player FM!

1
くりらじ Tech Avenue

くりらじ

1
トレンドウォッチ

くりらじ

1
Rebuild

Tatsuhiko Miyagawa

1
狭くて浅いやつら漫画（マンガ）・ゲーム・映画・アニメの感想

サワダシンヤ

1
backspace.fm

backspace.fm

1
そんない雑貨店

そんないプロジェクト

1
Apple News Radio ワンボタンの声

ワンボタンの声制作委員会

Korte handleiding

Overeenkomstig met fukabori.fm

Podcasts die het beluisteren waard zijn

fukabori.fm « » 107. LLMをゼロから作るということ w/ Takahiro Omi

107. LLMをゼロから作るということ w/ Takahiro Omi

Podcasts die het beluisteren waard zijn

Welkom op Player FM!

Overeenkomstig met fukabori.fm

Korte handleiding

fukabori.fm « »
107. LLMをゼロから作るということ w/ Takahiro Omi