未分類

未分類

Tokenizerを学ぶ:つくりながら学ぶ!LLM自作入門 第2章 輪読会

はじめに 今日はニューラルネットワークの基礎である ステップ関数と逆伝播の微分 を勉強しました。 また、11:00〜13:00 に『つくりながら学ぶ!LLM 自作入門』の輪読会に参加し、**第2章「トークナイザー」**を扱いました。 ステッ...
未分類

PyCon JP 2025 登壇準備ログ #02 – LLM学習 vs 推論、RAGの役割整理と MiniGPT 実装レビュー

TL;DR LLM学習では「損失→勾配→最適化(AdamW)」が必須。推論は前向きのみ。 **RAG(TF-IDF+コサイン)**は“統計+線形代数”で完結。勾配・活性化・最適化は使わない。 自作 MiniGPT(Pre-LN, GELU)...
未分類

PyCon JP 2025 登壇準備ログ 01 – corpus処理の修正とコメント整備

今日はコードとにらめっこしながら、少しずつ準備を進めました。 やったことを振り返ると、大きくは2つです。 1. 全体処理にコメントを追加 今までコードを書きっぱなしだったので、読み返すと「これ何だっけ?」となる部分が多かったんです。 そこで...
未分類

エンジニアじゃなくてもできる!ビジネスパーソンのための「プロンプトエンジニアリング基本テクニック集」

AIと仕事をする時代、「プロンプトの書き方」は新しい必須スキルになっています。でも、プロンプトエンジニアリングと聞くと、「なんだかエンジニア向けの難しい技術なのでは?」と思ってしまう人も多いかもしれません。 安心してください。 今回は、エン...
未分類

OpenAI Realtime APIとWebSocketを使ったリアルタイム音声処理

はじめに 音声データをリアルタイムで処理するアプリケーションの需要は、音声認識や音声チャットの普及により増加しています。この記事では、OpenAI Realtime APIを活用し、リアルタイム音声データを処理する実装方法を解説します。 特...