第2回 LT会
第2回 AIForum LT会を開催しました。今回は2件のライトニングトークが行われました。
LT① LLM as a Judge を用いた評価技術
LLM(大規模言語モデル)自体を評価者として活用する「LLM as a Judge」の手法を取り上げました。世の中での使われ方から、実際の開発方法まで幅広く紹介しました。
- LLM as a Judge の概要と活用事例(RAG評価、チャットボット品質測定など)
- 評価ルーブリックの設計方法とプロンプトへの落とし込み
- Excelデータに対してLLMで一括評価を行う処理フローの実装方法
LT② AIエージェントについて
Claude Code・Codex CLI・Gemini CLI といった最新のAIエージェントツールを紹介し、実際にエージェントを動かすデモを披露しました。
- 各ツール(Claude Code / Codex CLI / Gemini CLI)の特徴と比較
- フォルダ整理タスクをエージェントに任せるデモ
- ミニ業務効率化アプリをエージェントに作らせるライブデモ
発表資料はこちらからご覧いただけます。
次回のLT会も随時開催予定です。発表に興味のある方はぜひご連絡ください。