第2回 LT会

第2回 AIForum LT会を開催しました。今回は2件のライトニングトークが行われました。

LT① LLM as a Judge を用いた評価技術

LLM(大規模言語モデル)自体を評価者として活用する「LLM as a Judge」の手法を取り上げました。世の中での使われ方から、実際の開発方法まで幅広く紹介しました。

  • LLM as a Judge の概要と活用事例(RAG評価、チャットボット品質測定など)
  • 評価ルーブリックの設計方法とプロンプトへの落とし込み
  • Excelデータに対してLLMで一括評価を行う処理フローの実装方法

LT② AIエージェントについて

Claude Code・Codex CLI・Gemini CLI といった最新のAIエージェントツールを紹介し、実際にエージェントを動かすデモを披露しました。

  • 各ツール(Claude Code / Codex CLI / Gemini CLI)の特徴と比較
  • フォルダ整理タスクをエージェントに任せるデモ
  • ミニ業務効率化アプリをエージェントに作らせるライブデモ

発表資料はこちらからご覧いただけます。


次回のLT会も随時開催予定です。発表に興味のある方はぜひご連絡ください。