HarborによるAIエージェントの性能評価
今回はAIエージェントを評価・ベンチマークするためのフレームワークであるHarborを紹介します。 公式サイト: Harbor GitHub: harbor-framework/harbor: Harbor is a framework for running agent evaluations and creating and using RL environments. ※ 注意点として、同じAI関連のプロジェクトにav/harborという同名のツールがありますが、こちらはOllamaやOp…