<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
  <channel>
    <title>InfoQ - Microsoft</title>
    <link>https://www.infoq.com/jp</link>
    <description>InfoQ Microsoft フィード</description>
    <item>
      <title>MicrosoftがEvals for Agent Interopスターターキットをオープンソース化、エンタープライズAIエージェントのベンチマーク向け</title>
      <link>https://www.infoq.com/jp/news/2026/05/evals-agent-interop/?utm_campaign=infoq_content&amp;utm_source=infoq&amp;utm_medium=feed&amp;utm_term=Microsoft</link>
      <description>&lt;img src="https://www.infoq.com/styles/static/images/logo/logo_bigger.jpg"/&gt;&lt;p&gt;MicrosoftはEvals for Agent Interop、AIエージェントが現実的なデジタル業務シナリオにおいてどの程度相互運用できるかを評価するためのオープンソース・スターターキットを発表した。このキットは厳選されたシナリオ、代表的なデータセット、評価ハーネスを提供し、チームがメール、カレンダー、ドキュメント、コラボレーションツールなどの各種サーフェスにまたがってエージェントの評価を実行できるようにしている。この取り組みはエージェント型AIシステムがエンタープライズワークフローへと移行する中で、体系的かつ再現可能な評価への業界全体のシフトを反映している。&lt;/p&gt; &lt;i&gt;By Edin Kapić&lt;/i&gt; &lt;i&gt; Translated by Hiroaki.Sugimura&lt;/i&gt;</description>
      <category>.NET</category>
      <category>Agents</category>
      <category>Artificial Intelligence</category>
      <category>デベロップメント</category>
      <category>ニュース</category>
      <pubDate>Fri, 15 May 2026 02:30:00 GMT</pubDate>
      <guid>https://www.infoq.com/jp/news/2026/05/evals-agent-interop/?utm_campaign=infoq_content&amp;utm_source=infoq&amp;utm_medium=feed&amp;utm_term=Microsoft</guid>
      <dc:creator>Edin Kapić</dc:creator>
      <dc:date>2026-05-15T02:30:00Z</dc:date>
      <dc:identifier>/news/2026/05/evals-agent-interop/ja</dc:identifier>
    </item>
  </channel>
</rss>
