<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
  <channel>
    <title>InfoQ - アーキテクチャ評価 - ニュース</title>
    <link>https://www.infoq.com/jp</link>
    <description>InfoQ アーキテクチャ評価 ニュース フィード</description>
    <item>
      <title>Google Stax、AIモデル評価を開発者向けによりアクセシブルに</title>
      <link>https://www.infoq.com/jp/news/2025/11/google-stax-ai-evaluation/?utm_campaign=infoq_content&amp;utm_source=infoq&amp;utm_medium=feed&amp;utm_term=%E3%82%A2%E3%83%BC%E3%82%AD%E3%83%86%E3%82%AF%E3%83%81%E3%83%A3%E8%A9%95%E4%BE%A1-news</link>
      <description>&lt;img src="https://www.infoq.com/styles/static/images/logo/logo_bigger.jpg"/&gt;&lt;p&gt;Google StaxはAIモデルの主観的評価を、客観的かつデータ駆動型で再現可能なプロセスに置換えるためにデザインされたフレームワークだ。Googleは汎用ベンチマークに頼るのではなく、AI開発者は彼らの特定ユースケースに合わせて評価プロセスをテーラリングできるようになると言っている。&lt;/p&gt; &lt;i&gt;By Sergio De Simone&lt;/i&gt; &lt;i&gt; Translated by Hiroaki.Sugimura&lt;/i&gt;</description>
      <category>Google</category>
      <category>大規模言語モデル</category>
      <category>アーキテクチャ評価</category>
      <category>AIと機械学習、データエンジニアリング</category>
      <category>デベロップメント</category>
      <category>ニュース</category>
      <pubDate>Fri, 28 Nov 2025 08:30:00 GMT</pubDate>
      <guid>https://www.infoq.com/jp/news/2025/11/google-stax-ai-evaluation/?utm_campaign=infoq_content&amp;utm_source=infoq&amp;utm_medium=feed&amp;utm_term=%E3%82%A2%E3%83%BC%E3%82%AD%E3%83%86%E3%82%AF%E3%83%81%E3%83%A3%E8%A9%95%E4%BE%A1-news</guid>
      <dc:creator>Sergio De Simone</dc:creator>
      <dc:date>2025-11-28T08:30:00Z</dc:date>
      <dc:identifier>/news/2025/11/google-stax-ai-evaluation/ja</dc:identifier>
    </item>
  </channel>
</rss>
