ホーム jpn OpenAI が新たにリリースした GPT-4o mini がチャットボットアリーナを席巻しています。その理由は次のとおりです。

OpenAI が新たにリリースした GPT-4o mini がチャットボットアリーナを席巻しています。その理由は次のとおりです。

から

7月 26, 2024

ヴェントリス/サイエンスフォトライブラリー/ゲッティイメージズ

1週間前、OpenAI GPT-4o miniをリリースその短い時間で、すでに更新されましたそして、大規模モデルシステム組織（LMSYS）チャットボットアリーナのリーダーボードで、次のような大手企業を上回りました。クロード 3.5 ソネットそしてジェミニアドバンス。

の LMSYS チャットボットアリーナは、ユーザーがモデル名を知らなくても、2 つの LLM と並んでチャットし、互いの応答を比較することで大規模言語モデル (LLM) を評価できるクラウドソーシングプラットフォームです。

また： GPT-4o mini を試してみませんか? よりスマートで安価な AI モデルにアクセスする 3 つの方法 – そのうち 2 つは無料です

GPT-4o miniは発表直後からアリーナに追加され、GPT-4oに次ぐリーダーボードのトップに躍り出ました。これは特にGPT-4o miniが 20倍安い前作よりも。

エキサイティングなチャットボットアリーナのアップデート – GPT-4o mini の結果が出ました!
4,000 人以上のユーザー投票により、GPT-4o mini がリーダーボードのトップに躍り出ました。現在、GPT-4o と並んで 1 位ですが、価格は 20 分の 1 です。Arena では、すべての面で初期バージョン (「upcoming-gpt-mini」) よりも大幅に優れています。… pic.twitter.com/xanm2Bqtg9

— lmsys.org (@lmsysorg) 2024年7月23日

結果が明らかになると、一部のユーザーはソーシャルメディアこのような新しいミニモデルが、Claude 3.5 Sonnet などのより確立された堅牢で有能なモデルよりも上位にランクされる理由について懸念を表明しました。この懸念に対処するために、LMSYS は X に投稿し、GPT-4o mini が高い順位にランクされた要因を説明し、Chatbot Arena の順位は投票に応じた人間の好みによって決まることを強調しました。

エキサイティングなチャットボットアリーナのアップデート – GPT-4o mini の結果が出ました!
4,000 人以上のユーザー投票により、GPT-4o mini がリーダーボードのトップに躍り出ました。現在、GPT-4o と並んで 1 位ですが、価格は 20 分の 1 です。Arena では、すべての面で初期バージョン (「upcoming-gpt-mini」) よりも大幅に優れています。… pic.twitter.com/xanm2Bqtg9

— lmsys.org (@lmsysorg) 2024年7月23日

どのモデルがより効果的かを知りたいユーザーに対して、LMSYS は、技術的な機能を理解するためにカテゴリごとの内訳を確認することを推奨しています。これには、「全体」と表示されているカテゴリドロップダウンをクリックし、別のカテゴリを選択することでアクセスできます。コーディング、ハードプロンプト、長いクエリなど、さまざまなカテゴリの内訳を確認すると、結果に違いが見られます。

また： OpenAI が SearchGPT をリリース – その機能とアクセス方法をご紹介します

コーディング部門では、GPT-4o miniはGPT-4oと1位のClaude 3.5 Sonnetに次いで3位にランクされています。ただし、マルチターン、2ターン以上の会話、500トークン以上の長いクエリなど、他の部門ではGPT-4o miniが1位です。

Chatbot Arena の「コーディング」カテゴリの結果。

スクリーンショット：サブリナ・オルティス/ZDNET

GPT-4o miniを試してみたい方は、チャットGPT サイトにアクセスしてOpenAIアカウントにログインしてください。チャットボットアリーナに参加してGPT-4o miniを運よく手に入れたい場合は、 Webサイトをクリックし、Arena を並べてクリックして、サンプルプロンプトを入力します。

もっとニュース

OpenAI が新たにリリースした GPT-4o mini がチャットボットアリーナを席巻しています。その理由は次のとおりです。

返事を書く返事をキャンセル

東京の公園で10代のギャングがエアガンで少年を襲う

若隆景、秋のリーダー小野里に初黒星

U-NEXTがハリー・ポッターの独占権を獲得

兵庫県議会、いじめ問題で知事不信任決議案を可決

新しいプロジェクションマッピングがシンデレラ城を彩る

中国深センで男に刺され日本人少年死亡

東北新幹線時速315キロで突然脱線

次回のASEAN首脳会議に日本首相が欠席する可能性は中国に有利か

日本のビジネス団体、中国政府に国民の安全確保を要請

伊豆・スミス島に噴火警報

ハッカーがデルの顧客データを2度盗んだと主張。身を守る方法はこちら

返事を書く 返事をキャンセル

返事を書く返事をキャンセル