ホーム jpn OpenAI が新たにリリースした GPT-4o mini がチャットボットアリーナを席巻しています。その理由は次のとおりです。

OpenAI が新たにリリースした GPT-4o mini がチャットボットアリーナを席巻しています。その理由は次のとおりです。

から

7月 26, 2024

ヴェントリス/サイエンスフォトライブラリー/ゲッティイメージズ

1週間前、OpenAI GPT-4o miniをリリースその短い時間で、すでに更新されましたそして、大規模モデルシステム組織（LMSYS）チャットボットアリーナのリーダーボードで、次のような大手企業を上回りました。クロード 3.5 ソネットそしてジェミニアドバンス。

の LMSYS チャットボットアリーナは、ユーザーがモデル名を知らなくても、2 つの LLM と並んでチャットし、互いの応答を比較することで大規模言語モデル (LLM) を評価できるクラウドソーシングプラットフォームです。

また： GPT-4o mini を試してみませんか? よりスマートで安価な AI モデルにアクセスする 3 つの方法 – そのうち 2 つは無料です

GPT-4o miniは発表直後からアリーナに追加され、GPT-4oに次ぐリーダーボードのトップに躍り出ました。これは特にGPT-4o miniが 20倍安い前作よりも。

エキサイティングなチャットボットアリーナのアップデート – GPT-4o mini の結果が出ました!
4,000 人以上のユーザー投票により、GPT-4o mini がリーダーボードのトップに躍り出ました。現在、GPT-4o と並んで 1 位ですが、価格は 20 分の 1 です。Arena では、すべての面で初期バージョン (「upcoming-gpt-mini」) よりも大幅に優れています。… pic.twitter.com/xanm2Bqtg9

— lmsys.org (@lmsysorg) 2024年7月23日

結果が明らかになると、一部のユーザーはソーシャルメディアこのような新しいミニモデルが、Claude 3.5 Sonnet などのより確立された堅牢で有能なモデルよりも上位にランクされる理由について懸念を表明しました。この懸念に対処するために、LMSYS は X に投稿し、GPT-4o mini が高い順位にランクされた要因を説明し、Chatbot Arena の順位は投票に応じた人間の好みによって決まることを強調しました。

エキサイティングなチャットボットアリーナのアップデート – GPT-4o mini の結果が出ました!
4,000 人以上のユーザー投票により、GPT-4o mini がリーダーボードのトップに躍り出ました。現在、GPT-4o と並んで 1 位ですが、価格は 20 分の 1 です。Arena では、すべての面で初期バージョン (「upcoming-gpt-mini」) よりも大幅に優れています。… pic.twitter.com/xanm2Bqtg9

— lmsys.org (@lmsysorg) 2024年7月23日

どのモデルがより効果的かを知りたいユーザーに対して、LMSYS は、技術的な機能を理解するためにカテゴリごとの内訳を確認することを推奨しています。これには、「全体」と表示されているカテゴリドロップダウンをクリックし、別のカテゴリを選択することでアクセスできます。コーディング、ハードプロンプト、長いクエリなど、さまざまなカテゴリの内訳を確認すると、結果に違いが見られます。

また： OpenAI が SearchGPT をリリース – その機能とアクセス方法をご紹介します

コーディング部門では、GPT-4o miniはGPT-4oと1位のClaude 3.5 Sonnetに次いで3位にランクされています。ただし、マルチターン、2ターン以上の会話、500トークン以上の長いクエリなど、他の部門ではGPT-4o miniが1位です。

Chatbot Arena の「コーディング」カテゴリの結果。

スクリーンショット：サブリナ・オルティス/ZDNET

GPT-4o miniを試してみたい方は、チャットGPT サイトにアクセスしてOpenAIアカウントにログインしてください。チャットボットアリーナに参加してGPT-4o miniを運よく手に入れたい場合は、 Webサイトをクリックし、Arena を並べてクリックして、サンプルプロンプトを入力します。

もっとニュース

OpenAI が新たにリリースした GPT-4o mini がチャットボットアリーナを席巻しています。その理由は次のとおりです。

返事を書く返事をキャンセル

YouTubeの搾乳動画が数百万回再生され、倫理的な懸念が高まる

ジャパンタイムズ、「EXPAT EXPO TOKYO 2024」へメディアパートナーとして参加 – The Japan Times

FBI、中国の第2のハッキンググループを壊滅させたと長官が発表

記録的な降雨により4大陸で大洪水が発生

連銀の不確実な方向性が債券市場を悩ませている

台湾、ヒズボラのポケベル爆発に「大きな注目」

レバノンの爆発事件で使われたトランシーバーは10年前に廃止された

東京メトロの保守子会社が輪軸データを改ざん

マイクロソフト幹部、米選挙最終日に介入を警告

中国の「専業パパ」が家父長制の規範に挑戦

サムスンはHBMチップに関するNVIDIAのテストに合格していないことを否定

返事を書く 返事をキャンセル

返事を書く返事をキャンセル