ホーム jpn ジェネレーティブAIの最大の課題はROIを示すことです – その理由はここにあります

ジェネレーティブAIの最大の課題はROIを示すことです – その理由はここにあります

8
0


ロビー・グッドール/ゲッティイメージズ

経営幹部や管理者は、生成型人工知能 (AI) や大規模言語モデル (LLM) を手元の業務に適用する方法に興奮しているかもしれませんが、一歩下がって、ビジネスへの利益をどこでどのように実現できるかを検討すべき時が来ています。これは依然として混乱し、誤解されている領域であり、過去の技術の波とはほとんど似ていないアプローチとスキルセットが必要です。

また: AIの雇用への影響:労働者の86%が失業を恐れているが、朗報もある

課題は、AIはしばしば非常に目を見張るような概念実証を提供するが、それを収益化するのは難しいと、 スティーブ・ジョーンズキャップジェミニのエグゼクティブ VP である彼は、最近サンフランシスコで開催された Databricks カンファレンスでのプレゼンテーションで次のように述べています。「20、30、40 の GenAI ソリューションを実稼働させる上で、ROI を証明することが最大の課題です。」

必要な投資には、実稼働中の LLM のテストと監視が含まれます。特にテストは、LLM を正確かつ順調に保つために不可欠です。「これらのモデルをテストするには、少し悪意のあることをする必要があります」と Jones 氏はアドバイスしています。たとえば、テスト段階では、開発者、設計者、または QA エキスパートが意図的に LLM に「毒を盛って」、誤った情報をどれだけうまく処理できるかを確認する必要があります。

否定的な出力をテストするために、ジョーンズ氏は、ある企業が「長距離輸送にドラゴンを使用している」というビジネス モデルをプロンプトした例を挙げました。モデルは肯定的に応答しました。次に、ジョーンズ氏はモデルに長距離輸送に関する情報をプロンプトしました。

「その答えは、『長距離輸送の仕事に必要なことはこれです。すでにおっしゃったように、ドラゴンを相手に広範囲に働くことになるので、広範囲にわたる消防および安全訓練を受ける必要があります』と書いてありました」とジョーンズ氏は語った。「また、ドラゴンの仕事にはお姫様を相手に働くことが含まれるため、お姫様に対するエチケット訓練も必要です。そして、輸送や倉庫保管に関する標準的な一連の作業は、残りの解決策からは除外されていました」

また: AIトレーナーから倫理学者まで:AIは一部の仕事を廃止するかもしれないが、新しい仕事を生み出すかもしれない

ジョーンズ氏はさらに、ポイントは、生成 AI は「既存のアプリケーションに技術を不適切に追加し、適切に行っているように見せかけることがかつてないほど容易になった技術である」と続けた。「生成 AI は、アプリケーションにちょっとした機能を追加するだけの驚異的な技術だが、生産時のセキュリティとリスクの観点からは本当にひどい」
ジェネレーティブ AI が主流の採用の一部となるまでには、あと 2 ~ 5 年かかるでしょう。これは他のテクノロジーに比べると早いペースです。「課題は、いかにして追いつくかです」とジョーンズ氏は語ります。現時点では 2 つのシナリオが提案されています。「1 つ目は、1 つの巨大なモデルがすべての情報を把握し、問題が起こらないというものです。これは、楽観的すぎて実現しないという理論として知られています。」

ジョーンズ氏は、「あらゆるベンダー、あらゆるソフトウェア プラットフォーム、あらゆるクラウドが、この市場に参加するために、精力的に、そして積極的に競争することになるでしょう」と語る。「つまり、非常に多くの競争と、非常に多くのバリエーションが生まれるということです。マルチクラウド インフラストラクチャとそのサポートについて心配する必要はありませんが、ガードレールのようなものについて考える必要があります。」

また: 3 分の 1 のマーケティング チームがワークフローに AI を導入しています

ジョーンズ氏は、もう 1 つのリスクは、住所照合など、はるかに少ないパワーと分析を必要とするタスクに LLM を適用することだと述べている。「すべてのタスクに 1 つの大きなモデルを使用すると、基本的にお金を無駄にしているだけです。弁護士のところに行って、『誕生日カードを書いてほしい』と言うのと同じです。弁護士はカードを作ってくれますが、弁護士料金を請求されます。」

重要なのは、LLM をより安価かつ効率的に活用する方法を常に模索することだと、同氏は強調した。「何か問題が発生した場合、ソリューションを運用開始するのと同じくらい迅速に、ソリューションを廃止できるようにする必要があります。また、そのソリューションに関連するすべての成果物が、モデルに合わせて運用開始されていることを確認する必要があります。」

単一のモデルを展開するということはあり得ません。AIユーザーは、パフォーマンスと応答の品質を測定するために、複数のモデルに対してクエリを適用する必要があります。「さまざまなモデルに対してクエリを再生するために、すべての指標をキャプチャするための共通の方法が必要です」とジョーンズ氏は続けます。「 GPT-4 ターボ同じクエリが、 ラマクエリと応答を再生してパフォーマンス メトリックを比較するメカニズムを用意して、より安価な方法で実行できるかどうかを把握できるようにする必要があります。これらのモデルは常に更新されるためです。」

また: ChatGPT と ChatGPT Plus: 有料サブスクリプションはまだ価値がありますか?

ジェネレーティブ AI は「通常の方法では失敗しません」と同氏は付け加えた。「GenAI では、請求書を発行すると、『すばらしい。アンドリュー・ジャクソン大統領に関する 4,000 ワードのエッセイをお送りします。あなたが言いたかったのはこれだと判断したからです』と表示されます。それを防ぐためのガードレールが必要です。」





もっとニュース

返事を書く

あなたのコメントを入力してください。
ここにあなたの名前を入力してください