ホーム jpn IBM、東南アジアの法学修士課程をテストし、ローカリゼーションの取り組みを促進

IBM、東南アジアの法学修士課程をテストし、ローカリゼーションの取り組みを促進

27
0


@ ディディエ・マルティ/ゲッティイメージズ

IBMはAIシンガポール(AISG)と契約を結び、同社の東南アジア大規模言語モデル(LLM)をテストし、開発者がカスタマイズされた人工知能(AI)アプリケーションを構築できるようにした。

この提携によりIBMは テスト東南アジアの言語をひとつのネットワークに ビッグブルーのAI技術とデータプラットフォームを使用した(SEA-LION)モデル、 ワトソン、そしてAISGと協力してLLMを微調整する。IBMとAISGは火曜日の共同声明で、その目標は組織がビジネス要件に適したAIモデルを選択できるようにすることだと述べた。

また: Google がローカライズされた大規模言語モデルの構築に向けた共同作業に参加

IBMはまた、デジタルセルフサービス共創体験と呼ばれるAIユースケースライブラリでSEA-LIONを利用可能にします(DSCE) により、開発者やデータ サイエンティストはローカライズされた生成 AI (GenAI) アプリケーションを構築できるようになります。

AISG が開発したオープンソース LLM である SEA-LION は、AISG によると、市場の他の LLM と比較して、より小型で、より柔軟で、より高速になるように設計されています。現在のバージョンは、30 億パラメータ モデルと 70 億パラメータ モデルの 2 つの基本モデルで実行されます。LLM のトレーニング データは、9,810 億の言語トークンで構成されています。AISG は、トークン化プロセス中にテキストを分解して作成された単語の断片としてこれを定義しています。これらの断片には、6,230 億の英語トークン、1,280 億の東南アジア トークン、910 億の中国語トークンが含まれます。

シンガポールはSEA-LIONを通じて、 東南アジアの法学修士課程をよりよく反映する 社会の混合と、地域の多様な文化や言語に対するより強い文脈的理解を示します。

AISGのAI製品担当シニアディレクター、レスリー・テオ氏は、この提携は東南アジア向けの、東南アジア人による「カスタムメイドの基盤モデル」を推進することを目指していると述べた。また、両組織は、SEA-LIONのユースケースを構築して導入を促進するとともに、組織が「AIを安全かつ責任を持って拡張」できるよう支援することも目指すとテオ氏は述べた。

このコラボレーションには、AI ガバナンスを SEA-LION に組み込む取り組みが含まれており、AI に関する政府の規制が進化し続ける中でも、企業はコンプライアンス、リスク管理、モデル ライフサイクル管理をより適切に行うことができます。

「[IBM] 「GenAIのさらなる進歩により、より小規模な言語モデルでより優れたパフォーマンスがもたらされ、ユーザーはビジネスや業界の要件に基づいてモデルをカスタマイズできるようになると考えています」とIBMアセアンのゼネラルマネージャー兼テクノロジーリーダーであるキャサリン・リアン氏は述べた。

また: ジェネレーティブAIは節約するよりも多くの作業を生み出す可能性がある

「企業にとって万能なモデルは存在せず、組織は自らのモデルを自由に選択できる権限を与えられる必要がある。 ニーズに基づいたモデル」とリアンは言った。[The] SEA-LION LLMは、オープンAIシステムの構築と、企業や政府がAIを活用する際に直面するASEAN言語の課題の解決に向けた大きな一歩です。」

AISGは3月にも次のことを発表した。 Googleとの提携により、トレーニングに使用するデータセットを強化東南アジア特有の言語で AI モデルを開発、微調整、評価します。この取り組みは「One Network Data における東南アジア言語プロジェクト」と呼ばれ、この地域向けに構築された LLM における「文化的コンテキスト認識の向上」を目指しています。

このプロジェクトは当初、インドネシア語、タイ語、タミル語、フィリピン語、ビルマ語に焦点を当て、AISGとGoogleはこれらの言語のトランスローカリゼーションと翻訳モデルを開発します。また、トランスローカリゼーション機能の拡張を支援するツールも構築します。 データセットのチューニングのベストプラクティス東南アジア言語向けの事前トレーニングガイドが公開されます。





もっとニュース

返事を書く

あなたのコメントを入力してください。
ここにあなたの名前を入力してください