カリフォルニア大学バークレー校の研究者がゴリラを紹介: 微調整された LLaMA

ブログ

ホームページホームページ / ブログ / カリフォルニア大学バークレー校の研究者がゴリラを紹介: 微調整された LLaMA

Jul 08, 2023

カリフォルニア大学バークレー校の研究者がゴリラを紹介: 微調整された LLaMA

I recenti progressi nel campo dell’intelligenza artificiale includono

人工知能の分野における最近の進歩は、大規模言語モデル (LLM) の導入です。 これらのモデルにより、言語をより簡潔に理解できるようになり、自然言語処理 (NLP) と自然言語理解 (NLU) を最大限に活用できるようになります。 これらのモデルは、テキストの要約、質問応答、コンテンツ生成、言語翻訳など、他のすべてのタスクで良好にパフォーマンスを発揮しています。 彼らは、推論や論理を含む複雑なテキストのプロンプトを理解し、そのデータ間のパターンと関係を特定します。

言語モデルは驚異的なパフォーマンスを示し、さまざまなタスクでの能力を実証することで最近大幅に発展しましたが、API 呼び出しを介してツールを効率的に使用することは依然として困難です。 GPT-4 のような有名な LLM でさえ、正確な入力引数を生成するのに苦労しており、不適切な API 呼び出しを推奨することがよくあります。 この問題に対処するために、バークレー校と Microsoft Research の研究者は、API 呼び出しの生成に関して GPT-4 を上回る、微調整された LLaMA ベースのモデルである Gorilla を提案しました。 Gorilla は、適切な API の選択を支援し、LLM が外部ツールと連携して特定のアクティビティを実行する能力を向上させます。

研究者チームは、重複する機能を持つ API の大規模なコーパスで構成される APIBench データセットも作成しました。 このデータセットは、ML API 用の TorchHub、TensorHub、HuggingFace などのパブリック モデル ハブを収集して作成されました。 TorchHub と TensorHub からのすべての API リクエストが API ごとに含まれており、タスク カテゴリごとに HuggingFace から上位 20 モデルが選択されます。 さらに、自己指示メソッドを使用して、API ごとに 10 個の架空のユーザー クエリ プロンプトを生成します。

この APIBench データセットとドキュメント検索を使用して、研究者は Gorilla を微調整しました。 Gorilla の 70 億パラメータ モデルは、API 機能の正確性の点で GPT-4 を上回り、幻覚ミスが減少します。 ドキュメント取得ツールとゴリラとの効果的な統合は、LLM がツールをより正確に使用できる可能性を示しています。 Gorilla の改良された API 呼び出し生成機能と、必要に応じてドキュメントを変更する機能により、モデルの結果の適用性と信頼性が向上します。 この開発は、LLM が定期的に更新されるドキュメントを常に把握できるようになり、より正確で最新の情報をユーザーに提供できるため重要です。

研究者が共有した例の 1 つは、Gorilla がどのようにタスクを正しく認識し、完全に適格な API 結果を提供するかを示しています。 モデルによって生成された API 呼び出しでは、GPT-4 が仮説モデルに対する API リクエストを生成していることが示されており、タスクの理解が不足していることがわかります。 クロードは間違ったライブラリを選択し、適切なリソースを認識する能力が欠如していることを示しました。 対照的に、ゴリラはタスクを正しく認識しました。 したがって、Gorilla は API 呼び出しの作成が正確であり、パフォーマンスとタスクの理解力の向上を実証しているため、GPT-4 や Claude とは異なります。

結論として、Gorilla は API 呼び出しの作成の問題にも対処しているため、言語モデルのリストに大幅に追加されています。 その機能により、幻覚と信頼性に関連する問題を軽減できます。

をチェックしてください論文、Github リンク、 そしてプロジェクトページ。忘れずに参加してください22,000 以上の ML SubRedditDiscordチャンネル、 そしてメールニュースレターでは、最新の AI 研究ニュースやクールな AI プロジェクトなどを共有します。 上記の記事に関してご質問がある場合、または何か見逃した場合は、お気軽にメールでお問い合わせください。[email protected]

🚀 AI Tools Club で 100 年代の AI ツールをチェックしてください

Tanya Malhotra は、デラドゥンの石油エネルギー研究大学の最終学年で、人工知能と機械学習を専門とするコンピューター サイエンス エンジニアリングの学士号を取得しています。彼女は、優れた分析的思考と批判的思考を備えたデータ サイエンスの愛好家であり、新しいスキルの習得、グループの指導、組織的な方法での仕事の管理に強い関心を持っています。

論文、Github リンク プロジェクト ページ。 22,000 以上の ML SubReddit Discord チャンネルの電子メール ニュースレター [email protected] 🚀 AI Tools Club で 100 の AI ツールをチェックしてください