コーディングに特化した生成AIツール
米IT大手メタ社(旧フェイスブック)は24日、ソフトウェアのコードを生成する人工知能(AI)ツール「Code Llama」(コード・ラマ)をリリースした。Code Llamaは同社開発の大規模言語モデル(LLM)「Llama 2」上に構築されており、Llama 2同様、オープンソースで公開され、研究及び商用利用は無料となっている。
Code Llamaは、Llama 2のコーディングに特化したバージョンで、コードに特化したデータセットでLlama 2を強化訓練し作成された。Python、C++、Java、PHP、Typescript(Javascript)、C#、Bashなど、現在使用されている最も一般的なプログラミング言語をサポートしている。
Code Llamaのコーディング機能では、コードと自然言語のプロンプトの両方から、コード及びコードに関する自然言語を生成することが可能。
Code Llamaには、基本的なコードモデルと、Pythonに特化したモデル、そして自然言語の指示を理解するために微調整された三つのバリエーションが用意されている。また、それぞれ異なる目的やレイテンシ(反応時間)に対応した三つのサイズ(7B、13B、34B)があり、例えば7Bモデルは単一のGPUで処理が可能だという。
メタ社は、独自に行った性能テストで、Code Llamaがコーディング作業のパフォーマンスにおいて「一般公開されている最先端のLLMモデルを凌いだ」と述べている。
オープンソース化で競合他社を制すか
メタ社は、生成AI領域は急速に進化しており、「革新的で安全かつ責任ある新たなAIツールの開発には、オープンなアプローチが最適だ」と主張している。
同社は7月、この主張通り、大規模言語モデル(LLM)「Llama 2」の商用バージョンをオープンソース化し、無償で提供を開始した。LLMは人気チャットボットChatGPTなどの生成AIの基盤となる技術だ。
マーク・ザッカーバーグCEOは、「オープンソース化することで、より多くの開発者が新しい技術を利用できるようになるため、イノベーションが促進される」と語っている。メタ社は生成AI技術に多額の投資を行っており、生成AIに特化した新しい製品グループを設立している。
今回、コーディングに特化したオープンソースのCode Llamaがリリースされたことによって、ソフトウェア開発者の生成AI技術利用のハードルが下がると考えられる。GitHubのCo-Pilot(ChatGPT技術で構築)などの専用コーディングソフトは存在するが、その使用コストは万人向きだとは言えなかった。
メタ社によるLLMオープンソース化により、OpenAIやGoogle、マイクロソフトなど生成AI分野に力を入れている競合他社の製品を購入することなく、研究者や開発者、一般企業がチャットボットを構築したり、AIコーディングツールを使用することが可能になる。
メタ社は、Code Llamaには、開発者のワークフローを効率化するだけでなく、コード初心者の参入障壁を下げる可能性もあると指摘。生産性向上ツールや教育ツールとしての利用を見込んでいるようだ。