Stability AI社から新たな大規模言語モデル(LLM)FreeWilly1, FreeWilly2が公開されましたよ!
【FreeWilly】Stability AIが独自LLMを公開 商用利用は?
Stability AIとCarperAIラボが、それぞれ「FreeWilly1」および「FreeWilly2」と名付けた新しいLLMを7月21日に公開しました。
これらのモデルは、メタ(Meta)が開発したオープンソースのLLM、「Llama」と「Llama 2」を基に作り上げられました。
ただし、Llama 2は商用利用可能ですが、FreeWilly1、FreeWilly2共に非商用ライセンスとなっている。
つまり、商用利用は出来ない様ですね
ただ、軽量で高性能なLLMが非商用利用に対応していることは、資金面で限定されている研究者にとって非常に大きな利点となりそうです
FreeWillyの存在は、まさにAI研究の新たなる一歩を踏み出すためのバネとなるでしょう。
ChatGPT-3.5との比較
「FreeWilly1」は元々の「LLaMA 65B」基盤モデルを活用し、新たに生成された合成データセットをAlpaca形式のSFT(教師あり微調整)を用いて微調整しました。
同様に、「FreeWilly2」は「LLaMA 2 70B」基盤モデルを活用し、一部のタスクではGPT-3.5と比較して好ましいパフォーマンスを達成しています
これらのモデルは、マイクロソフトの「Orca Method」を使用した訓練が行われています。
この方法は、大きな言語モデル(この場合GPT-4)の推論プロセスを小さなモデルが学習することで、モデルの能力とスキルを向上させるものです
あなたがコンピューターに新しいスキルを教えるとき、たくさんの例を使ってそのスキルを学ばせること(学習)が一般的です
これをデータセットと呼びます。
たとえば、英語を教えるためには、たくさんの英語の文章や単語を示す必要があります。
しかし、最近開発された「Orca Method」という新しい学習方法では、少ない例でもコンピューターに新しいことを教えることができます。
これはちょっと、あなたが良い先生から少しだけ勉強しただけで、それでもたくさんの新しいことを学べるようなものです。
その方法を使って、新しいAIシリーズ「FreeWilly」が訓練されました。
その訓練に使ったデータセットは通常の10分の1、つまり60万点だけでした。
それでも、「FreeWilly」は様々なテストで素晴らしい結果を出しました。
例えば、物語の続きをうまく予測できるAIはどれかを競う「HellaSwag」なんて評価方法もあります。
そこでは、新しく出てきた「FreeWilly2」がとても良い成績を収めていて、ChatGPTよりも上手く物語の続きを予測することができました。ChatGPTよりも高いスコア)
また、「AGIEval」というベンチマークテストでは、AIの論理的推論能力が評価され、それでも「FreeWilly」はChatGPTを上回りました。
Hugging Faceのランキングを見ると、FreeWilly、FreeWilly2共に多くの指標でLlaMA 2のスコアも上回っていることがわかります
それだけでなく、「FreeWilly1」と「FreeWilly2」は、LlaMA 2という別のAIよりも、さまざまな評価項目で優れた成績を出しています。
- LogiQA 論理的推論による機械読解理解
- LSAT 米国法学部への進学を目指す学生が受ける試験
- SAT アメリカの大学に進学するための共通試験
以上の評価方法で、論理的な推論をしたり、法律や大学進学に関する問題を解いたりする能力を見せています。
ただし、「FreeWilly」は、数学のテストではChatGPTよりもスコアが低かったということも付け加えておきます。
数学のテストに関してはまだ成績がイマイチで、そこは改善が必要だと言えるでしょう。
つまり、これらのAIは物語を予測したり、論理的な問題を解くのは得意でも、数学はあまり得意じゃないということですね。
すべての科目で「FreeWilly」が最高というわけではありません。
AIや機械学習の世界には「Hugging Face」というグループがいて、彼らはAIの能力を評価するためのランキング表「Open LLM Leaderboard」を作っています。
これは、AIがどれだけ上手く仕事ができるかを評価する一種の競争表です。
ChatGPTのリリース以降、大規模言語モデル(LLM)の公開への発表が多くされていますね
Google Bard、MetaのLlama2, Stability AIのFreeWilly、そして一般公開は未定のApple社の通称AppleGPTが続々と開発の事実が明らかになっていますね
日本の企業も、日本に特化した大規模言語モデル(LLM)の発表もあります。
はやり海外の大規模言語モデル(LLM)は、孤立した起源が謎に満ちている日本語では翻訳が微妙ですしセキュリティを考えると、独自の国産言語モデルがあるといいですよね
ほかのAIツールもまとめているのだ
- tableDiffusion WebUIをローカル環境で使う設定のやり方
- iPhoneにAppleGPT搭載?ChatGPTのような大規模言語モデル開発
- 【FreeWilly】Stability AIが独自LLM
- 【ChatGPTが開く世界】生成AIが学歴を不問にし
- 【Creative Reality Studio】 AI技術で人の静止画からアバターが話す動画を生成
StableDiffusion WebUI v1.6.0(随時更新リサーチ中)
- StableDiffusion WebUIバージョン1.6.0リリース速報まとめ
- 【SDXL1.0のVAE】StableDiffusion WebUI v1.6.0 導入&設定方法
- StableDiffusion WebUI ver1.6.0「VAE」切り替えを便利なインターフェイス
StableDiffusion webUI基本設定
- StableDiffusion WebUIをローカル環境で使う設定のやり方♪
- StableDiffusion WebUIバージョンアップ方法。更新手順や注意点
- StableDiffusion WebUIバージョンの確認方法
- 【操作画面の解説・txt2img】分かりやすくパラメータの使い方を説明
- 【画像生成AIイラスト】VAEインストール方法と便利な使い方
- 「VAE」かんたんに切り替えするインターフェイス
- 【日本語化】StableDiffusionWebUI インターフェイス設定方法。
- 大きく、キレイな画像を出力する方法Hires.fix使い方。解像度アップ!
- 操作画面の5つのボタン解説
- 【X/Y/Z plot】使い方。プロンプトや設定を調整し比較してみよう!
- 【img2imgインペイント】画像生成AIイラストを修正/inpaintのパラメータ
- 【学習モデルの追加と変更】かんたん切り替え
- StableDiffusion WebUIバージョン1.3。LoRAを使う方法
- 【まとめ】画質が悪いを改善する7つの機能の使い方!
【学習モデル・checkpoint】
- 【実写系学習モデル・3選】写真の様なリアルな美少女が作れるモデルまとめ
- 【BracingEvoMix】日本人風の顔に特化した最新学習モデル
- 【BeautifulRealisticAsiansV5通称BRAV5】
プロンプト
- Stable Diffusionプロンプト(呪文)に関しての書き方。
- 【画質を上げる・画質に美しく芸術性を持たすプロンプト】呪文の書き方
- 【Tag complete】プロンプトのコツを掴める入力補助機能。
【ControlNet】
- 【ControlNet】使い方とインストール方法。画像生成AIイラストに便利な神機能。
- 【ControlNet-V1.1206】最新バージョンアップデート&モデル更新方法。
- 【ControlNet】不具合?表示されない…反映されない時には?
- 骨(棒人間)を使い、思い通りの姿勢をとらせた方法。
- 原画の絵と同じ姿勢(ポーズ)のAIイラスト生成のやり方♪
- AIイラストから線画を抽出する方法♪
- AIイラストを手描きで修正し、生成するやり方♪
- 【ControlNet】自作の線画イラストを画像生成AIに色塗り(ペイント)させる方法
- 自作の線画イラストをAIイラストに色塗り(ペイント)させる方法♪
【その他 拡張機能について】
- 【Eagle-pnginfo】画像やプロンプトを自動で一括管理できる拡張機能
- 【eagle】画像管理おすすめアプリ使い方
- 【eagle】公式サイト
- 【EasyNegative v2】導入&使い方♪設定方法
- 【EasyNegative V2】反映されないときには?原因と対処方法
- 【EasyNegative V2】【LoRA】にサムネイルを付ける方法
- 【LoRA】画像生成AIの追加学習データの使い方。
- 【Dynamic Prompts】ダウンロードとインストールの設定方法と特殊構文の使い方