小規模言語モデル「SLM」とは？代表モデル一覧やLLMとの違いを徹底解説

「LLMとSLMの違いは？」「SLMを導入するメリットはある？」と疑問に思っている方も多いのではないでしょうか。

SLMは、LLMと比べてパラメータ数が少なく動作が軽量なため、エッジデバイスやオンプレミス環境でも運用できる点が魅力です。コストを抑えつつ、必要な範囲でAIの導入を実現できる手段として、各業界で活用が広がっています。

本記事では、SLMの概要やLLMとの違い、導入するメリットに加えて、代表的なモデル10選を詳しくご紹介します。

どのような企業や用途に適しているかもあわせて解説しますので、ぜひ最後までご覧ください。

小規模言語モデル「SLM」とは

小規模言語モデル（SLM）とは、大規模言語モデル（LLM）に比べてパラメータ数が少なく、軽量かつ効率的に動作するAIモデルです。

LLMのパラメータが数百億〜数兆に達するのに対し、SLMは数百万〜数十億程度で構成され、必要な計算資源やメモリが少ないのが特徴です。

この特性により、SLMはスマートフォンやIoT機器などのエッジデバイス、オフライン環境でも活用しやすく、リアルタイム性やプライバシー保護の面でもメリットがあります。

また、多くのSLMはTransformerアーキテクチャをベースにしており、自然言語を理解・処理・生成する機能を搭載しています。

LLMと比較すると、SLMでは汎用性が限定される傾向があるものの、設計次第では高い汎用性を持つSLMも存在しており、特定の業務や用途に特化させやすく、導入や運用のコストを抑えられる点が強みです。

近年は企業や自治体、開発現場でも導入が進んでいます。

LLMとの違い

SLMとLLMは、どちらも自然言語処理を行うAIモデルですが、規模や用途、コストなどの違いがあります。

項目	SLM（小規模言語モデル）	LLM（大規模言語モデル）
パラメーター数	数億～数十億	数百億～数兆
学習データの量	比較的少量であり、特定分野やタスクに特化	インターネット上の膨大なデータを学習
汎用性	特定分野・タスクに特化しているため、汎用性は低い	幅広い知識と応用力を持ち、汎用性が高い
導入コスト	低コスト	高コスト

SLMは軽量で特定用途に最適化されたモデルであるため、導入・運用コストを抑えたい企業や、限られたリソースでAIを活用したい場合に適しています。

一方、LLMは圧倒的な知識量と汎用性を武器に、複雑かつ幅広いタスクをこなせますが、開発や運用にはコストと時間がかかります。

目的や利用環境に応じて、SLMとLLMを適切に使い分けましょう。

SLMを導入するメリット

SLMを導入するメリットはさまざまですが、ここでは主に以下3つのメリットを紹介します。自社が求める条件に適しているか確認してください。

低コストで導入ができる
自社データに合わせてカスタマイズしやすい
処理が速く、レスポンスが良い

低コストで導入ができる

SLMの魅力は、導入・運用コストが比較的安いという点です。

大規模言語モデル（LLM）の場合、数百億〜数兆のパラメータを持つため、学習や推論に高性能なGPUサーバーや専用クラウドサービスが必要となり、初期投資や月額費用が高額になりがちです。

また、APIの利用料も1回あたり数円〜数十円単位で積み重なり、使用頻度が増えるほどコストが膨らみます。

一方でSLMは、パラメータ数が数億〜数十億程度と軽量であり、一般的なPCやエッジデバイスでも運用可能です。

特にオンプレミスでの利用であれば、クラウド利用料がかからないため、長期的に見て費用対効果が高いといえます。

また、SLMはオープンソースで公開されているモデルも多く、取得費用が無料、もしくは非常に安価な場合もあります。

SLMは、特定の業務や分野に特化したAIモデルを低コストで構築できるため、例えば中小企業の業務効率化や、地方自治体の住民サービス向上、個人開発者のプロジェクト推進など、幅広い場面での活用が期待されています。

自社データに合わせてカスタマイズしやすい

SLMは、自社の業務データやニーズに応じて柔軟にカスタマイズしやすいというメリットがあります。

大規模言語モデルはパラメータ数が多すぎるため、少量のデータで特定分野に特化させるには、多くのコストが必要であり、技術的なハードルも高くなります。

一方、SLMはモデルサイズが小さいため、短時間・少量の学習データでも効果的に学習が進みます。

たとえば、社内に蓄積されたFAQやマニュアルを使えば、自社専用のチャットボットやナレッジベース支援AIの構築が可能です。

また、SLMはオンプレミス環境でもファインチューニングが行えるため、クラウドにデータを送信することなく、自社の機密情報を安全に使った学習ができます。

外部への情報漏洩を避けたい企業にとって、安心材料となるでしょう。

処理が速く、レスポンスが良い

SLMの強みは、高速な処理能力と優れた応答速度です。LLMは処理に膨大なリソースを必要とするため、クラウド経由で利用する場合が多く、通信やAPIレスポンスの遅延が発生することもあります。

リアルタイム性が求められる業務においては、ラグが致命的なデメリットになる可能性もあります。

対してSLMは、モデル自体が軽量であるため、ローカル環境でも高速処理ができ、即時応答が可能です。

たとえば、社内ヘルプデスクにおけるリアルタイム応答、工場現場でのエラー内容の即時アシストなど、スピードが重要な現場では特に有効です。

エッジデバイス上での動作も想定されているため、インターネット接続が不安定な環境でも安定した応答が可能で、クラウド接続不要＝ネットワーク依存を解消できます。

通信遅延が生じないということは、ユーザー体験の向上にもつながります。

SLMの代表モデル10選

ここからはSLMの代表モデルを10個紹介します。（2025/6/4時点掲載）

モデル	価格	汎用性	おすすめの企業
GPT-4.1 mini	入力：$0.40/百万トークン出力：$1.60/百万トークン	テキスト・画像入力、大規模コンテキスト対応、汎用性高い	広範なAI活用を目指す企業、スタートアップ
Orca 2	無料	推論・コモンセンス・数学・要約など、多様なタスクで高精度	企業向けコスト効率重視の企業
Phi-4	無料	高品質合成データ活用、STEM・推論タスクに強い、16kトークン対応	研究・開発型企業、教育・医療分野
Mistral Small 3.1	無料	マルチモーダル・多言語・長文対応、高速推論	多言語・長文処理重視のグローバル企業
Gemma	無料	Google Cloud連携、多言語対応、軽量・高速	クラウド利用・多言語対応重視企業
OpenELM	無料	Appleデバイス最適化、効率的なパラメータ割り当て、高精度	Appleエコシステムを活用する企業
TinySwallow-1.5B	無料	日本語特化、知識蒸留技術、モバイル実行可能	日本語AI活用・モバイル開発企業
Apple Intelligence	対応デバイスユーザーは無料	Apple製品のUI/UXに深く組み込まれた、文脈理解・アシスタンス・生成処理を包括するAI統合基盤	Appleユーザー向け
Granite（一部のモデル）	オープンソース（Apache 2.0）または従量課金	企業向け設計、コンプライアンス・セキュリティ重視、多言語・多モーダル対応	金融・医療・法務など規制業界
TinyLlama	無料	超軽量、高速推論、モバイル・IoT対応	エッジAI・IoT・スマートデバイス企業

GPT-4.1 mini

引用：ChatGPT

GPT-4.1 miniはOpenAIが提供する小規模言語モデル（SLM）の一つで、GPT-4oや従来の大規模モデルと比較しても高い知性評価を維持しつつ、大幅な低コスト化と低遅延を実現しています。

性能面では、多くのベンチマークでGPT-4oを上回ることもあり、指示追従性や長文コンテキストの理解にも優れています。

プロンプトキャッシュ機能の割引率が最大75%まで向上しており、同じコンテキストを繰り返し利用する場合にコスト削減が可能です。

開発者コミュニティのフィードバックを反映して最適化されており、リアルタイムアプリケーションやエージェントシステムなど幅広い用途で活用されています。

【企業の導入止まり】なぜChatGPTを導入しても使われないのか？活用率を上げるポイントについて解説

Orca2

引用：Microsoft

Orca 2はMicrosoftが開発した小規模言語モデルです。パラメーター数は7Bまたは13Bと比較的コンパクトでありながら、複雑な推論や多段階のステップを必要とするタスクにおいて、従来の同規模モデルを上回る性能を発揮します。

Orca 2は、大規模なLLMから得られる「段階的な推論」のトレースを模倣する訓練データを用いてファインチューニングされており、5〜10倍のパラメータを持つ大型モデルに匹敵する推論能力を実現しています。

特に、ゼロショット設定での複雑な質問応答や説明生成、問題解決など、大規模モデルにしかできないとされていた高度な推論タスクにも対応可能です。

Orca 2はモデルウェイトが公開されており、研究や開発用途に利用されています。コスト面でも、リソース消費が少なく、ローカル環境やエッジデバイスでの運用が容易で、カスタマイズ性が求められる分野に適しています。

Phi-4

引用：Microsoft

Phi-4はMicrosoftのPhiシリーズの中でも、高度な推論能力と複雑なタスク処理を得意とする小規模言語モデルです。テキスト、数学、コーディング、指示追従などのベンチマークで高い性能を発揮します。

Phi-4はコスト効率に優れており、エッジデバイスやクラウド、ローカル環境での運用を想定した設計です。

モデル自体は大規模モデルと比べてパラメーター数が少ないため、リソース消費が少なく、高速な推論が可能です。

また、Phi-4-miniやPhi-4-multimodalなど派生モデルも存在し、マルチモーダルな入力や長文コンテキストにも対応しています。

PhiシリーズはMicrosoft Azure上で利用可能で、企業や研究機関のコスト最適化やプライバシー保護、オフライン運用など多様なニーズに応えられます。

Mistral Small 3.1

引用：Mistral AI

Mistral Small 3.1はMistral AIが提供する小規模言語モデルで、軽量かつ高性能な設計が特徴です。

高性能な一般向けハードウェア上で動作可能であり、エッジデバイスやオンプレミス環境での運用に最適です。

Mistral Small 3.1はテキスト生成、会話アシスタント、画像理解などAIタスクに対応し、低遅延での応答が求められるリアルタイムアプリケーションやエージェントワークフローに適しています。

また、特定領域へのファインチューニングが容易で、法律、医療、テクニカルサポートなど専門分野の知識を強化したカスタムモデルの構築も可能です。

オープンソースベースのモデルチェックポイントも提供されており、開発者コミュニティによるカスタマイズや独自用途への展開ができます。

Gemma

引用：Gemma

GemmaはGoogleが開発したオープンソースの小規模言語モデルで、Geminiモデルと同じ技術をベースにしながら、パラメーター数が2Bや7Bとコンパクトな設計です。

GemmaはノートPCやワークステーション、Google Cloudなど多様なプラットフォームで動作可能であり、オンプレミスやエッジデバイス、クラウド環境での運用も可能です。

特徴として、JAX、PyTorchなど主要なAIフレームワークに対応し、ColabやKaggle、Hugging Faceなど開発者向けツールとの連携も充実しています。

また、Gemmaは100万以上のダウンロード実績を持ち、世界中の開発者コミュニティによって6万以上のバリアントが作成されるなど、高い拡張性とカスタマイズ性に優れています。

OpenELM

引用：Apple

OpenELMは、2024年4月に公開したオープンソースの言語モデルです。

最大の特徴は、レイヤーごとのスケーリング戦略を用いて、Transformerモデルのパラメータを効率的に割り当てるスケーリング戦略により、精度の向上を実現しています。

OpenELMは2億7000万、4億5000万、11億、30億という4つの異なるパラメータ数を提供しており、用途に応じて適切なサイズを選択できます。

完全にオープンソースとして提供されており、商用利用も含めて無料で使用可能です。

また、約1兆8000億トークンという大規模データセットでトレーニングされており、GitHubのRedPajamaデータセット、Wikipedia、StackExchangeなど多様なソースから学習しています。

iPhoneやMac上で直接実行できるライブラリも含めて開発者向けツールが提供されており、モバイルアプリケーションへの組み込みも簡単です。

TinySwallow-1.5B

引用：Sakana AI

TinySwallow-1.5Bは、日本に拠点を置くAI企業Sakana AIが2025年1月30日に発表した小規模日本語言語モデルです。

特徴は、新たに開発された知識蒸留手法「Temporally Adaptive Interpolated Distillation」を用いて開発されている点です。

TAIDは生徒モデルの学習進度に合わせて教師モデルを段階的に変更するアプローチを採用しています。

また、パラメータ数320億の大規模言語モデルから知識蒸留により、わずか15億パラメータという小規模でありながら高性能を実現しています。

PCにダウンロードして実行できるウェブアプリ「TinySwallow-1.5B Chat」も提供されており、ローカル環境での実行が可能です。

Apple Intelligence

引用：Apple Intelligence

Apple Intelligenceは、Appleが開発したAIシステムであり、文章の要約や作成支援、写真の検索や分類といった日常的な作業を高度にサポートする機能を備えており、ユーザーの体験を総合的に向上させます。

特徴は、Apple Intelligenceが単なるLLMやSLMではなく、Apple製品のUI/UXに深く組み込まれた、文脈理解・アシスタンス・生成処理を包括するAI統合基盤である点です。その中で小規模言語モデルは重要な構成要素の1つですが、「Apple Intelligence＝SLM」ではありません。

また、プライバシー保護に配慮された設計も注目されており、Apple自身がアクセスできない「プライベートクラウドコンピューティング」によって、安全かつ高度な処理が実行されます。

文章関連ではChatGPTとの連携も選択可能であり、Siriは画面上の文脈を理解し、自然な会話やアプリ間の連携操作を実現します。

Apple Intelligenceを活用することで、ユーザーはより直感的かつ効率的にデバイスを操作し、日々の業務や創造的な活動の質を向上させることが可能です。

Granite（一部のモデル）

引用：IBM Granite

IBM Graniteシリーズは、IBMが開発した企業向けの言語モデルファミリーで、その中でも小規模なバリエーションはSLMカテゴリに分類されます。

Graniteモデルの特徴は、企業利用を前提とした設計となっており、コンプライアンスやガバナンス要件を満たすように開発されている点です。

特に3億から130億パラメータまでの範囲で複数のサイズが提供されており、用途に応じて適切なモデルサイズを選択できる柔軟性があります。

また、商用利用を想定して厳格なデータフィルタリングとバイアス除去プロセスを経て訓練されており、企業環境での安全な利用が可能です。

モデルのメリットとして、エンタープライズグレードのセキュリティとコンプライアンス機能が組み込まれており、金融、医療、法務などの規制の厳しい業界でも安心して利用できるといった特徴があります。

TinyLlama

引用：insightreactions

TinyLlamaは、わずか11億パラメータという超軽量サイズでありながら、Meta社のLlamaアーキテクチャを踏襲した高性能小規模言語モデルです。

特徴は、約3兆トークンという大規模データセットで訓練されながらも、モバイルデバイスやエッジコンピューティング環境での実行を可能にする軽量性を実現している点です。

TinyLlamaは推論速度の高速化に重点を置いて設計されており、リアルタイム応答が要求されるアプリケーションに最適化されています。

また、Llamaファミリーとの互換性を保持しているため、既存のLlamaベースのツールチェーンやライブラリをそのまま活用できる利便性もあります。

モデルの重みやトレーニングコード、推論用ライブラリまで全て公開されているため、研究者や開発者が自由に改良や実験が可能です。

さらに、少ないメモリ使用量で動作するため、一般的なスマートフォンやタブレットでも実行可能な点がメリットです。また、量子化技術との組み合わせにより、軽量化も実現できます。

SLMの導入がおすすめの企業

SLMとLLMどちらを導入したら良いかわからないという方も多いでしょう。そこで、SLMの導入がおすすめの企業について特徴を3つ紹介します。

中小企業やスタートアップ企業
特定業務や用途に特化したAIを必要とする企業
機密性やプライバシーを重視する企業

中小企業やスタートアップ企業

SLMは限られた予算・リソースの中で導入しやすいため、中小企業やスタートアップ企業におすすめです。
また、大規模言語モデルは高性能ではあるものの、自社で構築・運用する場合は高価なGPUやクラウド環境の契約、専門知識を持った人材の確保が必要で、初期費用や維持コストが大きくなりがちです。

一方、OpenAIやAnthropicなど外部サービスのAPIを活用する場合は、自社でインフラを持たなくても利用できるため、初期投資を抑えられるケースもあります。

ただし、API利用料は継続的に発生し、利用量によってはコストが積み上がるため注意が必要です。

一般的には、SLMの方がモデルサイズが小さく、必要な計算リソースも少ないため、オンプレや小規模クラウドでも運用しやすく、コストを抑えられるケースが多いといえます。

特定業務や用途に特化したAIを必要とする企業

特定の業務領域にAIを導入したい企業も、SLMの導入がおすすめです。

SLMは用途が明確な場面で、必要な知識に最適化された学習が可能であり、不要な情報を省いた「的確で無駄のない応答」ができるからです。

たとえば、カスタマーサポートでの問い合わせ対応や、社内FAQの自動応答、物流における配達状況の自動確認など、SLMを使うことで正確かつ高速な応答が実現します。

また、SLMは少量の学習データでファインチューニングできるため、自社の用語や業務内容にすばやく最適化できるのもメリットです。

機密性やプライバシーを重視する企業

法務、医療、金融、官公庁など、機密性や個人情報の取り扱いが厳格に求められる分野にもSLMの導入がおすすめです。SLMは軽量であるがゆえに、ローカル環境で完結した運用が可能です。

クラウド型のLLMを利用する場合、外部サーバーにデータが送信されるため、暗号化されていても情報漏れのリスクを完全には排除できません。

SLMであれば、自社サーバーや端末内でAIモデルを動作させられるため、厳しいセキュリティにも対応できます。

インターネット接続が不要なモデルも多く、災害時や閉鎖環境でも安定した運用が可能です。

外部に依存せずに機密性とプライバシーを守りながらAIを活用したい企業にとって、SLMは安全性と柔軟性を両立するため、最適と言えるでしょう。

生成AIの健全な社会実装と企業・行政の課題解決

当社は、生成AIの健全な社会実装と企業・行政の課題解決の両立を目指し、2025年5月30日付で一般社団法人Generative AI Japanへ参画しました。

急速に進化する生成AI技術に対し、当社はChatGPTやClaude、GitHub Copilotなど複数の先進ツールを活用し、業務効率化や新規事業のPoC支援に取り組んできました。

こうした経験を活かし、今後は産学連携を通じて社内外のAIリテラシーを高めるとともに、提案の質も一段と向上させていきます。

また、GenAIが掲げる「安全かつ創造的な生成AIの活用促進」という理念にも深く共感しており、業界や立場を超えた知見の交換や協働にも積極的に関与していく方針です。

同社は生成AIを「創造性を引き出すパートナー」と位置づけ、倫理的かつ実践的な活用手法の確立に向けて、多様な会員企業や有識者と連携しながら取り組みを進めています。

さらに、当社では2025年6月に「スパイスファクトリーAI基本方針」を策定し、AI活用に伴う社会的責任を明確にしています。この方針では、公平性や多様性、人権の尊重、透明性の確保、法令遵守をはじめ、情報セキュリティの維持や技術進展に応じた継続的な運用改善を重要な柱として掲げています。

全従業員および外部パートナーへの教育・浸透を徹底し、AIを正しく責任ある形で活用できる組織文化の醸成を推進しています。

今後もスパイスファクトリーは、社会課題の解決と新たな価値の創出を両立させる存在として、AI技術の活用を通じたイノベーションの実現に尽力してまいります。

まとめ

SLMは、LLMほどの汎用性はないものの、コスト面・処理速度・カスタマイズ性に優れています。そのため、特定業務に最適化されたAIの構築や、プライバシー性が求められる環境での導入に強みを発揮します。

近年ではGPT-4.1 mini、Gemma、Orca 2など高性能なSLMも登場しており、「軽量でありながら賢いAI」を実現・活用可能です。

自社のAI活用において何を重視すべきかを明確にすることで、LLMとSLMの使い分けが可能となり、業務効率化やサービス品質の向上につながるでしょう。

こうした中、スパイスファクトリーは、生成AIの業務実装を単なる技術導入にとどめず、社会的責任・倫理観を伴ったかたちで推進しています。

また、Generative AI Japanへの参画を通じて、産学連携による実践知の共有、クライアント企業の課題に即したAI導入支援を行い、健全かつ創造的なAI活用の社会基盤づくりに貢献しています。

生成AIとSLMの特性を見極めながら、真に価値あるテクノロジーの使い方を探る取り組みが、今後の企業競争力を左右するでしょう。

以下の記事では、小規模言語モデル「Phi-3」を実際に動かしてみた感想や使いやすさについて解説していますので、あわせてご覧ください。

スパイスファクトリー公式

スパイスファクトリーは世界がより良い⽅向に向かうよう、変化を加速させる “触媒”（スパイス）としての役割を全うすることをミッションとしたDXエージェンシーです。最新テクノロジー、UIUX、アート、マーケティングなどの技術・メソッドを⽤いて、モノゴトを素早く、美しく、本質的に再定義し、幅広いクライアントのデジタルトランスフォーメーションを⽀援しています。