【初心者向け】
AIを学びたい人のためのAI用語辞典
AI(人工知能)は、暮らしやビジネスに深く浸透し、ニュースやSNSでAIに関する話題を見聞きする機会が増えました。
「AIを学びたいけど、難しくて分からない」
その原因のひとつが、AI情報に含まれる専門的な用語がとても多くて、困りますよね。
- AI用語辞典
- AI(人工知能)
- 機械学習
- ディープラーニング(Deep Learning)
- 生成AI(ジェネレーティブAI)
- ChatGPT
- アノテーション
- マルチモーダルAI
- セマンティック検索
- AGI(汎用人工知能)
- RAG(検索拡張生成)
- AX(AIトランスフォーメーション)
- 自然言語処理(NLP)
- 大規模言語モデル(LLM)
- プロンプト
- ゴールシークプロンプト
- Codex(コーデックス)
- 教師あり学習
- 教師なし学習
- Azure Open AI Service
- Microsoft Copilot for Microsoft 365 Copilot
- Azure Cognitive Search(アジュールコグニティブサーチ)
- Gemini for Google Workspace
- Adversarial Attack
- AutoEncoder
- Auto-ML
- CNN
- cross validation
- Data Augmentation
- Django
- Drop Out
- End to End学習
- GAN
- Grad CAM
- Keras
- k-近傍法
- Matplotlib
- Meta Learning
- Metric Learning
- NAS(Neural Architecture Search)
- Numpy
- OpenCV
- Pandas
- PCA
- Python
- Pytorch
- RandomForest
- ResNet
- RNN
- Scikit-Learn
- Self-supervised learning
- Semantic Segmentation
- Semi-supervised learning
- SSD
- Super Resolution
- SVM
- Tensorflow
- VGG
- XAI
- YOLO
- アンサンブル学習
- 意味解析
- ウォード法
- オンライン学習
- 過学習
- 学習曲線
- 強化学習
- クラスタリング
- グラフ理論
- 形態素解析
- 欠損値
- 決定木学習
- 交差検証
- 構文解析
- 最適化
- 次元の呪い
- シンギュラリティ
- 自然言語処理
- 深層学習
- 次元削減
- 生成モデル
- 性能指標
- 正規化
- 正則化
- 説明変数
- 線形回帰
- 転移学習
- ニューラルネットワーク
- 汎化性能
- ファインチューニング
- 分類
- ベクトル化
- まとめ
- 生成AI関連ツール紹介ページ
AI用語辞典
AI(人工知能)
「人工的に作られた知能」で、機械に人間と同じような知能を与える技術のこと。知能を持つだけでなく、自ら学習して分析や提案などができることも大きな特徴です。
人間の言葉の理解や認識、推論などの知的行動をコンピュータに行わせる技術を指します。
機械学習
コンピューターに大量のデータを読み込ませ、データ内に潜むパターンを学習させることで、未知のデータを判断するためのルールを獲得することを可能にするデータ解析技術です。AI(人工知能)の一部に位置付けられています。
ディープラーニング(Deep Learning)
機械学習技術の一種であり、大量のデータから自動的に特徴を発見することができる人工知能技術です。人間の脳の仕組みを模したニューラルネットワークと呼ばれる構造を使って、データから学習する技術です。
生成AI(ジェネレーティブAI)
コンピュータが学習したデータを元に、新しいデータや情報をアウトプットする技術です。AIを用いてクリエイティブな成果物を生み出すことができるのが特徴的で、画像や文章・音声・動画など、さまざまなコンテンツを生成できます。

ChatGPT
米OpenAI社によって開発された、人間との対話に近い自然な文章を生成するAIチャットサービスです。高度なAI技術によって、人間のように自然な会話ができます。
アノテーション
テキスト・音声・画像などのデータに「意味づけ」をする作業のことです。AIが正しく認識できるように加工するプロセスで、AI開発において、データに情報を付加するプロセスを指します。
マルチモーダルAI
テキスト、画像、音声、動画など、複数の種類のデータを一度に処理できるAIの技術です。異なる種類の情報をまとめて扱い、統合的に処理することで、より高度な判断を行うことができます。
セマンティック検索
キーワードの一致だけでなく、ユーザーの検索クエリの背後にあるコンテキスト上の意味と意図を理解することに重点を置いたデータ検索手法です。検索エンジンが単純なキーワードの一致検索だけではなく、ユーザの意図やクエリの意味を理解して、関連性の高い情報を提供します。
AGI(汎用人工知能)
Artificial General Intelligenceの略で、人間のような汎用的な知能を持つ人工知能を指します。特定のタスクを処理する特化型AIとは異なり、さまざまなタスクに対して人間と同様の知識や能力を持ち、独自の学習や問題解決ができる能力を持つとされています。

RAG(検索拡張生成)
Retrieval Augmented Generationの略で、大規模言語モデル(LLM)の出力を最適化するプロセスです。外部データベースや検索エンジンから情報を取得し、それをLLMに活用させることで、より正確で有益な回答を生成できる技術です。
AX(AIトランスフォーメーション)
AI(人工知能)を活用して、ビジネスのやり方や会社のあり方そのものを変革していく取り組みです。単なるAIツールの導入だけでなく、ビジネスモデル、組織構造、企業文化、働き方そのものを根本から変革し、新たな価値を創造する取り組みを指します。
自然言語処理(NLP)
人間が普段コミュニケーションに用いている言葉(自然言語)をコンピュータで処理・分析する技術です。言葉の意味や文脈、構造を理解し、テキストデータや音声データの要約・翻訳などに活用されます。
大規模言語モデル(LLM)
Large Language Modelsの略で、非常に巨大なデータセットとディープラーニング技術を用いて構築された言語モデルです。膨大な量のテキストデータから学習し、人間のような自然な文章を理解・生成できる人工知能モデルであり、生成AI系サービスの基盤となる技術です。
プロンプト
AIとの対話やコマンドラインインタフェース(CLI)などの対話形式のシステムにおいて、ユーザーが入力する指示や質問のことです。生成AIに特定のタスクを指示するためのテキスト入力を指します。
ゴールシークプロンプト
ユーザーが達成したいゴールがあり、そのゴールを達成するためにChatGPTが自らプロンプトを作成してくれるプロンプトの一種です。AIに指示は出すけれど、思ったような回答を得られない場合に、曖昧なゴールから明確なプロンプトをAIに生成してもらうことを目的とします。
Codex(コーデックス)
OpenAIが開発した人工知能モデルで、自然言語を解析し、対応するコンピュータープログラム(コード)を生成する能力を持ちます。ChatGPTに統合されており、機能についての記述、コードベースに関する質問への回答、バグの修正、レビュー用のプルリクエストの提案などのタスクを実行できます。
教師あり学習
機械学習の一種で、コンピューターに対してラベルと呼ばれる正解データを提供することで学習させる手法です。人間がラベル付けした入力および出力データセットを使用して人工知能モデルをトレーニングします。
教師なし学習
機械学習の一種であり、データ自体からパターンや関係性を見つけ出すための手法です。
データにラベル(正解)が与えられず、入力されたデータを利用して正解を導き出していきます。
Azure Open AI Service
Microsoft Azureのクラウドプラットフォーム上で、OpenAIのAIモデル(ChatGPTやGPT-4など)を利用できるサービスです。Microsoft Azureのセキュリティ機能を使用しながら、OpenAIと同じモデルを実行できます。
Microsoft Copilot for Microsoft 365 Copilot
WordやExcel、PowerPoint、Outlook、TeamsなどのMicrosoft製品をサポートする生成AIです。ユーザーはCopilotにプロンプトを入力し、AIによって生成されたコンテンツを返します。
Azure Cognitive Search(アジュールコグニティブサーチ)
Microsoft Azureが提供するクラウド型検索サービスです。AIによる自然言語処理や機械学習を駆使して、ユーザーの意図を深く理解し、より関連性の高い検索結果を提供します。
テキスト、画像、動画などのさまざまなコンテンツを検索できます。
Gemini for Google Workspace
Google Workspaceの利用者向けに提供される生成AIサービスです。AIを活用して業務の効率化や生産性向上を実現するためのサービスで、Google Workspaceの各アプリで利用できるAIアシスタントです。
Adversarial Attack
AIモデルに対して入力データに細工をすることで、AIの誤認識や誤動作を引き起こす攻撃手法です。AIの脆弱性を悪用し、AIの判断を意図的に誤らせることを目的とします。
AutoEncoder
ニューラルネットワークの一種で、入力されたデータを一度圧縮し、重要な特徴量だけを残した後、再度もとの次元に復元処理をするアルゴリズムです。教師なし学習に分類され、データの次元削減や異常検知などに用いられます。
Auto-ML
Automated Machine Learningの略で、機械学習モデルの設計と構築を自動化するツールのことです。データの前処理からモデルの選択、ハイパーパラメータの最適化まで、機械学習のプロセスを自動化し、専門知識がなくてもAIモデルを短時間で作成できる技術です。
CNN
Convolutional Neural Networkの略で、日本語では「畳み込みニューラルネットワーク」とも呼ばれます。主に画像認識の分野で用いられるディープラーニングアルゴリズムで、画像から様々な情報を抽出できます。
cross validation
交差検証(クロスバリデーション)とも呼ばれ、機械学習においてモデルの性能を客観的に測るための手法です。元のデータセットを複数のサブセットに分割し、あるグループで分析を行い、残りのグループでその分析結果が正しいかを評価することで、モデルの過学習を防ぎ、汎化性能を高めます。
Data Augmentation
データ拡張とも呼ばれ、人工知能(AI)および機械学習において既存のデータセットから新しいデータを人工的に生成し、モデルの性能を向上させるための重要な技術です。特に画像認識の分野で、画像の回転、反転、拡大縮小などの変換を施すことで、データ量を増やし、過学習を防ぎ、モデルのロバスト性を高めます。
Django
Pythonで実装されたWebアプリケーションフレームワークです。オープンソースとして無料で公開されており、Web開発に欠かせないツールです。AIを搭載したアプリケーション開発にも利用され、高度な分析および予測モデルをWebエコシステムの一部として展開するための基盤となります。
Drop Out
ニューラルネットワークの学習時に、一定割合のノードを不活性化させながら学習を行うことで過学習を防ぎ(緩和し)、精度をあげるための手法です。AIモデルが学習データに過度に頼りすぎないようにする重要な手法の一つです。
End to End学習
ディープラーニングにおいて、入力層から出力層までの全層のパラメータを一度に学習する手法です。最初から最後までタスクを実行するようにモデルをトレーニングし、手作業による特徴抽出や中間処理ステップを必要とせず、人の手を介さずに学習を進めることができます。
GAN
Generative Adversarial Networksの略で、「敵対的生成ネットワーク」とも呼ばれています。
2つのニューラルネットワーク(生成器と識別器)を競わせながら学習を進めていくことで、用意されたデータから特徴を学習し、擬似的なデータを生成することができる生成モデルです。画像生成などに用いられます。
Grad CAM
Gradient-weighted Class Activation Mappingの略で、AIモデルが画像のどの部分に着目して判断を下したのかを視覚的に示すことができる技術です。畳み込みニューラルネットワーク(CNN)による画像識別モデルの説明手法として用いられ、AIの意思決定プロセスに透明性をもたらします。
Keras
Pythonで書かれた高水準のニューラルネットワークライブラリです。TensorFlowなどのバックエンドを使用し、ディープラーニングモデルを簡単に構築できる強力なライブラリです。直感的なAPIと優れた抽象化により、複雑な深層学習モデルを簡単に構築できます。
k-近傍法
k-Nearest Neighbor methodの略で、機械学習の一種であり、近接性を使用して個々のデータ・ポイントのグループ化に関する分類または予測を行う、非パラメトリックな教師あり学習分類器です。簡単に説明すると、データをグループ分けするにあたり、対象とするあるデータがどのグループに含まれるかを周囲のデータの多数決で推測するという手法です。
Matplotlib
Pythonのグラフ描画のためのライブラリです。折れ線グラフ、棒グラフ、散布図など、様々なグラフを描画し、データを可視化することができます。機械学習においてデータの可視化は必須スキルであり、データ分析や結果の評価に広く用いられます。
Meta Learning
「学習することの学習」とも呼ばれる機械学習のサブカテゴリーであり、AIモデルが新しいタスクを自ら理解して適応できるようにトレーニングする手法です。少ないデータから効率的に学習する方法として注目されており、AIがより速く学習し、新しいタスクに適応し、最小限のデータで優れた能力を発揮することを可能にします。
Metric Learning
距離学習とも呼ばれ、データ間の類似度を学習する機械学習の一手法です。従来の機械学習が、与えられたデータから特定のラベルや値を予測するのに対し、Metric Learningはデータ間の距離や類似度を計算することで、類似した入力の検出や、未知のクラスの識別を可能にします。異常検知などに応用されます。
NAS(Neural Architecture Search)
ニューラルネットワークの構造を自動で探索する手法です。AIモデルの設計や構築を自動化するAutoMLの一種であり、特定のタスクやデータセットに対して、効率と予測スコアの両方に優れたニューラルネットワークのアーキテクチャを自動的に見つけ出すことを目的とします。
Numpy
Pythonで数値計算を効率的に行うためのライブラリです。多次元配列オブジェクトや数学関数を提供し、データ解析や線形代数を扱う上で必須のツールです。機械学習やAI分野において、膨大な数値計算を高速に行うために広く利用されています。
OpenCV
Open Source Computer Vision Libraryの略で、画像処理・画像解析および機械学習等の機能を持つオープンソースのライブラリです。Pythonを始め、C/C++、Javaなど様々なプログラミング言語で利用でき、顔認識や物体検出、画像フィルタリングなど、幅広い画像・動画処理タスクに活用されます。
Pandas
Pythonのデータ解析ライブラリです。データフレーム(DataFrame)などのデータ構造を提供し、データの読み込み、加工、集計、可視化など、データ分析を容易にする機能が豊富です。機械学習やAI分野において、データの前処理や分析に広く利用されています。
PCA
Principal Component Analysisの略で、日本語では「主成分分析」と呼ばれます。多次元データを少ない軸に要約する次元削減技術です。大規模なデータセットの次元数を、元の情報の大部分を保持する主成分まで削減することで、高次元データの可視化や機械学習の前処理に役立ちます。
Python
AI開発において最も広く利用されているプログラミング言語の一つです。AI開発に必須となる数値計算や機械学習・ディープラーニングに特化した専門性の高いライブラリ(NumPy,Pandas,TensorFlow, PyTorchなど)が豊富に整備されており、比較的容易にAIの開発が可能です。
Pytorch
Facebook(現Meta)のAI研究グループによって開発された、Python向けのオープンソース機械学習ライブラリです。ディープラーニングに特化しており、直感的な操作性と柔軟性を兼ね備えています。研究開発やプロトタイピングで広く利用されています。
RandomForest
ランダムフォレスト(Random Forest)は、「決定木」と「アンサンブル学習(バギング)」という2つの手法を組み合わせたアルゴリズムです。複数の決定木を生成し、それらの決定木の多数決により予測を行うことで、分類問題や回帰問題において高い予測精度を実現します。
ResNet
Residual Networkの略で、Microsoft Researchチームによって発表された革新的なCNN(畳み込みニューラルネットワーク)アーキテクチャです。層を深くしても性能が劣化しない「残差学習」という手法を導入することで、非常に深いネットワークの学習を可能にし、画像認識の精度を飛躍的に向上させました。
RNN
Recurrent Neural Networkの略で、「リカレントニューラルネットワーク」または「回帰型ニューラルネットワーク」とも呼ばれます。時間的な順序を持つデータ(時系列データ)を処理するために設計された特殊なニューラルネットワークです。過去の情報を記憶し、現在の入力と組み合わせて処理することで、自然言語処理や音声認識、株価予測などに活用されます。
Scikit-Learn
Pythonで利用できるデータ分析や機械学習のためのオープンソースライブラリです。分類、回帰、クラスタリング、次元削減など、様々な機械学習アルゴリズムと、それらを利用して機械学習を試すための豊富なデータセットが用意されており、データの前処理からモデリング、評価までを容易に実現できます。
Self-supervised learning
自己教師あり学習とも呼ばれ、外部から提供されるラベルに依存せず、データ自体から生成される教師信号を用いて学習を行う機械学習の手法です。教師なし学習と教師あり学習の中間に位置し、大量のラベルなしデータから有用な特徴量を効率的に学習できるため、特に大規模なデータセットの事前学習に有効です。
Semantic Segmentation
画像認識技術の一つで、画像内の各ピクセルがどのオブジェクトに属しているかを認識する技術です。画像内のすべてのピクセルに意味的なラベルを割り当て、各領域が何を表しているかを理解することで、自動運転や医療画像診断などで活用されます。
Semi-supervised learning
半教師あり学習とも呼ばれ、教師あり学習と教師なし学習を組み合わせた機械学習の手法です。少量のラベル付きデータと大量のラベルなしデータを使用してAIモデルをトレーニングします。ラベル付けのコストを削減しつつ、教師あり学習に近い高い予測精度を実現できる点が特徴です。
SSD
Single Shot MultiBox Detectorの略で、高速かつ高精度な物体検出に用いられるディープラーニングアルゴリズムです。画像を一度のパスで処理し、物体の位置とクラスを同時に予測する「シングルショット」アプローチを採用しており、リアルタイムでの物体検出に適しています。
Super Resolution
超解像とも呼ばれ、低解像度の画像や映像から高解像度のものを生成する技術です。AI(特にディープラーニング)を用いることで、単にピクセルを増やすだけでなく、失われた細部やテクスチャを復元し、よりシャープで鮮明な画像を生成することが可能になります。
SVM
Support Vector Machineの略で、「サポートベクターマシン」とも呼ばれます。教師あり学習アルゴリズムの一種で、主に分類問題に用いられます。データを2つのクラスに分類する際に、各クラスのデータから最も離れた位置に境界線(超平面)を引くことで、汎化性能の高いモデルを構築します。
Tensorflow
Googleが開発したオープンソースの機械学習ライブラリです。ディープラーニングや機械学習を支える強力なツールで、ニューラルネットワークの構築、学習、推論を効率的に行うことができます。Pythonをはじめとする多言語に対応し、CPU、GPU、TPU上で動作します。
VGG
Visual Geometry Groupの略で、オックスフォード大学のVisual Geometry Groupによって開発された深層学習モデルの一つです。小さな3×3の畳み込みフィルタを多層に重ねるというシンプルながら効果的なアプローチで、画像認識タスクにおいて高い性能を示しました。
XAI
Explainable AIの略で、「説明可能なAI」と呼ばれます。AIの振る舞いをあらゆる観点から理解し、信頼できるようにすることを目的とする技術の総称です。AIがなぜそのような判断を下したのか、その根拠やプロセスを人間が理解できる形で説明することで、AIの透明性と信頼性を高めます。

YOLO
「You Only Look Once」の略で、高速かつ高精度な物体検出に用いられるディープラーニングアルゴリズムです。画像を一度見るだけで物体を検出し、分類することが可能であり、リアルタイムでの物体検出や自動運転などに活用されます。
アンサンブル学習
複数の機械学習モデルを組み合わせて、より高い予測精度や汎用性を実現する手法です。
個々のモデルの弱点を補い合い、全体の予測性能を向上させることを目的とします。
意味解析
自然言語処理の一分野で、文章や単語の持つ意味をコンピュータが理解するための技術です。単語の意味だけでなく、文脈や単語間の関係性も考慮して、文章全体の意味を正確に把握することを目指します。
ウォード法
階層的クラスタリング分析における代表的な手法の一つで、AI分野でデータ分類やパターン認識に広く活用されています。グループ内のばらつきが最小になるようにデータを分類していく方法です。
オンライン学習
機械学習において、データが逐次的に与えられ、その都度モデルを更新していく学習方法です。大量のデータを一度に処理するバッチ学習とは異なり、リアルタイムで新しいデータに適応できるため、ストリーミングデータや変化する環境下での学習に適しています。
過学習
機械学習において、モデルが訓練データに過剰に適合し、訓練データ内のノイズや偶然のパターンまで学習してしまう現象です。その結果、訓練データに対しては高い精度を示すものの、未知のデータに対する予測精度が低下してしまいます。
学習曲線
機械学習において、モデルの学習データ量と予測性能の関係を示したグラフです。訓練データと検証データの性能をプロットすることで、モデルが過学習しているか、あるいは学習不足であるかを判断するのに役立ちます。
強化学習
機械学習の一分野で、AI(エージェント)が環境と相互作用しながら最適な行動を学習する方法です。エージェントは、ある行動をとった結果として得られる報酬を最大化するように、試行錯誤を繰り返しながら学習を進めます。ゲームAIやロボット制御などに活用されます。
クラスタリング
機械学習の一種であり、データ間の類似度に基づいてデータをグループ分けする手法です。教師なし学習に分類され、データの中に隠れたパターンや構造を発見するために用いられます。顧客セグメンテーションや異常検知などに活用されます。
グラフ理論
数学の一分野であり、点(頂点)とそれらをつなぐ線(辺)を使って、さまざまな関係性やネットワークを表現する手法です。AIにおいては、特にグラフニューラルネットワーク(GNN)の設計や学習に利用され、複雑な関係性を持つデータを分析するのに役立ちま
す。
形態素解析
自然言語処理の一分野で、文章を意味を持つ最小の単位(形態素)に分解し、それぞれの形態素の品詞や意味を特定する技術です。日本語のように単語の区切りが明確でない言語において、文章をコンピュータが理解・分析するために不可欠な処理です。
欠損値
データセットにおいて、何らかの理由で値が存在しない、または記録されていない状態を指します。データ分析や機械学習において、欠損値の適切な処理はモデルの精度に大きく影響するため、補完や削除などの対応が必要です。
決定木学習
機械学習の手法の一つで、データを分類したり予測したりするためのモデルを、木の枝のように分岐していくルール(決定木)として構築します。人間が理解しやすい形でモデルの判断プロセスを可視化できるため、解釈性が高いのが特徴です。
交差検証
機械学習において、モデルの汎化性能を評価するための統計的な手法です。データセットを複数のサブセットに分割し、一部を訓練データ、残りをテストデータとして交互に用いることで、モデルが未知のデータに対してどれだけ正確に予測できるかを評価します。
構文解析
自然言語処理の一分野で、文章の文法的な構造を解析する技術です。形態素解析によって分割された単語間の関係性や、文節の係り受け構造などを明らかにし、コンピュータが文章の意味を理解するための基礎となります。
最適化
AIや機械学習において、特定の目的(例えば、予測精度を最大化する、コストを最小化するなど)を達成するために、モデルのパラメータやアルゴリズムを調整するプロセスです。与えられた制約条件の下で、最も良い解決策を見つけ出すことを目指します。
次元の呪い
機械学習において、データの次元(特徴量の数)が増えるにつれて、モデルの学習に必要なデータ量が指数関数的に増加し、計算コストや過学習のリスクが高まる現象です。高次元データでは、データが疎になり、適切なモデルを構築することが困難になります。
シンギュラリティ
「技術的特異点」とも呼ばれ、AI(人工知能)が自己改良を繰り返し、人間の知能を超える転換点を指す概念です。この時点を境に、AIが自己進化を始め、人類の予測や制御を超えた急激な技術進歩が起こるとされています。

自然言語処理
人間が日常的に使う自然言語(話し言葉や書き言葉)をコンピュータが理解し、処理するための技術です。テキストデータや音声データから意味を抽出し、要約、翻訳、感情分析などに応用されます。
深層学習
ディープラーニングとも呼ばれ、機械学習の一種で、人間の脳の神経回路を模倣した多層構造のニューラルネットワークを用いて、データから自動的に特徴を学習する技術です。
画像認識、音声認識、自然言語処理など、様々な分野で高い性能を発揮しています。
次元削減
機械学習において、データが持つ特徴量(次元)の数を減らす技術です。高次元データを低次元データに変換することで、データの分析や処理を簡素化し、計算コストの削減や過学習の抑制、データの可視化などに役立ちます。
生成モデル
AIが学習したデータを元に、新たなデータを生成するモデルのことです。既存のデータ内のパターンと構造を識別し、新しいオリジナルコンテンツを生成します。画像、テキスト、音声など、様々な種類のデータを生成することができます。
性能指標
機械学習モデルの性能を定量的に評価するための指標です。モデルがどれだけ正確に予測や分類を行うかを示し、正解率、適合率、再現率、F値など様々な種類があります。異なるモデルを比較し、特定のタスクやデータセットに最適なモデルを選択するのに役立ちま
す。
正規化
機械学習において、データの単位やスケールを共通の基準に整える前処理のことです。データを特定の範囲(例えば0から1)に変換することで、モデルの学習を安定させ、性能を向上させる効果があります。
正則化
機械学習において、モデルの過学習を防ぎ、汎化性能を向上させるための手法です。モデルの複雑さに制約を加えることで、訓練データに過剰に適合することを防ぎ、未知のデータに対しても高い予測精度を維持できるようにします。
説明変数
機械学習において、目的変数を予測したり分類したりするために使用されるデータのことです。原因や入力データとして機能し、目的変数の変動に影響を与える変数です。
線形回帰
機械学習における回帰分析の一種で、2つ以上の変数間の関係を直線的な(線形)式で表す統計的な手法です。ある変数(目的変数)を、他の変数(説明変数)の線形結合で予測するモデルを構築します。
転移学習
機械学習の手法の一つで、あるタスクで学習済みのモデルを別の関連タスクに応用し、パフォーマンスと汎化性能を向上させる技術です。少ないデータや短い時間で高精度なモデルを構築できるため、AIの学習効率を飛躍的に向上させます。
ニューラルネットワーク
人間の脳の神経回路を模倣した数理モデルで、AI(人工知能)の基盤となる技術です。入力層、隠れ層、出力層から構成され、各層のノードが相互に結合し、学習を通じてデータ内のパターンを認識したり、予測を行ったりします。
汎化性能
機械学習において、モデルが訓練データだけでなく、未知のデータに対してもどの程度適応し、正確な予測や分類ができるかを示す指標です。高い汎化性能を持つモデルは、現実世界の問題に対してより信頼性の高い結果を提供できます。
ファインチューニング
機械学習において、事前に大量のデータで学習済みのモデルを、特定のタスクやデータセットに合わせて再学習させることで、より適したAIに仕上げる方法です。少ないデータや短い時間で高精度なモデルを構築できるため、AI開発の効率化に貢献します。
分類
機械学習における主要なタスクの一つで、与えられたデータをあらかじめ定義されたカテゴリやクラスに割り当てることです。例えば、メールがスパムか否か、画像に何が写っているかなどを判別する際に用いられます。
ベクトル化
文章や画像などのデータを、コンピュータが理解しやすい数値の配列、つまり「ベクトル」に変換するプロセスです。これにより、機械学習モデルがデータの特徴を数値として扱い、効率的に学習や分析を行うことが可能になります。
まとめ
生成AI関連ツール紹介ページ

閲覧ありがとうございました。
*****************
中年独身男のお役立ち情報局
Friends-Accept by 尾河吉満
*****************