MLはどのように機能しますか?
4 所要時間
4 所要時間
機械学習は、人工知能(AI)は、過去のデータとパターンを活用して論理的な決定を下し、人間の関与を最小限に抑えて正確な予測を行う能力を持つシステムの作成と進化に焦点を当てています。
1950年代、AIのパイオニアであるアーサー・サミュエルは、MLを「明示的にプログラムされなくてもコンピューターに学習能力を与える研究分野」と定義しました。
MLモデルによって管理され、駆動される機械学習アルゴリズムは、データ(サンプル)の量が増えるにつれて適応的に改善するように設計されています。しかし、根本的なMLバイアス(AIバイアスとも呼ばれる)の存在は、誤った予測につながり、その結果、欠陥のある有害な決定を支えています。
現在、利用されている方全企業の3分の2商品・サービスを推奨するため専門家は、MLはすでに変化していると言います、またはすぐに変わるでしょう、テクノロジーが進歩し続けるにつれて、世界中のすべての業界。
AIは、データを使用して推論、行動、適応、結論を出すことにより、機械やシステムが人間の脳のように考えることを可能にしますが、MLは、機械やシステムが生データをビジネスインテリジェンス(知識)に変換し、自律的な方法で学習することを可能にするAIのアプリケーションです。機械学習は、AIが何をすべきかを知るように訓練します。
基本的に、MLはシステムがそのインテリジェンスを開発することを可能にするエンジンです。機械学習はAIではなく、AIへの道.
ディープラーニングは、MLのサブセット(または特殊な形式)です。アルゴリズムのレイヤーを使用して、自律的に学習し、意思決定を行うことができる人工ニューラルネットワークを構築します。
システムが疑わしい予測や不正確な予測を生成し始めた場合は、データサイエンティストが関与して調整を行う必要があります。ただし、ディープラーニングモデルのアルゴリズムには、予測が不正確であるかどうかを自分で判断する能力があり、人間の介入なしに修正を行うことができます。
MLのもう一つの分野は自然言語処理で、機械やシステムが人間の書き方や話し方を正しく認識し、理解し、応答できるようにすることに焦点を当てています。これは、テクノロジーの世界では、プログラマーが従来使用していた数字やデータに頼るよりもはるかに多様でダイナミックです。
AppleのSiriやAmazonのAlexaなどのチャットボットは、自然言語処理を活用して人々が何を言っているのかを理解し、新しいテキストを作成して言語翻訳を実行するMLの例です。
ここまでは、ML の基本的な定義を見てきましたが、ML と密接に関連するテクノロジや手法との主な違いをいくつか取り上げてきました。この基盤が整ったら、次の点に注意を向けることができますMLのしくみ.
一般的には、ML モデルを構築するための 6 つの主要なステップAI をトレーニングするには:
ML手法には 4 つのタイプがあり、情報の分類、パターン認識、結果の予測、信頼性の高い意思決定など、モデルのコア機能を形成および制御します。
教師あり学習
教師ありMLは、アルゴリズムがラベル付きデータから継続的に学習する学習プロセスであり、時間の経過とともによりスマートで正確になります。ラベルは、有機的なもの(つまり、データ自体で利用可能なもの)にすることも、外部から追加することもできます。教師あり学習アルゴリズムの例としては、デシジョン ツリー、サポート ベクター マシン、ランダム フォレスト、単純ベイズなどがあります。
教師あり学習 algorithms are found in applications such as image and speech recognition, recommendation systems, and fraud detection.
教師あり学習は、関連するデータにアクセスすることで、MLモデルの主な目的である正確で適用可能な予測を生成できます。ただし、教師あり学習では、データにラベルを付けるために大量のドメイン知識と人間の努力が必要です。
教師なし学習
教師なしMLは、モデルがラベル付けされていないデータを分析して隠れたパターンや傾向を見つけ、類似性や異常に基づいてデータポイントをクラスターにグループ化する学習方法です。たとえば、一部の小売業者は、教師なし学習を活用して、特定のタイプの顧客が販売ファネルからいつ退出する可能性が高いかを予測します。このインサイトは、マーケティングキャンペーンとメッセージングを調整し、ターゲットを絞るために信頼されています。
K-meansクラスタリングは、利用可能な情報が非常に少ない場合でも、データポイントをグループに分割する最速の教師なしMLアルゴリズムです。
ただし、教師なし学習は自律的であり、人間の介入を伴わないため、トレーニング中に事前定義された回答がないため、精度と信頼性の測定指標が難しくなる可能性があります。
セミ教師あり学習
教師あり学習と教師なし学習の間は、セミ教師あり学習と名付けられています。このアプローチでは、モデルは最初に少数のラベル付きサンプルを使用してトレーニングされ、その後、大量のラベル付けされていないデータに繰り返し適用されます (このプロセスは疑似ラベル付けと呼ばれます)。最終的に、モデルはラベル付けされたデータと反復的にラベル付けされたデータの組み合わせを使用してトレーニングされます。
半教師あり学習の主な利点の1つは、データ準備に必要な時間とコストが教師あり学習に比べて大幅に削減できることです。さらに、教師なし学習とは異なり、半教師あり学習は幅広い問題(分類、回帰、クラスタリング、関連付けなど)に適用できます。ただし、主な欠点は、反復プロセスが非常に複雑であるため、より複雑な問題には適していないことです。
強化学習
強化学習 uses a trial-and-error approach to learn which actions and decisions are the most favorable over time. At the core of reinforcement learning is a reward system engine that tells the model when it has made a correct decision (and earned a reward) or made an incorrect decision (and is subjected to a penalty).
強化学習 can be extremely effective at solving complex problems. As the model learns from its mistakes and experiences, the reward and punishment engine reduces the likelihood of repeat errors. However, reinforcement learning requires a large volume of data, and maintenance costs can be high.
過剰な強化学習は、状態の過負荷にもリードし、結果の信頼性を低下させる可能性があります。状態は、エージェント(つまり、センサーを介して知覚し、アクチュエータまたはエフェクターを介して行動するエンティティまたは独立したプログラム)が環境から受け取る観察です。
世界のML市場は、2030年までに2,259億1,000万ドルに成長すると予測されており、すでにさまざまな業界を変革し、進歩させています。以下はその一部です実社会の例MLの応用。
これらは、MLの既存のユースケースの一例にすぎません。また、MLの進展など、多くのエキサイティングな開発が進行中です。クラウドデータエコシステムを使用して、ビッグデータのアルゴリズムを最適化するための量子コンピューティング.
世界がAIについて賑わっている一方で(そして多くの正当な理由で)、舞台裏でスポットライトから離れて、MLは新しいデータサイエンスイニシアチブで毎日使用されており、膨大な量のデータを重要な問題を解決し、価値のある目標を達成する信頼性の高いインサイトに変換されています。エンタテインメントの強化宛先教育の改善宛先命を救う.
で約ML詳細Sitecoreナレッジセンター.