機械学習の説明を一般の人に説明する人として,機械学習の説明として以下の10点をまとめました.
マシン・ラーニングは宣伝されているようなものではなく,適切な学習アルゴリズムに適切なトレーニングデータを提供することで,無数の難題を解決することができます.あなたのAIシステムを販売するのに役立つなら,それをAIと呼んでください.
機械学習アルゴリズム,特に深層学習の進歩には,多くのエキサイティングなところがあります。しかし,データは機械学習を可能にする重要な要因です。機械学習は複雑なアルゴリズムなしで,しかし,良いデータなしでできません。
機械学習は,データ中のパターンに基づいてモデルを訓練し,パラメータによって定義された可能なモデルの空間を探索する.パラメータ空間が大きすぎると,訓練データに過適合し,自己一般化できないモデルを訓練する.これを詳細に説明するには,より多くの数学的な計算が必要であり,あなたはこれを基準として,あなたのモデルをできるだけシンプルにする必要があります.
コンピュータにゴミの山を入力すると,ゴミのデータ山が出るというがあります. この言葉は機械学習よりずっと前に存在していましたが,それはまさに機械学習の存在の重要な制限です. 機械学習は,トレーニングデータに存在するパターンしか発見できません. 機械学習のタスクを監視するために,例えば (分類) のように,あなたは健やかな,正しく標識された,豊富なトレーニングデータセットが必要です.
基金募集説明書が警告しているように,過去のパフォーマンスは将来の結果を保証するものではない.機械学習も同様の警告を発すべきである.それは,訓練データと同じ分布のデータのみに基づいて動作できる.したがって,訓練データと生産データの間の偏差に注意し,訓練モデルを定期的に繰り返して,それが時代遅れにならないことを保証する必要があります.
機械学習の技術が広められている中で,あなたは機械学習が主にアルゴリズムを選択して調整していると思うかもしれません. しかし,実際は平凡です:あなたのほとんどの時間と精力は,データのクリーンアップと特性のエンジニアリングに費やされます. つまり,原始特性をデータより良く表現できる信号の特性に変換します.
機械学習は多くの分野に応用され,発展しているので,深度学習も広められている.さらに,深度学習は,伝統的に特徴工学によって行われていた作業の自動化を促進している.特に画像とビデオのデータ.しかし,深度学習は妙薬ではない.あなたが使用できる準備ができていないので,あなたはまだデータをクリアし,変換するために多くのエネルギーを投入する必要があります.
NRAへの謝罪, 機械学習アルゴリズムは人を殺すのではなく,人を殺す.機械学習システムが故障すると,機械学習アルゴリズムの問題があることがほとんどない.より可能性が高いのは,人工的なエラーが訓練データに導入され,偏差または他のシステムエラーが生じることである.私たちは常に疑念を抱いて,ソフトウェアエンジニアリングに適用される方法で機械学習を扱うべきである.
機械学習の多くのアプリケーションでは,あなたが今日行う決定は,明日収集されるトレーニングデータに影響します. 機械学習システムがモデルに偏差を組み込んだら,それは偏差によって強化された新しいトレーニングデータを生成し続けることができます. さらに,いくつかの偏差は,人々の生活を台無しにする可能性があります. 責任を持ってください:自己実現の予測を作成しないでください.
人工知能に関する概念をSF映画から得た人はかなり多いようです.SF映画からインスピレーションを得るべきですが,SFを現実と間違えてしまうのはあまり簡単ではありません. 意識的な邪悪な人間から無意識の偏った機械学習モデルまで,心配すべき現実と危険が多すぎます.
機械学習は,私が前述した10点の説明よりもはるかに多くのことを含んでいます.
投稿者: ユン・ユン 投稿者: ユン・ユン 投稿者: ユン・ユン