ワンショット学習とは?意味やゼロショット学習、フューショット学習との違いまで徹底解説!
INDEX
皆さんはワンショット学習をご存じですか?ワンショット学習は1枚の画像で学習が行える大変効率的な学習手法です。なぜそんなことが可能なのか、ワンショット学習の謎を解説していきます。
本記事ではワンショット学習とは何かを中心に、メリットやデメリット、ゼロショット学習などの違いについてもご紹介します。
ワンショット学習とは?
ワンショット学習とはどういうものなのか、ワンショット学習の意味や基本的情報についてご紹介していきます。
ワンショット学習の意味
ワンショット学習は、1枚の画像を見るだけで認知ができる学習機能の言葉として知られています。2016年、イギリスのディープマインド社の論文で用いられた言葉が有名です。その論文では、子供はキリンの写真を1枚見ることで、キリンという認識ができるというところからスタートしています。
当時ディープラーニングでは前もって特定の画像を学習させなければ、特定の物体を判別することができない状態でした。たった1枚の画像があることで人間の認識では瞬時に物体の認識が行えるのに、AIではそれができない状態にありました。
ワンショット学習を実現できれば、AIは知性を手に入れたことになると語る研究者がいるなど、ワンショット学習ができるかどうかが焦点になっていったのです。
ワンショット学習の概要
ワンショット学習では1枚の画像を様々な形に加工する形で学習を行っていきます。加工の仕方は様々で、例えば、1枚の画像に対して色を変える、背景を変えるなど様々な形で加工を行い、どのような状況でも認識ができるようにするなどの学習を行います。
子供でも1枚の画像で分類ができるのは、画像を見て発想することができるためです。パーツや概念をベースにした発想ができるので、1枚の画像だけで十分分類ができるというわけです。また、抽象的なものであっても、これを転用することでワンショット学習につながるとされており、転移学習の1つとして応用できるのも特徴的です。
ワンショット学習の手法
ここからはワンショット学習に関する手法についてご紹介していきます。
まず別のデータで学習を行う
ワンショット学習は転移学習などの手法を使って行うことで効率的な開発につながります。そのため、最初に別のデータを使って学習を行い、モデルを作っていきます。例えば、猫を分類させる場合に、事前に犬や鳥、魚など猫を除いたサンプルで学習を行っていきます。
すると、犬や鳥などの分類ができる状態に仕上がります。この時には分類するまでのプロセルが完成されているので、あとは完成されたものを使って猫の分類を行うことになります。
1枚の画像で再学習
ワンショット学習は転移学習の中の1つであり、先ほどの犬や鳥などの分類ができる学習済みモデルに、猫を加えて1回だけ再学習を行います。
この時、特徴量を表現できるようなモデルにしておくことが大切であり、そのようにすることで何を見て分類を行ったのかがわかるようになります。
ワンショット学習のメリット
ここからはワンショット学習のメリットについてご紹介します。
学習データが少ない場合に重宝する
AIを活用する際、学習データが少ないとなかなかいい結果につながりません。一方、新しいプロジェクトを展開し始めた場面や現実的にあまり事例が少ないケースなどで、どうしても学習データの確保が困難なケースがあります。そんな時に重宝するのがワンショット学習です。
近年注目を集める技術にシャムニューラルネットワークがありますが、これもワンショット学習で用いられる代表的なやり方です。シャムニューラルネットワークはペアとなる同じニューラルネットワークを活用して、それぞれのデータの関係性を学習していくというものです。
それぞれのネットワークにおいて重みを共有し、同じような学習を行う中で類似度などを判別していきます。こうした形で少ないデータでも意味のある学習が行うことが可能です。
ディープラーニングが苦手とする分野の克服ができる
ディープラーニングは大量のデータから学習を行っていき性能を高めていきます。そのため、大量のデータがない場合はなかなか性能が上がりません。ワンショット学習であれば、1枚の画像を様々な形で加工しながら学習が行えるため、少ないデータで精度を高めていくことが可能です。
ディープラーニングが現状苦手としていて、壁になりやすいジャンルに働きかけていくため、ワンショット学習を用いるメリットと言えます。
コストも時間もかからない
ワンショット学習では1つの画像やサンプルさえあれば学習が行えるほか、1つの写真を提示するだけで同じような予測をする必要があります。例えば、1人の人物の顔写真を使って学習を行った場合、別の人の顔写真を使った際に顔が検出できるようになるのが理想的です。
この時、大量の顔写真も必要ないほか、準備する手間暇、コストも不必要になります。ワンショット学習を行う際にはコストも時間もかからなくなるので、効率的かつ合理的な開発につなげられると言えるでしょう。
ワンショット学習のデメリット
次にご紹介するのはワンショット学習のデメリットについてです。
開発の余地がまだまだある
ワンショット学習は人間の認知にかかわる重要なものであり、よりよい人工知能を作り出す上で避けては通れない課題になっています。しかし、決定的な理論はまだ乏しく、ワンショット学習の分野はまだまだこれから、試行錯誤のしようが多くある分野です。
いわば手を出すには難易度が高い状態にあり、高いレベルの知識力やディープラーニングの技術力が問われます。この状態からいいものを作り出していくには結構な時間がかかってしまうため、明確な作り方や理論がはっきりとするまではなかなか手を出しにくいジャンルと言えます。
1つのサンプルでは不十分なケースがある
ワンショット学習は1つのサンプルから答えを導き出すものですが、1つのサンプルだけだと不十分になってしまうことがあります。結局数が多い方が精度が高くなるのは当然といえば当然の話であり、この後ご紹介するフォーショット学習の方が効率が良くなると言えます。
もちろん1つのサンプルに様々な加工を加える形で学習を行っていく手もありますが、それでも不十分な場合があります。1つのサンプルで事足りるものなのか、それだけでは不十分なのかはやってみなければわからず、事足りなければ増やしていくという形で開発を続けていくことになります。
ワンショット学習とゼロショット学習、フューショット学習との違い
ここからはワンショット学習と似たような言葉であるゼロショット学習、フューショット学習について、その違いをご紹介します。
ゼロショット学習との違い
ゼロショット学習は学習データが存在しないものについて、前もって作られている学習済みモデルを活用する形で識別を目指す方法です。あくまでもゼロショットなので、当然1つのサンプルもありませんが、推論をベースに識別を目指していきます。
フューショット学習との違い
フューショット学習は、過去に行った学習データを活用し、改めて再学習をする際にデータを追加していくやり方です。ワンショット学習との違いはサンプル数の違いであり、そのメカニズムは大きく変わりません。
ワンショット学習ではサンプル的に不十分だった場合にその数を増やしていくことでフューショット学習になります。例えばスリーショット、ファイブショットとサンプル数に応じて具体的な数値が変わっていきます。いくつまでのサンプルだとフューショット学習になるかというのは特に決まっているわけではありません。
ワンショット学習と別にあるワンショット未満学習とは
人工知能の分野は加速度的な進化を遂げていますが、ワンショット学習も着実に進化していると言えます。その中でも注目されているのがワンショット未満学習です。別名LOショット学習と呼ばれるワンショット未満学習ですが、AI学習をできる限り少なくすることで、過学習を始め、偏りがみられる学習などを防ぐ狙いがあります。
多くのデータを使って学習させると計算コストを多く要するため、自然と大規模になります。ゼロショット未満学習を研究するチームは、MNISTと呼ばれるデータベースを使い、大量のデータを使って実験を行っています。
元々6万枚もあった画像を蒸留する形で10枚の画像に圧縮し、MNISTのデータ量と同じだけの情報になるよう作成されました。すると、たった10枚の画像で訓練したモデルは6万枚の画像で訓練を重ねたものとほぼ同じような結果を残すことができたのです。
大量のデータがなくても少ない画像で同等の結果を生み出せたことは大きな進歩であるとともに、蒸留の技術を高めていけばより画像を少なくできるなどの研究につながっています。ワンショット未満学習はワンショット学習同様、とても夢のある手法と言えるでしょう。
まとめ
ワンショット学習はまだまだ進化の余地を残す学習手法であると同時に、可能性を大いに感じさせる分野に位置します。一方で、実用化となるとまだまだこれからであり、実例もそこまで多いわけではありません。
そして、ワンショット学習自体がどんなジャンルに応用しやすいのか、画像認識を行う際に何と相性がいいのかなど、チェックすべき点も多くあります。またワンショット未満学習のように、計算コストをかけなくても大量のデータで訓練したものと同等の結果を残せる技術も出てきている状況です。
ハイスペックなコンピューターなどが用意できなかったとしても、人工知能の開発が行える時代に向かって、一歩一歩近づいている印象を受けます。
さらに、今注目を集める生成AIリスキリングの第一歩を。生成AIパスポートとは?
生成AIパスポートは、一般社団法人生成AI活用普及協会(GUGA)が提供する、AI初心者のために誕生した、生成AIリスクを予防する資格試験です。AIを活用したコンテンツ生成の具体的な方法や事例に加え、企業のコンプライアンスに関わる個人情報保護、著作権侵害、商用利用可否といった注意点などを学ぶことができます。
⽣成AIの台頭により、AIはエンジニアやデータサイエンティストといった技術職の方々だけではなく誰もがAIを使えるようになりました。今、私たちがインターネットを当たり前に活用していることと同様に、誰もが生成AIを当たり前に活用する未来が訪れるでしょう。
そのような社会では、採用や取引の場面で、生成AIを安全に活用できる企業・人材であることが選ばれる前提条件になり「生成AIレベルの証明」が求められることが予測できます。生成AIパスポート試験に合格すると、合格証書が発行されるため、自身が生成AIを安全に活用するためのリテラシーを有する人材であることを、客観的な評価として可視化することが可能です。
ぜひあなたも生成AIレベルを証明し「生成AI人材」に仲間入りしましょう!