TAPIOKA

ご機嫌麗しゅうございます、椿木でございます。

突然ではございますがお嬢様、数学はお好きでいらっしゃいますか?

「数学なんていつ使うの!」

「数学出来なくても困らない!」

という言葉を私もよく聞いたような気がいたします。

実はこの言葉、あながち間違いではございません。

理由は簡単でございまして、現代技術において使用されている数学は

【数学を使っている事すら気付かせない】

という程にまで発達したからでございます。

そもそも数学とはでございますが、物理を計算する上で必須の事柄な一面を持っております。

無論その他の面も持ち合わせておりますが、今回は身近なものへ焦点を当てて見ていきましょう。

昨今様々なところで使用されているスマートフォン、その中の数学の一例と致しましてFaceIDがございます。

もう少々正確に申しますと、画像認識という分野でございます。

画像認識のパッと見の印象と致しますと、機械側が持っているサンプル画像と今読み込んだ、又は認識した画像を比較し類似している点や色等からそれがなんなのか、同一なのかを判断している技術という認識なのではないかと存じます。

では、どのようにして色や点、はたまた線を認識しているのでしょうか?

それらのどこに数学が使われているのかを説明していきましょう。

ではまず画像認識とは何なのか、一体どこに数学があるのかを1番分かりやすい色から見ていきましょう。

我々人間は色を説明する際、赤白青黄色といったように色の名称で区分けわしております。ですが機械上では、RGB(Red,Green,Blue)の0~255
それぞれの強度、計256^3通りの数字で色は表現されます。

そして画像というのは、小さい正方形のマスの配列で構成されています。これは写真などを拡大していただければ分かりやすいかと存じます。このマスが何色なのか、例えば
100×100の画像でしたら、1万個のマスのRGB強度による組み合わせで画像が決定され、これらは【数値】で表されます。

更に、機械上でこれはネコである、イヌであるとされる出力側でございますが、実は画像認識の裏側では、ネコである確率が0.8(80%),イヌである確率が
0.07,飛行機である確率が0.01,車である確率が…といった様に、設定された出力先(この場合イヌネコ飛行機車)
の個数分の確率という【数値】で出力されております。

そして画像認識というのは、入力側の数値を出力側の数値へ変換してる、つまりは

【数値から数値への変換】

でございまして、それは正しく

y=f(x)

という関数そのものでございます。

では実際に式として表してみますと、

※1出力先を100個としそれぞれの確率をP(1~100)で表す

※2 xnは100×100のマスのRGB強度をそれぞれ表す

P(1~100)=f(x1,x2,x3…x30000)

と表されます。

この関数fの部分が画像認識が行っていることでございます。段々数学らしくなりましたね。

何故こんな分かりにくい事をするのか!色の情報が全て数値なら、認識などさせずに最初から全てのパターンを記憶させて出力させるだけでいいではありませんか!

と思し召されるお嬢様もいらっしゃるやもしれませんが、先程の100×100マスのRGB強度の組み合わせ、256強度に1万マス3
色でございますからその数なんと256^3万≒10^7万通りもございまして、仮に参考データが100億個あったとしましても、それはたった10^10
個でございまして全体の1/10^69990倍と全然足りないのでございます。

だからこそ入力データを既知のデータへ変換する関数fが必要となるのでございます。

ちなみにではございますが、これらは機械学習という呼び名とも呼ばれておりまして、記憶には無いそれこそ1/10^69990
しかないデータからネコをネコと判断している、そこに機械の知能と呼ばれる何かがあるのではないか?

という凄みを感じる点でもございますね。

さてさて、それではここから実際に数字と数式を使って画像認識を手動で計算を!と存じましたが、とても長くなってしまいそうでございますのでまたの機会と致しましょう。

また9月には私と時任執事によりますオリジナルカクテル、Luftspieagelung
を開催させていただきます。私が時任執事へ「美味しいワインがあるんですよ!」から始まりましたカクテル、是非お楽しみいただけましたらば幸いでございます。

それではまたティーサロンでお嬢様のお帰りをお待ちしております。