今やってる研究の発端は
ジェフ・ホーキンスの「考える脳 考えるコンピューター」という本。
いわゆる研究費を集めるための本ではあるが、初心者の興味を引くという点では十分な質。
これを読んで、実際の脳へ興味がわいたといっていい。
で、専攻科時代にこれを研究しようとしたわけだが、なにぶん基礎知識が足りなかった。
院に入ってようやく自由に研究ができるようになったのでこれを中心に研究予定。
以下、現在の研究の進行状況。
[0回]
とりあえず、
ヌメンタ社のサイトへ行ってみる。
すると本に書いてある「記憶と予測の枠組み」を実装した
Hierarchical Temporal Memory (HTM)というものがあるようだ。
ただ、英語は読むのに時間かかる&読んだ端から内容を忘れてしまう。
で、訳してみた。
livedoor翻訳(翻訳量が多くても大丈夫だけどたまに文字化けする)の自動翻訳を基に、
わけわからんところを手動翻訳。
日本語っぽくなかったり自分でも意味が取れない部分があるが(英語は苦手)、
まぁ大体わかるはず。
ちなみに全文無断翻案だったりします。いけないことです。
翻訳内容に責任は持ちません。
HTM_Concept =>
原文 概要。長い。
HTM_Learning_Algorithm =>
原文 学習アルゴリズム。やっぱり長い。
以下、学習アルゴリズム要約。つまりこれは動画像認識アルゴリズムの一つ。
画素ごとに頻度を計測、ベクトル量子化(空間プーラー)して、
頻度の高い時系列パターンを抽出(時間プーラー)するモジュールを階層化したもの。
入力があったとき、各モジュールが持つ時系列パターンに対して、
入力パターンに対する確信度(入力がどの時系列パターンの一部かという確率)が与えられ、
それらの層に確信伝播アルゴリズムを適用することで各層の出力を決定する。
広い領域からの時系列パターンが一定となるので、動画であっても認識が可能。
むしろ動画であるほうが多くの情報が得られるため認識率が上がる。
実験では静止画に比べて動画認識では20%の認識率向上らしい。
うーん。あんまり目新しいものじゃないな。
単にベイジアンネットにベクトル量子化加えてみましたって感じ。
ていうか20%しか向上しないのか。
とりあえず、今後これを中心に研究。最終的にはロボットを動かしたい。
現在は時系列を扱えるSOMをFPGAに実装する場合、どれがいいか検討中。
空間プーラーはSOM、時間プーラーはHMMでいけると思ったけど、
HMMはBaum-Welchアルゴリズムに時間がかかりすぎるらしい
(ある実験データによるとPCで一回に1secかかってるようだ。遅すぎ。)
ので、他を検討中。
ま、時系列を扱えるSOMだと時間プーラーと空間プーラーの順番が逆になるけど、
それほど影響ないんじゃない?
時系列を扱えるSOMを列挙したようなサイトはないのかな?
種類多すぎ。
いろいろありすぎてわからん。
一応関連リンクも。
ジェフ・ホーキンス Palm作った人。
ヌメンタ社 ホーキンスさんが作った会社。
On Intelligence ホーキンスさんが書いた本(「考える脳 考えるコンピューター」の原本)。
公式HPは
ココ。
Memory-prediction framework その本に載ってる理論。
訳本では「記憶と予測の枠組み」とされている。
Neocortex - Memory-Prediction Framework その理論を実装したもの。
ヌメンタ社のものとは違うようだ。
PR