忍者ブログ

東裏通


[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

間違い

間違いってのも大げさかもしれないが、
IT Text 音声認識システム (IT Text)IT Text 音声認識システム (IT Text)
(2001/05)
鹿野 清宏、河原 達也 他

商品詳細を見る

を基にJavaでHMMのプログラムを組んでいたら、どーも組めない。

本のとおりに作ったら値のない変数を参照しようとする。
本文で解説していることと式の内容が食い違う。
変数の範囲をどこからどこにすればいいかわかりにくい(これは自分のせいだが)。

いろいろ調べた結果、複数のサイトと記述が異なっていることが判明。
根本的な変数の定義が意味は同じでもメジャーなものでないとか、
HMMの状態の定義が少し異なるとか(開始・終了状態もHMMの状態に含んでいる)、
さらに式に誤植があったなんていうのもある。

ややこしすぎ。
で、結局朱鷺の杜Wikiの記述を使うことにした。

するとこれまで30行ほどかかっていた前向きアルゴリズムが10行程度に圧縮された。
なんだこりゃ。
まだ完成してないけど、他もかなり圧縮される気がする。

まぁ音声認識システムの解説を読んでたから朱鷺の杜Wikiの簡潔な記述でも理解できたのだが。
やっぱ教科書は間違ってて欲しくないな。

拍手[0回]

PR

ウェーブレット

現在、隠れマルコフモデル(HMM)についてお勉強中。
でもパラメータの推定に時間がかかる。HMMだめだめだ〜。
参考:HMM-SOMに基づく認知行動の獲得とその学習 4.3 セクション2

ってことで色々時系列を扱う方法を探しているわけだが、
今日はウェーブレット変換についてちょっと調べてみた。

フーリエ変換が全範囲に影響するサインコサインを使っているのに対し、
ウェーブレット変換は一部だけに存在する波形を拡大縮小&移動して近似するらしい。

しかも離散だとフーリエ変換より速いそうな。
これはいいかも。
HMM-SOMじゃなくてウェーブレット変換して、それをmnSOMっぽく扱ってみようかな。

ただ、数学苦手なんだよな〜。。。

あとはGenerative Topographic Mapping (GTM) も興味をひかれた。
これ、なに?なんかSOMと同じようなことができるらしいけど。
元の論文が英語だから読むのに一週間はかかるな〜。しんどい。

拍手[0回]

研究のこと。人工知能のこと。

今やってる研究の発端は
ジェフ・ホーキンスの「考える脳 考えるコンピューター」という本。

考える脳 考えるコンピューター考える脳 考えるコンピューター
(2005/03/24)
ジェフ・ホーキンス、サンドラ・ブレイクスリー 他

商品詳細を見る

いわゆる研究費を集めるための本ではあるが、初心者の興味を引くという点では十分な質。
これを読んで、実際の脳へ興味がわいたといっていい。

で、専攻科時代にこれを研究しようとしたわけだが、なにぶん基礎知識が足りなかった。
院に入ってようやく自由に研究ができるようになったのでこれを中心に研究予定。

以下、現在の研究の進行状況。

拍手[0回]

つづきはこちら


プラグイン

カレンダー

05 2025/06 07
S M T W T F S
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

カテゴリー

最新記事

最新CM

最新TB

プロフィール

HN:
東こうじ
性別:
男性

リンク

サイトマスター

アクセス解析

バーコード

RSS

ブログ内検索

アーカイブ

カウンター