前回ではコンピュータービジョンの書籍を購入してみましたが、現時点ではまだ内容を満足に理解できそうにないので新しい方法を試してみました。たまたまUdemyというサイトでセールをやっていたので、OpenCVの単語で検索して一番トップにでたコースを受けてみることにしました。
座学的な部分では顔検出のアルゴリズムから、具体的な検出方法やトレーニングの方法を学んでから、OpenCVを使って実際にプログラムを動作させていく方法について学ぶという形式のようです。まだ最初の章なので、おそらくこちらはありがたいことに数学の知識がそこまでなくても動画を交えた説明だと理解しやすかったです。
実際のプログラムを動かすところについてはPythonの統合環境であるAnacondaを用いるのですが、これが動画で紹介されている方法が古かったのか、動画の内容通りにはできず戸惑いました。幸いUdemyの内部では利用者も多く、似たようなトラブルの質問にもすぐに回答が返っていたりするため多少内容が古くても検索にヒットすれば問題なく取り組める気がします。
Anacondaの新しい環境を作成する方法は以下のとおり:
- Anaconda Navigatorを起動する
- メニュー左側のEnvironmentsを選択する
- Create(+アイコン)をクリックする
- 任意のNameを入力し、PackagesでPython 3.5を選び、Createをクリックする
- メニュー左側のHomeを選択する
- CMD.exe PromptのInstallをクリックする
- コマンドプロンプト画面で
pip install torchvision
を入力する - 続けて
pip install opencv-python
を入力する
普段はLinuxで作業するのほうが楽なのですが、どうにもうまくいかなかったので途中からWindowsに乗り換えて、PytorchとOpenCVをインストールしてなんとか課題に取り組むことができました。他にも最初の章はウェブカメラを使うので、USB接続のウェブカメラがたまたますぐ見つかったのでよかったです。
実際のコードの解説はわかりやすいものの、少々物足りませんでした。内容はおそらく理解できていると思うのですが、肝心のパラメータの値はあまり言及がなかったのと、章の終わりに宿題形式で課題が出されるのですが、たまたまほぼ答えに近い内容がネットに紹介されていたからよかったものの、ほぼ何の解説もないままに取り組まなければいけなかったことが不満でした。当初のやりたいことから遠ざかっている気もしますが、今はこの調子で続けていきたいと思います。