Gyazo を画像認識でタグ付けする

Gyazo を画像認識でタグ付けする

OCR 機能によって、Gyazo は画像に含まれる文字をもとに検索できる。
しかし、画像は言語・非言語に両対応なものだと思うので、できれば画像の特徴をもとに検索をしたい。

Gyazo るときに画像解析をして、タグ付けしてみる。
Gyazo for Linux をフォークして Google Cloud Vision API を叩く。


しばらくの間使ってみて、web detection の効果とコストを調べてみる。
2021/10/12 ~
割高だと予想している。hata6502
しばらくの間、スマホではなく Ubuntu PC で動画を観ることになりそうだ。
2021/12/10
まだ画像認識の精度は良いとは言えない。
どうしても「tree」や「paper」のような、曖昧すぎる認識結果になってしまう。
風景写真であれば曖昧なタグ付けでも実用的かもしれない。
しかし、Gyazo では GPS による位置情報なども使っており、こちらのほうが実用的だと思った。


スーパーマリオカートを認識できた。

アニメを Gyazo ったら、ちゃんと LOONEY TUNES CARTOONS として認識された。

砂漠を「饒河街観光夜市」と誤認識した。

文字が多いスクショだと、「diagram」のような曖昧なタグが付く。

「cartoon」のような曖昧なタグでも便利だったりする。
cartoon タグをクリックすると、アニメの画像がたくさん見つかる。

Google は pink panther を知らないようだ。
2021/10/17 pink panther に出てくるカラスの画像を Gyazo ったらうまくいった。
画風を認識しているのだろうか?

ひつじのショーンをヤギと誤認識した。

画像認識で得られたラベルには、スコアも付与されている。
確信度、信用度みたいな指標。
0.6 以上合格でフィルタリングするとよさそう。
0.8 以上だと厳しすぎてタグが付かない。
Powered by Helpfeel