誰もが日々お世話になっているGoogleセンセイですが、画像から文字を読み取るOCRをすることができます。
そのサービスの名はGoogle Cloud Vision API。
このサービス自体は有料なのですが、超ウルトラスーパー使えるもので、いっときアプリ開発を志していたとき使って見たのですが、その精度たるや感動ものでした(言い過ぎ?w)
その時やりたかったのは、スマホから撮った画像をアップロード→OCR→翻訳という流れ。
まあ、ご存知の方は「そんなもんGoogleの基本サービス組み合わせたらできるやないか」と思われるでしょうが、違うの。ワンクリックで実装したかったの!
(結果的には成功したのですが、事業化まではしなかったということです。)
基本的にこのGoogle Cloud Vision API は、定められたURIにパラメータを付して送ればjsonでレスポンスしてもらえるという仕組みです。大体公開されているAPIはそんな感じですか。その受け取ったjsonを解析して目的に使用すると、あら便利!となるわけですね。
よくわからないという方のために、超簡単にいうと。
https://(定められたURI)+(APIキー)+(OCR化したい画像データ)
これを送れば、(OCR化したテキストデータ)をホレッと画面に表示してくれる
簡単に言えばこんな感じ。
Googleセンセイすごいっすよ。
次回があれば、もう少し詳しくやります。