googleで画像からOCRしてもらおう!

誰もが日々お世話になっているGoogleセンセイですが、画像から文字を読み取るOCRをすることができます。
そのサービスの名はGoogle Cloud Vision API。
このサービス自体は有料なのですが、超ウルトラスーパー使えるもので、いっときアプリ開発を志していたとき使って見たのですが、その精度たるや感動ものでした(言い過ぎ?w)

その時やりたかったのは、スマホから撮った画像をアップロード→OCR→翻訳という流れ。
まあ、ご存知の方は「そんなもんGoogleの基本サービス組み合わせたらできるやないか」と思われるでしょうが、違うの。ワンクリックで実装したかったの!
(結果的には成功したのですが、事業化まではしなかったということです。)

基本的にこのGoogle Cloud Vision API は、定められたURIにパラメータを付して送ればjsonでレスポンスしてもらえるという仕組みです。大体公開されているAPIはそんな感じですか。その受け取ったjsonを解析して目的に使用すると、あら便利!となるわけですね。

よくわからないという方のために、超簡単にいうと。
https://(定められたURI)+(APIキー)+(OCR化したい画像データ)
これを送れば、(OCR化したテキストデータ)をホレッと画面に表示してくれる

簡単に言えばこんな感じ。

Googleセンセイすごいっすよ。

次回があれば、もう少し詳しくやります。




コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です