BETA

日本語OCRサービスサイトを作りました

投稿日:2018-10-17
最終更新:2018-10-24

日本語OCRサービスを作りました

こつこつ作って一ヶ月。ついにWEBサービスがリリースできました。 OCRusion | 日本語OCRサービス

自炊した小説のような日本語の書かれた画像をアップすると、自動的にテキスト形式に変換してくれます。

誰も使ってくれないので寂しいので使ってやってください

構成

今回は多種多様なフレームワークを利用しています。

  • Laravel 5.7
  • Materialize 1.0
  • Vue
  • Vuetify

マテリアルデザインでフロントを構成し、バックエンドはPHPのLaravelを使用しています。 肝心要のOCR処理は、Google Cloud Visionを使用しています。

仕様

今は閑散としているためアクセス数ほぼゼロという状況なのですが、万一アクセスが複数重なってしまうと、Google側に規制されてしまいます。

Googleの仕様では、Base64エンコードされた画像データは8MB以下で、一リクエストに処理される画像数は16枚としています。 サーバーの負荷も考えると、sleepを挟みながらアクセスすることになります。

さすがにGoogleさんなら平気でしょうが、アクセスの重複を防ぐためにAPIを使用しているかチェックもしています。

OSS

Ocrusionはオープンソースソフトウェアです。 プルリク歓迎しております。

っていうか誰か使ってください

技術ブログをはじめよう Qrunch(クランチ)は、プログラマの技術アプトプットに特化したブログサービスです
駆け出しエンジニアからエキスパートまで全ての方々のアウトプットを歓迎しております!
or 外部アカウントで 登録 / ログイン する
クランチについてもっと詳しく

この記事が掲載されているブログ

@devinoue'の技術ブログ

よく一緒に読まれる記事

1件のコメント

ブログ開設 or ログイン してコメントを送ってみよう
10/19 13:02

今は閑散としているためアクセス数ほぼゼロという状況なのですが、万一アクセスが複数重なってしまうと、Google側に規制されてしまいます。 sleepを挟みながらアクセスすることになります。

LaravelのJob にしてキューイング、ワーカーに処理させて結果ページに表示する(Pusherとかで通知する)。 と言う風にすると問題が解決できると思います。

目次をみる
技術ブログをはじめよう Qrunch(クランチ)は、プログラマの技術アプトプットに特化したブログサービスです
or 外部アカウントではじめる
10秒で技術ブログが作れます!