文字認識アプリ

プログラム Driveリンク
GitHub
実行結果 実行結果リンク
使用言語など Python,Flask,Flutter,Firebase
作成経緯 大学の講義を聞く際に、iPhoneを用いて板書の写真を撮り、撮った写真を見てノートを書いたり写真から文字起こしをすることが多かった。そのため、写真から文字認識を行うアプリを自分でも作ってみたいと思うようになったためこのアプリを作成した。
また、Flutterを用いてアプリ開発を行いたいと考えていたことから、このアプリの作成にFlutterを使用した。
内容 大まかな流れは以下のようになっている。
Flutter側1:
写真をFlutterで作成したフロントエンド画面で受け取り、受け取った写真をbase64に変換してAPI経由でFlaskサーバーに渡す
Flask側:
API経由で受け取ったbase64データを画像に戻し、OCR(光学的文字認識)処理を行うpyocrライブラリを用いて文字認識を実行し、認識結果の文字列をFlutter側に返す
Flutter側2:
Flask側から返された文字列をweb画面上に文字列を表示する

また、Flutterで作成したフロントエンド画面はFirebaseのHostingでデプロイを行い、FlaskサーバーはPyinstallerライブラリを用いてexeファイルとしている。
OCRモデルを自身で構築し、実装を行ったが標準ライブラリのpyocrよりも精度が低かったため、引き続きpyocrを採用した。

<< 前のページに戻る