本事例のポイント
-課題:
・書類/帳票をデータ化するAI-OCRを活用したソリューションの開発
・様々なクライアントの要望に応えるための、汎用性の高いAI-OCRが欲しい
・今使用しているOCRより高い認識精度が必要
-期待:
・クライアントが持つ大量の間取り図などを正確に読み取りデータベース化したい・認識精度の向上
・開発要件や使用用途に合わせて最適なOCRを選びたい
-成果:
・人の目でも間違いやすい文字や記号を判別し、正しくデータ化が可能に
・API連携により開発工数を削減しながらクライアントの求めるソリューション開発が実現
・数多くのクライアントの課題解決が可能に
Lightblue Technologyとは?
東京大学のメンバーを中心に2018年に設立された、AIスタートアップ企業。主軸となるプロダクトは、「人にフォーカスした画像解析・ヒューマンセンシング」と「情報抽出に特化した言語処理・texta」。
あらゆる社会課題に対して最先端デジタル技術を駆使した解決方法を模索し、開発・支援している。
国内最高水準レベルの技術力にこだわり、「リアルの現場での課題をシステムで解決する」という目標のもと、顧客価値の最大化を図っている。
「約3,000部屋の間取り図をデータベース化し、検索したい」クライアントのオーダーに応えたい
谷口さん :
株式会社Lightblue Technologyは、「先端技術を用いて労働環境を向上させる」をミッションに掲げるAIスタートアップ企業です。AIを用いた画像解析や情報収集の技術とあらゆるテクノロジーを組み合わせ、企業の課題を解決するためのソリューションを開発・提供しています。
AIやテクノロジーに明るい会社という認識のおかげで、クライアントからは「こういう業務を効率化できない?」というご相談を多くいただきます。LINE WORKS OCRの導入も、そのようなお声がけがきっかけでした。
最初のプロジェクトのクライアントは、建設業界の企業様です。ご要望は「過去に建設した建物の図面をデータ化し、検索できるようにしたい」とのこと。住宅情報誌などでよく見る「間取り図」、あれにさらに詳細な情報が載っているような図面だったのですが、それら約3,000戸分の情報を読み取ってデータベース化することで、似たような間取りの不動産を検索できるようにしたいとのご相談でした。
OCRの技術を活用すれば解決できそうな課題であり、会社としても僕自身としても知見がある分野だったため、「可能だろう」と判断して着手しました。ただ一点だけ気になっていたことが、OCRの認識精度です。
実は、この段階ではまだ他社のOCRを導入していました。「あらかた読み取りはできているが、これ以上の認識精度向上は見込めないだろう」と思っていたため、そこをどうカバーして実現まで漕ぎ着けるかが、我々の課題となりました。
そんな時に、弊社の社長が「(当時の)LINEのOCR技術の性能が良いらしい」との噂を聞いたことから、LINE WORKS OCRの存在を知りました。LINEアプリで個人が利用できるOCRの認識精度は社内でも話題になったことがあり、僕自身も使ってみてその精度の高さに驚いた経験があります。
でも、法人向けのAI-OCRをLINEが提供していることは知らなかったんですよね。
早速お問い合わせをさせていただいて、「まずは使ってみよう」とフリープランでお試しをさせていただきました。建物の図面の読み取りをいくつか試してみたところ、それまで使っていた他社のOCRとは比較にならないほど読み取り精度が高かった。結果、即導入決定となりました。
認識精度も高く、開発工数を減らす汎用性の高いLINE WORKS OCRがソリューション開発の幅を広げる
谷口さん :
LINE WORKS OCRを導入するにあたり、すでに導入していた他社のOCRと、もう一社ローカル環境で活用できるOCRを提供する会社と3社で比較検討しました。
コスト面で考えれば、ローカル環境で活用できるOCRの方がランニングコストがかからず魅力的です。
しかし、こちらは認識精度が高くなく、プロジェクトには不向きだと判断しました。
LINE WORKS OCRは、最初のテストですでに「これだ!」と思えるほど認識精度が高かったことが、導入の一番の決め手です。
文章の読み取りはもちろんですが、句読点の認識や、0(ゼロ)とo(オー)など人の目でも間違えやすい数字とアルファベットの認識、一つひとつ単語として判別できる認識精度には驚きました。
書類が横向きになっていても、きちんと読み取りができたところも、他社より優れていたと思います。
また、使用用途に合わせて読み取りたい書類や使用用途に合わせたプランから選べたことも、メリットでしたね。
LINE WORKS OCRのサービスプランについて
定型の書類を読み取る「Templete」、請求書やレシートに特化した高い認識・分類精度の「特化型」、
文書様式に囚われない非定型の全ての文字をデータ化する「General」の3プランを提供
建設業界の図面の読み取りには非定型の「General」を選びました。
書類や画像内にある文字すべてをデータ化できるので、文字情報をデータベース化すれば、その後自分たちが活用したい形を作りやすかったんです。
また、API連携のおかげでシステム連携が簡単、カスタマイズもしやすく、OCRでデータ化された後の構築がしやすいところも、目的にあっていました。認識精度が高いので、開発の工数もかなり減らすことができてありがたかったですね。
弊社はクライアントが必要としている形でソリューションを開発する身なので、選択肢があることがとても助かるんですね。API連携が可能、かつパッケージ化されていないことで、自分たちに必要な形にカスタマイズできる自由度の高さがある。
導入検討から1カ月で導入決定というスピード感を持ったお取り組みでしたが、社内から反対の声が上がることはなかったです。
他では見かけないレシートや領収書に特化したAI-OCR。その特性を活かし、税理士事務所向けの新たなプロジェクトが始動
谷口さん :
建設業界のプロジェクトは、この夏に第一弾が無事完了しました。3,000枚の図面をデータ化しクライアントさんにお渡ししたところ、「想像以上に精度高くデータ化できているし、スムーズに検索ができるね」と、お褒めの言葉をいただきました。
実際、間取りや面積の情報はほぼ100%認識できていますし、廊下や部屋といった図面の構造部分の読み取りも90%以上の精度で読み取りができ、人の手での修正も少なかった印象です。
クライアントさんの要望を満たすソリューションが開発できたことに、一安心しているところですね。
今後も引き続き、一定期間ごとにまとめて図面をお預かりして、データ化していくことになっています。
そして、今新たに取り組んでいるのが、税理士事務所からのご依頼です。
膨大な量のレシートや領収書を一気にデータ化できるシステムを構築したいとのことで、請求書特化型のOCRの導入相談をしています。
このプロジェクトに関しては、そもそも請求書やレシートに特化したOCRというものが他に見当たらなかったため、LINE WORKS OCR一択でした。
さまざまな形式で数多くの種類があるレシート・領収書や請求書は、それに対応できる認識精度が求められます。
特化型であれば、レシートならレシート、領収書なら領収書の項目毎に金額などの情報を読み取り、項目分類もしてくれるため、以前使った非定型の「General」ではなく「特化型」で検討しました。
このソリューションが実現した暁には、バックオフィス業務の入力作業を削減し、短時間で大量にデータ化することで業務効率化が期待できます。
実際にテストしてみたところ、レシートは特に読み取り精度が高いですね。
税の情報や税込か否か、金額以外の明細に記載されている情報も取得でき、想像以上の認識精度でした。
LINE WORKS OCRの技術と、弊社で培ってきた知見を掛け合わせて、より多くの方の業務効率化を促せるソリューションを生み出していくべく、これから改善を重ねていきます。
LINE WORKS OCRと出会い、これまで以上にクライアントのニーズに応えやすくなった
谷口さん :
「業務の効率化」これは、多くの業界で求められていることです。
実は、LINE WORKS OCRに出会えたことで、導入以前は実現できなかったソリューションも実現可能になるのではと期待しています。
それは工場での備品検査に関するご相談で、シールに書かれた文字情報を自動で読み取り、定期的に調査できないかというものでした。当時は認識精度の問題で難しいと判断しましたが、LINE WORKS OCRの高い認識精度を持って改めて挑戦してみる価値があるのかな、と感じています。
LINE WORKS OCRの技術を用いてシステムを作り込むことで、実用化されていくバリエーションも増えましたし、いちエンジニアとしては「開発できるソリューションが増えた」とワクワクしています。
僕たちは、AIテクノロジーの力を用いた業務効率化によって、人々の仕事を奪いたいわけではありません。「人々が働きやすい環境」を、整えたいのです。
これまでLightblue Technologyでは建築や製造、広告、人材、あらゆる分野での業務効率化と向き合ってきました。昨今DX化やAI導入が進んでいると言われてはいますが、すべての業種において均等に進んでいるかというと、まだそうとは言い切れないですよね。
業種差や地域差が生まれていたり、ITリテラシーの有無などによりテクノロジーを活用しきれていない現場が多く存在していることは、一つの事実です。この分断を、どうしたら止められるのか。僕たちは、DX化が難しいと思われている現場にこそ、“デジタルを感じさせない”テクノロジー体験を生み出すことにチャレンジしていきたいと思います。
我々が現場の業務効率化を推進していくことで、DX化が進む場所と遅れる場所のギャップを少しでも埋めることができれば。そう思いながら、日々開発に取り組んでいます。
Lightblue Technologyは「テクノロジーでワクワクする人を増やす」ために、これからもクライアント様目線に立って、柔軟なソリューション開発を続けていきます。
LINE WORKS OCRの5つの導入利点
-人の目でも間違いやすい文字や記号を判別し、正しくデータ化。
-自社サービスとの組み合わせにより、提供価値が向上。
-開発要件、使用用途に合わせたプランから選べる。
-API連携なので開発工数が削減しやすい。
-幅広くクライアントのニーズに応え、新規顧客獲得につながる。
※掲載している内容(製品名含む)、所属やお役職は取材を実施した2021年11月当時のものです。