Document OCR は生成 AI を活用しています。基盤モデルが迅速かつ正確に提供する仕組みをご確認ください。

OCR（光学式文字認識）

世界トップクラスの Google Cloud AI による OCR（光学式文字認識）

画像やドキュメントからテキストやデータを抽出し、非構造化コンテンツをビジネスにすぐに使える構造化データに変換し、価値ある分析情報を引き出します。

OCR 機能を API でアプリケーションに統合します。

今すぐデプロイデモをリクエストする

新規のお客様には、ドキュメント要約 OCR ソリューションへのお申込みに使用できる無料クレジット$300 分を、登録時に差し上げます。

概要

OCR とは何ですか。

光学式文字認識（OCR）は、入力、手書き、印刷されたテキストを画像からマシンでエンコードされたテキストに変換する基本的な技術です。

Google Cloud が提供する OCR はどのような種類ですか。

Google Cloud には、ドキュメントの OCR と、画像と動画の OCR という 2 種類の OCR があります。

Document AI は基本的なテクノロジーを共有していますが、ドキュメント処理向けに最適化されたドキュメント理解プラットフォームです。そのカスタムエクストラクタは生成 AI を活用しており、専用プロセッサを選択する必要なく、汎用ドキュメントとドメイン固有ドキュメントの両方を高精度かつ迅速に処理します。

Cloud Vision は、画像や動画からテキスト、手書き文字、さまざまなオブジェクトを検出するために広く使用されています。

Google Cloud での OCR の仕組みは。

Google Cloud は最高水準の AI で OCR を強化します。データを理解、整理、拡充することで、従来のテキスト認識にとどまらず、最終的にはビジネスですぐに使える分析情報を生成します。

OCR ツールを統合スイートとして使用して合理化された効率を実現することも（Document AI など）、Google Cloud コンソールで直接利用可能な関連 API を呼び出すだけで OCR 機能をアプリケーションに統合することもできる柔軟性が得られます。

動画

Document AI とは

4:36

Google Cloud AI と OCR の連携の仕組みは。

上記のすべての OCR ソリューションでは、事前トレーニング済みの ML モデルを利用できます。このモデルは、API を介して直ちにデプロイすることも、特定のニーズに対する精度を高めるためにアップトレーニングすることもできます。

AutoML では独自のカスタムモデルをトレーニングすることもできます。機械学習の専門知識は必要ありません。

カスタム ML モデルの構築については AutoML のドキュメントをご覧ください。

動画

AutoML で ML モデルを構築してトレーニングするタイミングと方法

2:11

最適な OCR ソリューションは。

ドキュメントを分析する場合や、自動化されたドキュメント処理パイプラインを構築する場合は、Document AI を使用します。これは、ドキュメントの理解から、ドキュメントと抽出されたデータの検索、保存、運営、管理まで、ワークフロー全体をすべて 1 か所で処理します。

画像を分析して処理する場合は、最良の結果を得るために Cloud Vision と他の Google Cloud プロダクトを併用します。詳細とクイックスタートガイドについては、一般的な使用方法のセクションを参照してください。

どちらの API も Google Cloud アカウントで無料で試用できます。

OCR サービスの比較

OCR サービス	最適な用途	主な機能
Cloud Vision API		低レイテンシと大容量を必要とする一般的なテキスト抽出のユースケース。	画像のラベル付け、顔検出、ランドマーク検出、OCR、セーフサーチなどの事前構築済み機能。
Document AI	Enterprise Document OCR	ドキュメント（PDF、画像としてスキャンしたドキュメント、Microsoft DocX ファイル）のテキストをデジタル化します。	200 以上の言語（50 の手書き言語）でテキストを抽出します。数式やスタイルなどを認識するためのアドオン。
	Document AI Workbench	生成 AI（基盤モデル）であらゆるドキュメントを抽出、分類、分割します	カスタムエクストラクタ: 基盤モデルを使用して、データの大規模なラベル付けやトレーニングなしでパーサーをすばやく作成します。処理を効率化するカスタム分類とドキュメントスプリッター。
	事前トレーニング済みモデル	ドメイン固有のドキュメントからのテキストとフィールドの抽出。	調達、融資、身分証明書、契約書など、さまざまなドキュメントにわたるテキストの抽出とデジタル化。

Cloud Vision API

最適な用途

主な機能

低レイテンシと大容量を必要とする一般的なテキスト抽出のユースケース。

画像のラベル付け、顔検出、ランドマーク検出、OCR、セーフサーチなどの事前構築済み機能。

Document AI

最適な用途

Enterprise Document OCR

主な機能

ドキュメント（PDF、画像としてスキャンしたドキュメント、Microsoft DocX ファイル）のテキストをデジタル化します。

200 以上の言語（50 の手書き言語）でテキストを抽出します。

数式やスタイルなどを認識するためのアドオン。

最適な用途

Document AI Workbench

主な機能

生成 AI（基盤モデル）であらゆるドキュメントを抽出、分類、分割します

カスタムエクストラクタ: 基盤モデルを使用して、データの大規模なラベル付けやトレーニングなしでパーサーをすばやく作成します。

処理を効率化するカスタム分類とドキュメントスプリッター。

最適な用途

事前トレーニング済みモデル

主な機能

ドメイン固有のドキュメントからのテキストとフィールドの抽出。

調達、融資、身分証明書、契約書など、さまざまなドキュメントにわたるテキストの抽出とデジタル化。

仕組み

ドキュメントを理解して処理するには、Document AI を使用します。

画像には Cloud Vision を使用することをおすすめします。

いずれを使用する場合も、API を介してそのままデプロイすることも、アップトレーニングすることもできる、事前トレーニング済みの機械学習モデルにアクセスできます。AutoML を使用して、独自のカスタムモデルをゼロからトレーニングすることもできます。ML の専門知識は必要ありません。

Cloud Vision または Document OCR を使用すると、毎月最初の 1,000 ユニットが無料になります。シンプルな API 呼び出しでお試しください。

Cloud Vision API を試す

Cloud Vision が画像を認識して分類する仕組み

デモ

ご自身のドキュメントを使用して Document OCR をご覧ください

簡単なドラッグ＆ドロップで Document AI API を試してみましょう。

一般的な使用例

生成 AI を使用してドキュメントからテキストを抽出します

Document AI で微妙なニュアンスを含むドキュメントから分析情報を引き出す

基盤モデルを活用した Document AI カスタムエクストラクタは、汎用的および分野固有のドキュメントからテキストとデータを迅速かつ正確に抽出します。わずか 5～10 個のドキュメントで簡単に微調整できるため、パフォーマンスがさらに向上します。

独自のモデルをトレーニングする場合は、基盤モデルを使用してデータセットに自動的にラベル付けを行い、本番環境への移行までの時間を短縮します。

事前トレーニング済みの専用プロセッサを使用することもできます。詳しくは、プロセッサの一覧をご覧ください。

Document AI API をデプロイする

2 人の講演者とその隣のイベント名「OCR と生成 AI がビジネスを強化する仕組み」

25:47

入門ガイド

Document AI で微妙なニュアンスを含むドキュメントから分析情報を引き出す

基盤モデルを活用した Document AI カスタムエクストラクタは、汎用的および分野固有のドキュメントからテキストとデータを迅速かつ正確に抽出します。わずか 5～10 個のドキュメントで簡単に微調整できるため、パフォーマンスがさらに向上します。

独自のモデルをトレーニングする場合は、基盤モデルを使用してデータセットに自動的にラベル付けを行い、本番環境への移行までの時間を短縮します。

事前トレーニング済みの専用プロセッサを使用することもできます。詳しくは、プロセッサの一覧をご覧ください。

Document AI API をデプロイする

25:47

お客様の事例

Mr. Cooper は Google AI を使用して住宅ローン処理をスピードアップ

Mr. Cooper は国内最大級の住宅ローン貸付業者で、さまざまな貸付商品や融資商品、サービス、テクノロジーを住宅所有者に提供することに力を入れています。

彼らは、Google の OCR テクノロジースタック上に、モジュラーアーキテクチャを備えたコンテナベースのドキュメント処理パイプラインを構築し、次の成果を達成しました。

- 重要なドキュメントの 95% の精度。

- ピーク時のスループットは 4,000 ページ/分、平均スループットは 2,000 ページ/分。

- ドキュメント処理の効率を 400% 向上。

事例紹介の全文を読み技術的な詳細情報を確認する

エンドツーエンドのドキュメントソリューションを構築します

パイプラインを処理および理解するドキュメントを構築します

生成 AI を搭載した Document AI は、さまざまなレイアウトや品質のドキュメントから高い精度でデータを抽出します。Cloud Storage と接続すれば、非構造化ドキュメントにエンタープライズクラスのコンプライアンスを確保できます。BigQuery を使用すると、抽出したデータのバッチ処理と分析を自由に行うことができます。Looker を使用すると、BigQuery テーブルに基づいて簡単に可視化できます。Vertex AI Search を使用すると、会話形式または従来の方法で、Cloud Storage 内のドキュメントに対してクエリを実行し、検索できます。

Document AI API をデプロイする

複数の Google Cloud プロダクトを使用した、エンドツーエンドのドキュメントソリューションのリファレンスアーキテクチャ

ハンズオンラボ: Document AI と Cloud Functions を使用してエンドツーエンドのデータキャプチャパイプラインを構築する

ご覧のようにパイプライン全体の設定には 60～90 分かかり、Document AI の部分には 10 分かかります。

入門ガイド

パイプラインを処理および理解するドキュメントを構築します

生成 AI を搭載した Document AI は、さまざまなレイアウトや品質のドキュメントから高い精度でデータを抽出します。Cloud Storage と接続すれば、非構造化ドキュメントにエンタープライズクラスのコンプライアンスを確保できます。BigQuery を使用すると、抽出したデータのバッチ処理と分析を自由に行うことができます。Looker を使用すると、BigQuery テーブルに基づいて簡単に可視化できます。Vertex AI Search を使用すると、会話形式または従来の方法で、Cloud Storage 内のドキュメントに対してクエリを実行し、検索できます。

Document AI API をデプロイする

ハンズオンラボ: Document AI と Cloud Functions を使用してエンドツーエンドのデータキャプチャパイプラインを構築する

ご覧のようにパイプライン全体の設定には 60～90 分かかり、Document AI の部分には 10 分かかります。

画像のタグ付け、処理、検索

Cloud Vision API と AutoML を使用して、画像のタグ付けと処理を行う

画像のタグ付けは、画像のラベル付けとも呼ばれます。

Cloud Vision API を使用すると、画像内の一般的な物体、ランドマーク、場所、ロゴ、活動、動物の種類、商品などを識別してラベルを付けることができます。検出されたラベルで画像がタグ付けされると、画像の検索、処理、管理が自動化され、容易になります。

ターゲットを設定したカスタムラベルが必要な場合は、Cloud AutoML を使用してカスタム ML モデルをトレーニングします。

Google OCR テクノロジーをオンプレミスで使用するには、Cloud Marketplace で入手できる OCR On-Prem を使用します。

Cloud Vision API をデプロイする

他の Google Cloud プロダクトと連携して画像を分析する autoML と Cloud Vision AI を示すアーキテクチャ図

入門ガイド

Cloud Vision API と AutoML を使用して、画像のタグ付けと処理を行う

画像のタグ付けは、画像のラベル付けとも呼ばれます。

Cloud Vision API を使用すると、画像内の一般的な物体、ランドマーク、場所、ロゴ、活動、動物の種類、商品などを識別してラベルを付けることができます。検出されたラベルで画像がタグ付けされると、画像の検索、処理、管理が自動化され、容易になります。

ターゲットを設定したカスタムラベルが必要な場合は、Cloud AutoML を使用してカスタム ML モデルをトレーニングします。

Google OCR テクノロジーをオンプレミスで使用するには、Cloud Marketplace で入手できる OCR On-Prem を使用します。

Cloud Vision API をデプロイする

参考情報

料金の例

右側に示されているラベルを検出する基本的な画像処理パイプラインを実行する場合、月額費用は $27.36 になります。

この数値に到達するまでの想定使用量は、料金計算ツールで確認できます。

毎月最初の 1,000 ユニットは無料です。

より複雑な設定の費用については、Google までお問い合わせください。

お客様の事例

AutoML により、科学者が海岸線の変化を予測し追跡する

テキサス A&M 大学の研究者は Cloud AutoML を使用して、24 コンピューティング時間で 10,458 枚の海岸線画像を使用して、マルチラベルデータセットモデルをカスタムトレーニングすることができました。このモデルによって、研究者は平均精度 95.2% で海岸線の変化を予測し、追跡することができました。

AutoML は、トレーニング画像を使用して高度なモデルをトレーニングする柔軟性を高め、チームが直感的な UI でデータを検査して結果を分析できるようにし、スケーラブルなサービングのための API を提供します。

事例紹介の全文を読み技術的な詳細情報を確認する

画像からテキストを抽出する

Cloud Vision API を使用して画像からテキストを抽出する

Cloud Vision API を使用すると、さまざまな言語の画像からテキストや手書き文字を検出して抽出できます。また、マルチリージョンをサポートしており、大陸レベルのデータストレージや OCR 処理を指定できます。

少数の画像（リクエストごとに最大 16 件）を選択してすぐに結果を取得するか、多数の画像（リクエストごとに最大 2,000 件）を非同期でバッチ処理して後で結果を取得するかを選択できます。

Cloud Vision API をデプロイする

入門ガイド

Cloud Vision API を使用して画像からテキストを抽出する

Cloud Vision API を使用すると、さまざまな言語の画像からテキストや手書き文字を検出して抽出できます。また、マルチリージョンをサポートしており、大陸レベルのデータストレージや OCR 処理を指定できます。

少数の画像（リクエストごとに最大 16 件）を選択してすぐに結果を取得するか、多数の画像（リクエストごとに最大 2,000 件）を非同期でバッチ処理して後で結果を取得するかを選択できます。

Cloud Vision API をデプロイする

参考情報

料金の例

右側に示されている画像からテキストを抽出する基本的な処理パイプラインを実行する場合、月額費用は $27.36 になります。

この数値に到達するまでの想定使用量は、料金計算ツールで確認できます。

毎月最初の 1,000 ユニットは無料です。

より複雑な設定については、Google までお問い合わせください

料金

ユースケースの費用はいくらですか。	ユースケースを解決するための月額費用を把握し、必要なプロダクトと主な利用条件を提示します。
使用例	使用するプロダクト	利用条件	推定月額費用（米ドル）
画像のタグ付け、処理、検索	Cloud Vision Cloud Storage Pub/Sub Cloud Run	1. 毎月 15,000 回の Cloud Vision ラベル検出 API 呼び出し 2. 100 GiB の月間保存容量 3. 1.25 GiB CPU 1 個 4. Pub/Sub を介して毎日 4 GiB をパブリッシュする電卓で計算の詳細を表示する	$27.36
ドキュメントからテキストと分析情報を抽出する	Document AI Cloud Storage BigQuery Cloud Functions	1. Document AI のフォームパーサー API 呼び出しが毎月 1,000 回 2. 100 GiB の月間保存容量 3. 1 TiB の月次クエリ 4. RAM: 512 MB、CPU: 800 MHz 電卓で計算の詳細を表示する	$71.87
画像からテキストを抽出する	Cloud Vision Cloud Storage Pub/Sub Cloud Run	1. Cloud Vision OCR の API 呼び出しが毎月 15,000 回 2. 100 GiB の月間保存容量 3. 1.25 GiB CPU 1 個 4. Pub/Sub を介して毎日 4 GiB をパブリッシュする電卓で計算の詳細を表示する	$27.36

Document AI、Vision API、AutoML の単価の詳細を確認します。

ユースケースの費用はいくらですか。

ユースケースを解決するための月額費用を把握し、必要なプロダクトと主な利用条件を提示します。

画像のタグ付け、処理、検索

使用するプロダクト

Cloud Vision

Cloud Storage

Pub/Sub

Cloud Run

利用条件

1. 毎月 15,000 回の Cloud Vision ラベル検出 API 呼び出し

2. 100 GiB の月間保存容量

3. 1.25 GiB CPU 1 個

4. Pub/Sub を介して毎日 4 GiB をパブリッシュする

電卓で計算の詳細を表示する

推定月額費用（米ドル）

$27.36

ドキュメントからテキストと分析情報を抽出する

使用するプロダクト

Document AI

Cloud Storage

BigQuery

Cloud Functions

利用条件

1. Document AI のフォームパーサー API 呼び出しが毎月 1,000 回

2. 100 GiB の月間保存容量

3. 1 TiB の月次クエリ

4. RAM: 512 MB、CPU: 800 MHz

電卓で計算の詳細を表示する

推定月額費用（米ドル）

$71.87

画像からテキストを抽出する

使用するプロダクト

Cloud Vision

Cloud Storage

Pub/Sub

Cloud Run

利用条件

1. Cloud Vision OCR の API 呼び出しが毎月 15,000 回

2. 100 GiB の月間保存容量

3. 1.25 GiB CPU 1 個

4. Pub/Sub を介して毎日 4 GiB をパブリッシュする

電卓で計算の詳細を表示する

推定月額費用（米ドル）

$27.36

Document AI、Vision API、AutoML の単価の詳細を確認します。

料金計算ツール

必要なすべてのツールを 1 か所に集めて、プロジェクトの費用を見積もります。

費用を見積もる

カスタム見積もり

セールスチームにご相談いただき、組織固有のニーズに応じたカスタム見積もりを入手してください。

見積もりをリクエストする

概念実証を開始する

OCR（光学式文字認識）

世界トップクラスの Google Cloud AI による OCR（光学式文字認識）

OCR ハイライト

OCR とは何ですか。

Google Cloud が提供する OCR はどのような種類ですか。

Google Cloud での OCR の仕組みは。

Google Cloud AI と OCR の連携の仕組みは。

最適な OCR ソリューションは。

ご自身のドキュメントを使用して Document OCR をご覧ください

生成 AI を使用してドキュメントからテキストを抽出します

Document AI で微妙なニュアンスを含むドキュメントから分析情報を引き出す

Mr. Cooper は Google AI を使用して住宅ローン処理をスピードアップ

入門ガイド

Document AI で微妙なニュアンスを含むドキュメントから分析情報を引き出す

お客様の事例

Mr. Cooper は Google AI を使用して住宅ローン処理をスピードアップ

エンドツーエンドのドキュメント ソリューションを構築します

パイプラインを処理および理解するドキュメントを構築します

入門ガイド

パイプラインを処理および理解するドキュメントを構築します

画像のタグ付け、処理、検索

Cloud Vision API と AutoML を使用して、画像のタグ付けと処理を行う

料金の例

AutoML により、科学者が海岸線の変化を予測し追跡する

入門ガイド

Cloud Vision API と AutoML を使用して、画像のタグ付けと処理を行う

参考情報

料金の例

お客様の事例

AutoML により、科学者が海岸線の変化を予測し追跡する

画像からテキストを抽出する

Cloud Vision API を使用して画像からテキストを抽出する

料金の例

入門ガイド

Cloud Vision API を使用して画像からテキストを抽出する

参考情報

料金の例

料金計算ツール

カスタム見積もり

概念実証を開始する

新規のお客様には、Google Cloud プロダクトをお試しいただける無料クレジットを最大 $300 分差し上げます

大規模なプロジェクトがある場合は、

OCR ソリューションとユースケースのコードサンプルを見る

Cloud Vision API でラベルを検出する方法を確認する

Google AI でドキュメント処理パイプラインを自動化する方法を確認する

エンドツーエンドのドキュメントソリューションを構築します