AI分類

ShieldのAI分類は、Shield Proアドオンの一部としてのみ利用可能です。 BoxのAI分類は、コンテンツを評価して分類し、適切な分類ラベルを自動的に適用するのに役立ちます。 AI分類は、既存の分類ポリシーと併用できます。例えば、特定の情報の種類やファイル拡張子の検出に使用された自動分類ポリシーを維持したまま、AI分類を使用して、特定のデータの種類やキーワードでは簡単に識別できなかったより幅広いコンテンツにラベルを付けることができます。企業ごとに許可されるAI分類ポリシーは1つです。 Box AIを使用してコンテンツを分類するには、以下の手順に従う必要があります。

分類に対応するテキストファイルの種類

AI分類では、以下のすべての拡張子に関してファイル内のテキストをスキャンします。


拡張子	テキスト抽出の上限
as、as3、bat、boxcanvas、boxnote、cmake、css、diff、doc、docx、gdoc、gslide、gslides、haml、htm、html、key、less、log、make、md、mm、msg、odp、odt、pages、pdf、ppt、pptx、properties、rst、rtf、sass、scm、script、sh、sml、txt、vi、vim、webdoc、wpd、xbd、xdw、xhtml、xml、xsd、xsl	2 MB
asm、c、cc、cpp、cs、csv、cxx、erb、groovy、gsheet、h、hh、java、js、json、m、ml、php、pl、py、rb、scala、sql、ods、xls、xlsm、xlsx、yaml	100 KB

AI分類では、ファイルの種類に応じて、サポートされるテキスト抽出のサイズが異なります。通常、ファイル内のテキストの量はファイルのサイズより小さくなります。例えば、20 MBのPowerPointファイル (.ppt) には、評価のために抽出できるテキストが200 KB含まれていることがあります。 Boxでスキャンされるのは、テキスト抽出の上限までです。例えば、テキスト抽出が2 MBを超えるPDFファイルの場合、AI分類ポリシーは、最初の2 MBのテキストが分類ポリシーで指定された条件を満たしているかどうかに基づき分類します。

注: Boxの自動分類は、光学式文字認識 (OCR) をサポートしていません。そのため、スキャンされたPDF内のテキストやテキストベースのファイルに埋め込まれた画像 (PPTの画像など) 内のテキストを抽出することはできません。

分類に対応する画像ファイルの種類

サポートされる画像ファイルの種類は以下のとおりです。 ai、bmp、cr2、crw、dng、eps、gif、heic、indd、idml、indt、inx、jpeg、jpg、nef、png、ps、psd、raf、raw、svg、svs、tga、tif、tiff、webp 画像から表示テキストを抽出する従来型のOCRとは異なり、AI分類では、画像全体 (その画像内のテキストおよびオブジェクトを含む) を分析し、単にテキストの内容だけでなく、コンテンツの意味を判定します。

注: AI分類で使用される画像のバージョンは、最大2048 x 2048ピクセルです。つまり、元の画像のサイズがさらに大きかった場合は、非常に小さい部分や細かい部分が表示されない可能性があり、これが分類結果に影響することがあります。

AI分類ポリシーの上限

ラベル全体で、すべての条件を組み合わせた合計サイズの上限は25,000バイトです。この上限は言語によって異なります。サポートされる文字数の概算を以下に示します。

言語	文字数
英語	25,000
日本語	8,500
フランス語	23,000
中国語	8,500
韓国語	8,500

AI分類ポリシーの作成

管理者および以下の権限を持つ共同管理者は、AI分類ポリシーを作成、変更、削除できます。

会社のメタデータテンプレートを作成、編集する
会社のShieldダッシュボードを表示する
会社のShield構成を作成、編集、削除する

AI分類ポリシーを作成するには、以下の手順に従います。

管理コンソールに移動します。
[分類] を選択します。
[作成] を選択した後、ドロップダウンオプションから [AI分類ポリシー] を選択します。

注: このオプションは、AI分類ポリシーがすでに構成済みで、分類ポリシーのリストに記載されている場合は表示されません。

分類ラベルを選択し、分類するコンテンツの種類に関する詳細情報を入力します。例えば、内部の分類には、給与記録、履歴書、ポリシードキュメントなどのコンテンツが含まれる場合があります。

分類ラベルは、説明ボックスの上にある [X] を選択すると、削除できます。

必要に応じて、最大10ファイルを使用してテストと繰り返し適用を実行します。
ポリシーの設定で [すべてのフォルダに適用する] または [選択したフォルダのみ] を選択します。
競合の処理の動作を選択します。
[次へ] をクリックします。
[下書きとして保存] または [有効化] をクリックします。 [有効化] を選択すると、分類ポリシーは、分類のイベントでトリガーされるファイルに対して適用されます。

注:

EIDあたりの分類ポリシー数の上限は50です。 AI分類ポリシーはこの上限に含まれます。
自動分類ポリシーが複数ある場合は、デフォルトで、AI分類ポリシーの優先順位が最後に設定されます。これは、優先順位の変更によって変更可能です。
企業ごとに許可されるAI分類ポリシーは1つです。
コンテンツは、ポリシーが有効になった場合のみ、先を見越してスキャンされます。

テストと繰り返し適用

テストファイルを選択することで、期待どおりの分類結果が表示されることを確認し、必要に応じて条件を変更することができます。一度に選択できるのは10ファイルまでです。ファイルが選択されると、選択された入力を使用してプロンプトが作成され、AIに送信されて各テストファイルが評価されます。 AI分類ポリシーの作成手順に従って手順5まで進んだ後、以下の手順を実行します。

[テストと繰り返し適用] セクションで [ファイルを選択] をクリックします。
テストするファイルを最大10個選択します。
提供されるガイダンスに基づいて分類が適用された状態で、テストの結果が表示されます。 AIがそのラベルを選択した理由が示されます。

分類が指定されない場合は、分類が適用されなかったことを正当化する理由が示されます。 Box AIがファイルを分類できない一般的な理由は以下のとおりです。

ファイルがもう存在しない可能性がある。
ファイルからテキストを抽出できない (AIは、抽出可能なテキストを含むコンテンツでのみ動作する)。
ファイルが空である。

テストを再実行するには、アップロード済みファイルの上にある円形の矢印を選択します。これは、分類ラベルの説明の入力をリファインした後に特に役立ちます。セクションの下部にある [クリア] を選択して、テストの結果を削除します。

AI分類ポリシーの設定

フォルダの条件


設定	説明
すべてのフォルダに適用する	ポリシーは、社内のすべてのフォルダにあるファイルに適用されます。
選択したフォルダのみ	ポリシーは、選択したフォルダとそのすべてのサブフォルダ内のファイルのみに適用されます。フォルダを選択するには、次の手順に従います。 1. [フォルダを選択] をクリックします。 2. 検索語句を入力し、Enterキーを押します。 3. 1つ以上のフォルダを選択します。 4. [保存] をクリックします。

競合の処理

コンテンツに既存の分類ラベルが適用されている場合の競合に対するAI分類ポリシーの動作を決定します。

[分類ラベルがすでに適用されているファイルをスキップする] (推奨) - ポリシーは以下の処理を行います。
- 別の分類ポリシーによって以前に適用された分類ラベルを上書きする
- 分類ラベルがユーザー、フォルダのカスケード、ワークフローによって適用されているファイル、またはMicrosoft Purview Information Protection (MPIP) 統合によってMPIPの秘密度ラベルから分類ラベルが適用されたファイルをスキップする
[既存の分類ラベルを上書きする] - ポリシーは、既存の分類ラベルがユーザー、フォルダのカスケード、ワークフロー、以前のポリシーのうちどれによって適用されたかに関係なく、そのラベルを上書きします。ただし、以下の場合は除きます。
- 最新のファイルバージョンに対する自動分類ラベルをユーザーが手動で上書きした場合
- 分類ラベルがMPIPの秘密度ラベルから適用されたもので、MPIPの [変更を禁止する] 設定が有効になっている場合

注: 既存の分類ラベルを上書きすると、簡単に元に戻すことはできません。 AIの分類ガイダンスの精度が十分である場合にのみ、[既存の分類ラベルを上書きする] を選択することをお勧めします。

AI分類ポリシーの有効化、無効化、削除

AI分類ポリシーを有効化、無効化、または削除するには、以下の手順に従います。

管理コンソールに移動します。
[分類] を選択します。
AI分類ポリシーの名前をクリックします。
[有効化]、[無効化]、または [削除] をクリックします。

AI分類ポリシーは、作成時に下書きとして保存した場合や作成後に無効化した場合、無効状態になります。分類ポリシーを無効化しても、すでに適用されている分類は削除されません。ポリシーを再度有効化するまで、ポリシーの適用が停止されるだけです。 AI分類ポリシーを削除しても、このポリシーによってコンテンツに適用された分類は削除されません。注:

AI分類ポリシーは複製できません。作成できるポリシーは1つだけです。
分類ポリシーは、有効にすると、分類のイベントでトリガーされるファイルに対して適用されます。

AI分類のユーザーエクスペリエンス

AI分類の詳細には、以下の手順でアクセスできます。

Box内でファイルを選択する。
パネルの右側にある [詳細] ボタンをクリックする。

情報は [適用したユーザー] セクションに表示されます。このセクションには、指定した日に分類がBox AIによって適用されたことが示されます。説明は、そのラベルが適用された理由とともに表示されます。例えば、「ファイルは、非公開の決算結果が含まれるため、内部専用に設定されました」のようになります。

AI分類の結果情報

AI分類によって分類ラベルがファイルに適用されている場合は、上記のAI分類のユーザーエクスペリエンスで説明したサイドパネルで、AIによる推論を確認できます。ラベルが適用されていない場合は、この情報を表示するように選択する必要があります。 AI分類の結果情報を表示する:

管理コンソールで [コンテンツ] を選択します。
[メタデータ] タブを選択します。
[AI Classification Results (AI分類の結果)] を選択します。
[可視性] 設定で、[ユーザーに対してテンプレートを非表示にする] を無効にしてテンプレートを表示します。
[保存] をクリックします。

AI分類の結果情報を確認する:

Boxウェブアプリでファイルを選択します。
右側のペインの横にあるメタデータアイコンをクリックします。

[AI Classification Results (AI分類の結果)] セクションに、Box AI分類エージェントがファイルを評価した際に下した決定に関する推論が表示されます。

AI分類ポリシーのベストプラクティス

効果的なラベル条件の定義

正確なAI分類を確実にするために、ラベル定義は以下のようにしてください。

明確に区別する: 各ラベルには、独自のドキュメントの特性を対象とした、重複のない明確に区別された条件を設定する必要があります。
わかりやすくする: わかりやすい言葉を使用して以下を指定します。
- ドキュメントタイプ (例: 契約書、戦略的なドキュメント、スプレッドシート)
- トピックまたは目的 (例: 製品ロードマップ、セキュリティ違反、取引条件)
- データの種類 (例: PII、ソースコード、財務情報)
- 対象者 (例: 社内チーム、法務)

以下を避けてください:

あいまいな記述 (例: 「会社にとって高リスク」)
ラベルの重複 (例: 「機密」と「極秘」)
定義されていない技術的な専門用語

トラブルシューティングのヒント

AI分類の結果が期待どおりにならなかった場合:

使用する明確に定義されたラベルの数を減らす: 例を追加したり、条件を厳しくしたりしてください
重複を確認する: ラベルが明確でわかりやすく、重複していないことを確認し、「さまざまな状況に対応できる」ラベルを避けてください
ファイルがサポートされているファイルの種類であることを確認する: サポートされているテキストファイルおよび画像ファイルの種類を確認してください

既知の制限事項

AI分類では、以下の条件やトピックを含む基準に対して、矛盾した情報や場合によっては不正確な情報が返されます。

計算、表の構造、数値
単語数またはフレーズ数のカウント
ページ番号、作成者、ファイルサイズ、単語数、コラボレータなど、ドキュメントのメタデータ (AI分類では、このようなドキュメントの構成要素は考慮されません)
テキストドキュメント内の画像、チャート、グラフなど (画像ファイルのみ直接分析できます)

Box Shieldの使い方

Box Shieldの概要

分類ラベルとポリシー

脅威検出

スマートアクセス

Shieldリスト

情報バリア

AI分類

分類に対応するテキストファイルの種類

分類に対応する画像ファイルの種類

AI分類ポリシーの上限

AI分類ポリシーの作成

テストと繰り返し適用

AI分類ポリシーの設定

フォルダの条件

競合の処理

AI分類ポリシーの有効化、無効化、削除

AI分類のユーザーエクスペリエンス

AI分類の結果情報

AI分類ポリシーのベストプラクティス

効果的なラベル条件の定義

トラブルシューティングのヒント

既知の制限事項

Box Shieldの使い方

Box Shieldの概要

分類ラベルとポリシー

脅威検出

スマートアクセス

Shieldリスト

情報バリア

​分類に対応するテキストファイルの種類

​分類に対応する画像ファイルの種類

​AI分類ポリシーの上限

​AI分類ポリシーの作成

​テストと繰り返し適用

​AI分類ポリシーの設定

​フォルダの条件

​競合の処理

​AI分類ポリシーの有効化、無効化、削除

​AI分類のユーザーエクスペリエンス

​AI分類の結果情報

​AI分類ポリシーのベストプラクティス

​効果的なラベル条件の定義

​トラブルシューティングのヒント

​既知の制限事項

分類に対応するテキストファイルの種類

分類に対応する画像ファイルの種類

AI分類ポリシーの上限

AI分類ポリシーの作成

テストと繰り返し適用

AI分類ポリシーの設定

フォルダの条件

競合の処理

AI分類ポリシーの有効化、無効化、削除

AI分類のユーザーエクスペリエンス

AI分類の結果情報

AI分類ポリシーのベストプラクティス

効果的なラベル条件の定義

トラブルシューティングのヒント

既知の制限事項