分類に対応するテキストファイルの種類
AI分類では、以下のすべての拡張子に関してファイル内のテキストをスキャンします。| 拡張子 | テキスト抽出の上限 |
| as、as3、bat、boxcanvas、boxnote、cmake、css、diff、doc、docx、gdoc、gslide、gslides、haml、htm、html、key、less、log、make、md、mm、msg、odp、odt、pages、pdf、ppt、pptx、properties、rst、rtf、sass、scm、script、sh、sml、txt、vi、vim、webdoc、wpd、xbd、xdw、xhtml、xml、xsd、xsl | 2 MB |
| asm、c、cc、cpp、cs、csv、cxx、erb、groovy、gsheet、h、hh、java、js、json、m、ml、php、pl、py、rb、scala、sql、ods、xls、xlsm、xlsx、yaml | 100 KB |
注: Boxの自動分類は、光学式文字認識 (OCR) をサポートしていません。そのため、スキャンされたPDF内のテキストやテキストベースのファイルに埋め込まれた画像 (PPTの画像など) 内のテキストを抽出することはできません。
分類に対応する画像ファイルの種類
サポートされる画像ファイルの種類は以下のとおりです。 ai、bmp、cr2、crw、dng、eps、gif、heic、indd、idml、indt、inx、jpeg、jpg、nef、png、ps、psd、raf、raw、svg、svs、tga、tif、tiff、webp 画像から表示テキストを抽出する従来型のOCRとは異なり、AI分類では、画像全体 (その画像内のテキストおよびオブジェクトを含む) を分析し、単にテキストの内容だけでなく、コンテンツの意味を判定します。注: AI分類で使用される画像のバージョンは、最大2048 x 2048ピクセルです。 つまり、元の画像のサイズがさらに大きかった場合は、非常に小さい部分や細かい部分が表示されない可能性があり、 これが分類結果に影響することがあります。
AI分類ポリシーの上限
ラベル全体で、すべての条件を組み合わせた合計サイズの上限は25,000バイトです。 この上限は言語によって異なります。サポートされる文字数の概算を以下に示します。| 言語 | 文字数 |
英語 | 25,000 |
日本語 | 8,500 |
フランス語 | 23,000 |
中国語 | 8,500 |
韓国語 | 8,500 |
AI分類ポリシーの作成
管理者および以下の権限を持つ共同管理者は、AI分類ポリシーを作成、変更、削除できます。- 会社のメタデータテンプレートを作成、編集する
- 会社のShieldダッシュボードを表示する
- 会社のShield構成を作成、編集、削除する
- 管理コンソールに移動します。
- [分類] を選択します。
- [作成] を選択した後、ドロップダウンオプションから [AI分類ポリシー] を選択します。
- 分類ラベルを選択し、分類するコンテンツの種類に関する詳細情報を入力します。 例えば、内部の分類には、給与記録、履歴書、ポリシードキュメントなどのコンテンツが含まれる場合があります。
- 必要に応じて、最大10ファイルを使用してテストと繰り返し適用を実行します。
- ポリシーの設定で [すべてのフォルダに適用する] または [選択したフォルダのみ] を選択します。
- 競合の処理の動作を選択します。
- [次へ] をクリックします。
- [下書きとして保存] または [有効化] をクリックします。 [有効化] を選択すると、分類ポリシーは、分類のイベントでトリガーされるファイルに対して適用されます。
- EIDあたりの分類ポリシー数の上限は50です。 AI分類ポリシーはこの上限に含まれます。
- 自動分類ポリシーが複数ある場合は、デフォルトで、AI分類ポリシーの優先順位が最後に設定されます。 これは、優先順位の変更によって変更可能です。
- 企業ごとに許可されるAI分類ポリシーは1つです。
- コンテンツは、ポリシーが有効になった場合のみ、先を見越してスキャンされます。
テストと繰り返し適用
テストファイルを選択することで、期待どおりの分類結果が表示されることを確認し、必要に応じて条件を変更することができます。 一度に選択できるのは10ファイルまでです。 ファイルが選択されると、選択された入力を使用してプロンプトが作成され、AIに送信されて各テストファイルが評価されます。 AI分類ポリシーの作成手順に従って手順5まで進んだ後、以下の手順を実行します。- [テストと繰り返し適用] セクションで [ファイルを選択] をクリックします。
- テストするファイルを最大10個選択します。
- 提供されるガイダンスに基づいて分類が適用された状態で、テストの結果が表示されます。 AIがそのラベルを選択した理由が示されます。
- ファイルがもう存在しない可能性がある。
- ファイルからテキストを抽出できない (AIは、抽出可能なテキストを含むコンテンツでのみ動作する)。
- ファイルが空である。
AI分類ポリシーの設定
フォルダの条件
| 設定 | 説明 |
| すべてのフォルダに適用する | ポリシーは、社内のすべてのフォルダにあるファイルに適用されます。 |
| 選択したフォルダのみ | ポリシーは、選択したフォルダとそのすべてのサブフォルダ内のファイルのみに適用されます。 フォルダを選択するには、次の手順に従います。 1. [フォルダを選択] をクリックします。 2. 検索語句を入力し、Enterキーを押します。 3. 1つ以上のフォルダを選択します。 4. [保存] をクリックします。 |
競合の処理
コンテンツに既存の分類ラベルが適用されている場合の競合に対するAI分類ポリシーの動作を決定します。- [分類ラベルがすでに適用されているファイルをスキップする] (推奨) - ポリシーは以下の処理を行います。
- 別の分類ポリシーによって以前に適用された分類ラベルを上書きする
- 分類ラベルがユーザー、フォルダのカスケード、ワークフローによって適用されているファイル、またはMicrosoft Purview Information Protection (MPIP) 統合によってMPIPの秘密度ラベルから分類ラベルが適用されたファイルをスキップする
- [既存の分類ラベルを上書きする] - ポリシーは、既存の分類ラベルがユーザー、フォルダのカスケード、ワークフロー、以前のポリシーのうちどれによって適用されたかに関係なく、そのラベルを上書きします。ただし、以下の場合は除きます。
- 最新のファイルバージョンに対する自動分類ラベルをユーザーが手動で上書きした場合
- 分類ラベルがMPIPの秘密度ラベルから適用されたもので、MPIPの [変更を禁止する] 設定が有効になっている場合
AI分類ポリシーの有効化、無効化、削除
AI分類ポリシーを有効化、無効化、または削除するには、以下の手順に従います。- 管理コンソールに移動します。
- [分類] を選択します。
- AI分類ポリシーの名前をクリックします。
- [有効化]、[無効化]、または [削除] をクリックします。
- AI分類ポリシーは複製できません。作成できるポリシーは1つだけです。
- 分類ポリシーは、有効にすると、分類のイベントでトリガーされるファイルに対して適用されます。
AI分類のユーザーエクスペリエンス
AI分類の詳細には、以下の手順でアクセスできます。- Box内でファイルを選択する。
- パネルの右側にある [詳細] ボタンをクリックする。
AI分類の結果情報
AI分類によって分類ラベルがファイルに適用されている場合は、上記のAI分類のユーザーエクスペリエンスで説明したサイドパネルで、AIによる推論を確認できます。 ラベルが適用されていない場合は、この情報を表示するように選択する必要があります。 AI分類の結果情報を表示する:- 管理コンソールで [コンテンツ] を選択します。
- [メタデータ] タブを選択します。
- [AI Classification Results (AI分類の結果)] を選択します。
- [可視性] 設定で、[ユーザーに対してテンプレートを非表示にする] を無効にしてテンプレートを表示します。
- [保存] をクリックします。
- Boxウェブアプリでファイルを選択します。
- 右側のペインの横にあるメタデータアイコンをクリックします。
AI分類ポリシーのベストプラクティス
効果的なラベル条件の定義
正確なAI分類を確実にするために、ラベル定義は以下のようにしてください。- 明確に区別する: 各ラベルには、独自のドキュメントの特性を対象とした、重複のない明確に区別された条件を設定する必要があります。
- わかりやすくする: わかりやすい言葉を使用して以下を指定します。
- ドキュメントタイプ (例: 契約書、戦略的なドキュメント、スプレッドシート)
- トピックまたは目的 (例: 製品ロードマップ、セキュリティ違反、取引条件)
- データの種類 (例: PII、ソースコード、財務情報)
- 対象者 (例: 社内チーム、法務)
- あいまいな記述 (例: 「会社にとって高リスク」)
- ラベルの重複 (例: 「機密」と「極秘」)
- 定義されていない技術的な専門用語
トラブルシューティングのヒント
AI分類の結果が期待どおりにならなかった場合:- 使用する明確に定義されたラベルの数を減らす: 例を追加したり、条件を厳しくしたりしてください
- 重複を確認する: ラベルが明確でわかりやすく、重複していないことを確認し、「さまざまな状況に対応できる」ラベルを避けてください
- ファイルがサポートされているファイルの種類であることを確認する: サポートされているテキストファイルおよび画像ファイルの種類を確認してください
既知の制限事項
AI分類では、以下の条件やトピックを含む基準に対して、矛盾した情報や場合によっては不正確な情報が返されます。- 計算、表の構造、数値
- 単語数またはフレーズ数のカウント
- ページ番号、作成者、ファイルサイズ、単語数、コラボレータなど、ドキュメントのメタデータ (AI分類では、このようなドキュメントの構成要素は考慮されません)
- テキストドキュメント内の画像、チャート、グラフなど (画像ファイルのみ直接分析できます)