undefined - Abaka AI

データプロダクションマネジメント 速習ガイド(10分)

コメント1:このドキュメントでは、MooreDataプラットフォームを活用し、データプロダクションの管理をゼロから立ち上げる方法を解説します。ここでは例として、画像データのアノテーションタスクを取り上げます。

1. プラットフォーム設計の哲学

1.1 チームスペース

プラットフォームの操作方法を学ぶ前に、MooreDataプラットフォームのプラットフォーム設計哲学を理解しておくと役立ちます。

下の図に示すように、「チーム」はABAKA AIエコシステムの基本単位です。チームは「孤島」として機能し、チーム内でデータラベリング要件を完了することができます。

1.2 データ生産

デリバリーはデータ生産のキーワードです。

ABAKA AIの最適なデータ生産ソリューションでは、バッチをデータデリバリーの最小単位と見なします。データタスクでは、各データバッチが同じプロセスに従ってデータ生産を行います。

以下のデータ生産プロセスを例にとると、4ノードのプロセスを作成しました。ノード1はラベリングプロセスを実行し、ノード2、3、および4はすべてレビュープロセスです。各ノードには1つのチームのみが参加します。ノード2をサプライヤーチームに割り当てて自己検査を完了させ、ノード3を自社で構築した品質検査チームに割り当てて完了させます。最後にノード4で、顧客に最終的な品質検査をさせます。

たとえば、このプロセスは会社の経費精算プロセスのようなものです。最初のノードは、経費精算申請書を提出するためのものです。 2番目のノードは上司がレビューするためのもので、合格しない場合は修正のために呼び戻され、合格した場合は3番目のノードに進みます。 3番目のノードはマネージャーによるレビューのためのもので、合格しない場合は修正のために呼び戻されます。合格した場合は4番目のノードに進みます。 4番目のノードは最終ノードです。合格すると払い戻しが行われ、合格しない場合は呼び戻されてプロセスが再開されます。

実際のニーズに応じてデータ生産のプロセステンプレートを選択できます。たとえば、3ノード(二重監査に対応)や5ノード(四重監査に対応)などです。

ノード(二重監査に対応)または5ノード(四重監査に対応)。バッチの履歴操作と各ノードの精度を直感的に表示します。

各ノードが終了すると、システムはノード上の動作データを自動的にカウントして分析します。このデータタスクのマネージャーとして、各ノードのサンプリング精度を視覚的に確認できます。さらに、詳細を表示することでデータバッチの多くの秘密を知ることもできます。これは、その後のデータ生産にとって非常に重要です。たとえば、バッチレポートでは、どのラベラーのラベリング精度が最も低いかを知ることができます。次に、ラベラーの注釈を続行する権限をキャンセルすることで、データの全体的な品質を向上させることができます。

1.3 データコンセプト

1.3.1 タスク

タスクは、このタスクのすべてのデータを表し、同じ注釈ルール、ラベリング設定、属性設定、ワークフローなどに従ってデータ生産を行います。

1.3.2 バッチ

バッチは、完全なタスクを分割した結果であり、生産性プロセスの最小単位でもあります。

1.3.3 アイテム

アイテムは、バッチ内の各対応する画像/点群/テキスト/ビデオ/アンケートなどであり、ラベラーが取得できる最小のデータ単位でもあります。

1.3.4 フレーム

フレームは、連続フレームタスクに表示される概念であり、アイテムにはnフレームの画像/点群を含めることができます。

2. チームのセットアップ

2.1 チームの作成

  • MooreData登録リンクからMooreDataプラットフォームアカウントに登録できます。登録が成功すると、プラットフォームは自動的に「username_team1」という名前のチームスペースを作成します。

左上隅のチームの作成ボタンをクリックして、チームの作成を完了します。

2.2 チームメンバーの追加

  • チームにメンバーを追加するには、次の手順に従う必要があります。
    1. チーム管理に移動します。
    2. チームメンバーをクリックします。
    3. メンバーの追加をクリックします。
    4. チームに追加する新しいメンバーの個人IDを入力します。
  • 個人IDをコピーするには、次の手順に従います。
    1. 左下隅のプロフィールアイコンをクリックします。
    2. 個人情報を選択します。
    3. 個人IDの横にある「コピー」ボタンをクリックします。

2.3 管理者の設定

チームの作成者として、チームを管理する時間があまりない場合があります。チームの信頼できるメンバーを管理者として設定して、チームとタスクの管理を支援することができます。

3. タスクの作成

  1. 左側のツールバーのデータギャラリーをクリックします。
  2. 右上隅のタスクの作成をクリックします。

Integer Intelligent Platformは、2D画像注釈ツール3D点群オブジェクト注釈ツール4D点群オブジェクト注釈ツール音素ツール音声ツールアンケートツールビデオマルチモーダルツールテキスト注釈ツールを提供しており、ラベリング要件に応じて対応するツールを選択できます。

画像データ注釈タスクの場合、2D画像注釈ツールを選択し、左上隅にタスク名を入力して、次へをクリックします。

3.2 タスクフローの選択

タスクプロセス構成で必要に応じてレビューノードの数を選択できます。

たとえば、3つのレビューのタスクフローを設定した場合、3つのレビューのタスクフローには、ラベリングノード、レビューノード1、レビューノード2、およびレビューノード3の4つのノードが含まれ、それぞれラベリング、サプライヤー内部監査、ABAVAプラットフォーム内部監査、および甲側驗收に対応できます。

タスクフローを選択した後、作成をクリックすると、タスクが正常に作成されます〜

3.3 タスク設定

  1. タスク設定をクリックし、
  2. 上部のラベル設定に切り替えて、ラベルタイプとラベル属性設定を構成します。
  3. 基本設定の下にある作成をクリックします。

注意:ラベル設定でラベルが構成されていない場合、ラベリングインターフェイスに入った後にラベルを付けることはできません。

3.4 データのインポート

  1. 左側のツールバーのインポート/エクスポートをクリックし、
  2. インポートページのインポートの作成をクリックし、
  3. プロンプトに従ってデータインポート方法を選択します。

インポートボタンをクリックすると、ページは自動的にインポートインターフェイスにリダイレクトされ、データインポートの進行状況をリアルタイムで表示できます。

その他のインポート操作については、ドキュメント「データインポート」を参照してください。専門のユーザーが自分でデータを事前注釈することを考慮して、事前注釈結果を含むデータのインポートのサポートを追加しました。

4. バッチ管理

左側のツールバーのデータバッチをクリックして、バッチリストに入ります。バッチの起動を選択してバッチのデータを正式に生産プロセスに入れるか、データのインポートをクリックしてデータのインポートを続行できます。

バッチが起動されると、バッチへのデータのインポートはできなくなります。

5.1 タスクメンバーの設定

  1. このタスクの左側にあるメンバーを選択し、
  2. タスクメンバーをクリックし、
  3. メンバーリストの右端でメンバーをこのタスクの管理者として設定します。
  4. タスクチームをクリックして、チーム全体をこのタスクのメンバーとして招待します。

5.2 ノードメンバーの設定

  • バッチに入る
    1. ノードボタンをクリックし、
    2. ポップアップウィンドウでチームからメンバーを選択し、
    3. メンバーをこのノードの管理者または通常のレビュー担当者として設定します。
  • 管理者はバッチデータをラベリングノードに返すか、次のレビューノードに渡すことができます。メンバーにはこの権限がありません。
    • タスクの所有者である場合は、任意のノードのチームを設定できます。
    • タスクの所有者でない場合は、割り当てられたノードに対応するメンバーのみを設定できます。たとえば、
    • チームがレビュー2ノードにある場合は、レビュー2ノードのメンバー設定のみを操作できます。他のノードは操作する権限がありません。
  • データがチームのいるノードにプッシュされたときにのみ、チームのメンバーを設定できます。

6. 品質レビュー

6.1 レビューの要求

  • バッチデータがレビューノードにプッシュされたら、左下隅の開始ボタンをクリックして、そのバッチのレビューを開始できます。
  • アイテムを選択せずに右上隅のラベルのレビューをクリックすると、ランダムレビューモードになり、アイテムがランダムに選択されてレビューされます。
  • アイテムを選択してからラベルのレビューをクリックすると、選択したアイテムが順番にレビューされます。

6.2 受理待ちのアイテム

たとえば、監査2ノードのメンバーは、監査3ノードのエラータグ付きのアイテムを表示できますが、監査2ノードのエラータグ付きのアイテムは表示できません。

  • **「受理待ちのアイテム」**リストには、現在の注釈者によって修正が必要なアイテム、つまり前のノードでエラータグが付いていたアイテムが表示されます。

7. レビューツール(2D/3Dフュージョン注釈)

7.1 ラベルレビュー

  • アイテムをレビューするとき、レビュー担当者が誤ってデータを変更するのを防ぐために、レビューロックはデフォルトでロックされています。データコンテンツを変更する場合は、レビューロックのロックを解除する必要があります。このとき、レビューモードから編集モードに切り替わります。
  • レビューモードでは、ラベルを右クリックすると、ラベルタイプ、ラベル属性、プリセットエラーの理由、カスタムエラーの理由など、ラベルの詳細ページがポップアップ表示されます。
  • ラベル詳細ページの対応する位置で対応するエラー項目を確認し、タスク設定でプリセットされたタグエラーを選択し、カスタムエラーの理由を選択すると、すべてエラー判定ボタンがアクティブになります。判定エラーをクリックすると、ラベルのエラーレビューを保存できます。
  • すべてのエラーラベルは右側のエラーに表示され、クリックすると対応するフレームにジャンプします。

7.2 省略

  1. 左上隅の省略アイコンをクリックして、見逃したラベリングモードに入ります。
  2. 3D点群/2D画像の見逃したラベリング位置をクリックして、省略ウィンドウをポップアップ表示します。
  3. 見逃したラベルの種類または見逃したラベルの説明を選択し、
  4. 確認をクリックすると、省略マークが保持されます。
  • すべての見逃したラベルは、右側の「問題」に表示されます。

7.3 アイテム操作

  • レビュー担当者は、アイテムに対して保存、スキップ、拒否、合格などの操作を実行できます。
    • 保存:現在のレビューまたは変更内容を保存し、アイテムを終了するか、Webページを閉じても、既に行われたデータ変更には影響しません。
    • スキップ:アイテムがスキップされた場合、既に行われたデータ変更は保持されますが、レビュー結果は統計分析に含まれません。
    • 拒否:アイテムを誤ったアイテムとしてマークします。
    • 合格:アイテムを正しいアイテムとしてマークします。

7.4 バッチ操作

  • このバッチのすべてのアイテムを確認した後、バッチデータに不満がある場合は、左下隅の「拒否」をクリックしてバッチをラベリングノードに差し戻してやり直すことができます。
  • バッチデータが適格である場合は、左下隅の「合格」をクリックしてバッチを次のノードにプッシュできます。

7.5 やり直しレビュー

  • アイテムのリストで、ドロップダウンして現在の合格および未レビューのアイテムをフィルタリングできます。
  • アイテムのリストで、受理待ちのアイテムを表示できます。これは、最後のレビューで誤りが見つかり、修正されたデータです。