データプロダクションマネジメント 速習ガイド(10分)
コメント1:このドキュメントでは、MooreDataプラットフォームを活用し、データプロダクションの管理をゼロから立ち上げる方法を解説します。ここでは例として、画像データのアノテーションタスクを取り上げます。
1. プラットフォーム設計の哲学
1.1 チームスペース
プラットフォームの操作方法を学ぶ前に、MooreDataプラットフォームのプラットフォーム設計哲学を理解しておくと役立ちます。
下の図に示すように、「チーム」はABAKA AIエコシステムの基本単位です。チームは「孤島」として機能し、チーム内でデータラベリング要件を完了することができます。
/image-12.png)
1.2 データ生産
デリバリーはデータ生産のキーワードです。
ABAKA AIの最適なデータ生産ソリューションでは、バッチをデータデリバリーの最小単位と見なします。データタスクでは、各データバッチが同じプロセスに従ってデータ生産を行います。
以下のデータ生産プロセスを例にとると、4ノードのプロセスを作成しました。ノード1はラベリングプロセスを実行し、ノード2、3、および4はすべてレビュープロセスです。各ノードには1つのチームのみが参加します。ノード2をサプライヤーチームに割り当てて自己検査を完了させ、ノード3を自社で構築した品質検査チームに割り当てて完了させます。最後にノード4で、顧客に最終的な品質検査をさせます。
/Bmlhb8LXIo1Eqpxvs7bucCL4sTc.jpg)
たとえば、このプロセスは会社の経費精算プロセスのようなものです。最初のノードは、経費精算申請書を提出するためのものです。 2番目のノードは上司がレビューするためのもので、合格しない場合は修正のために呼び戻され、合格した場合は3番目のノードに進みます。 3番目のノードはマネージャーによるレビューのためのもので、合格しない場合は修正のために呼び戻されます。合格した場合は4番目のノードに進みます。 4番目のノードは最終ノードです。合格すると払い戻しが行われ、合格しない場合は呼び戻されてプロセスが再開されます。
実際のニーズに応じてデータ生産のプロセステンプレートを選択できます。たとえば、3ノード(二重監査に対応)や5ノード(四重監査に対応)などです。
ノード(二重監査に対応)または5ノード(四重監査に対応)。バッチの履歴操作と各ノードの精度を直感的に表示します。
/image-13.png)
各ノードが終了すると、システムはノード上の動作データを自動的にカウントして分析します。このデータタスクのマネージャーとして、各ノードのサンプリング精度を視覚的に確認できます。さらに、詳細を表示することでデータバッチの多くの秘密を知ることもできます。これは、その後のデータ生産にとって非常に重要です。たとえば、バッチレポートでは、どのラベラーのラベリング精度が最も低いかを知ることができます。次に、ラベラーの注釈を続行する権限をキャンセルすることで、データの全体的な品質を向上させることができます。
1.3 データコンセプト
/image-11.png)
1.3.1 タスク
タスクは、このタスクのすべてのデータを表し、同じ注釈ルール、ラベリング設定、属性設定、ワークフローなどに従ってデータ生産を行います。
1.3.2 バッチ
バッチは、完全なタスクを分割した結果であり、生産性プロセスの最小単位でもあります。
1.3.3 アイテム
アイテムは、バッチ内の各対応する画像/点群/テキスト/ビデオ/アンケートなどであり、ラベラーが取得できる最小のデータ単位でもあります。
1.3.4 フレーム
フレームは、連続フレームタスクに表示される概念であり、アイテムにはnフレームの画像/点群を含めることができます。
2. チームのセットアップ
2.1 チームの作成
- MooreData登録リンクからMooreDataプラットフォームアカウントに登録できます。登録が成功すると、プラットフォームは自動的に「username_team1」という名前のチームスペースを作成します。
/image.png)
左上隅のチームの作成ボタンをクリックして、チームの作成を完了します。
/image-1.png)
2.2 チームメンバーの追加
- チームにメンバーを追加するには、次の手順に従う必要があります。
- チーム管理に移動します。
- チームメンバーをクリックします。
- メンバーの追加をクリックします。
- チームに追加する新しいメンバーの個人IDを入力します。
/image-2.png)
- 個人IDをコピーするには、次の手順に従います。
- 左下隅のプロフィールアイコンをクリックします。
- 個人情報を選択します。
- 個人IDの横にある「コピー」ボタンをクリックします。
/image-3.png)
2.3 管理者の設定
チームの作成者として、チームを管理する時間があまりない場合があります。チームの信頼できるメンバーを管理者として設定して、チームとタスクの管理を支援することができます。
/image-4.png)
3. タスクの作成
- 左側のツールバーのデータギャラリーをクリックします。
- 右上隅のタスクの作成をクリックします。
/image-5.png)
Integer Intelligent Platformは、2D画像注釈ツール
、3D点群オブジェクト注釈ツール
、4D点群オブジェクト注釈ツール
、音素ツール
、音声ツール
、アンケートツール
、ビデオマルチモーダルツール
、テキスト注釈ツール
を提供しており、ラベリング要件に応じて対応するツールを選択できます。
画像データ注釈タスクの場合、2D画像注釈ツール
を選択し、左上隅にタスク名を入力して、次へをクリックします。
/image-6.png)
3.2 タスクフローの選択
タスクプロセス構成で必要に応じてレビューノードの数を選択できます。
たとえば、3つのレビューのタスクフローを設定した場合、3つのレビューのタスクフローには、ラベリングノード、レビューノード1、レビューノード2、およびレビューノード3の4つのノードが含まれ、それぞれラベリング、サプライヤー内部監査、ABAVAプラットフォーム内部監査、および甲側驗收に対応できます。
/image-7.png)
タスクフローを選択した後、作成をクリックすると、タスクが正常に作成されます〜
3.3 タスク設定
- タスク設定をクリックし、
- 上部のラベル設定に切り替えて、ラベルタイプとラベル属性設定を構成します。
- 基本設定の下にある作成をクリックします。
注意:ラベル設定でラベルが構成されていない場合、ラベリングインターフェイスに入った後にラベルを付けることはできません。
/image-8.png)
3.4 データのインポート
- 左側のツールバーのインポート/エクスポートをクリックし、
- インポートページのインポートの作成をクリックし、
- プロンプトに従ってデータインポート方法を選択します。
/image-9.png)
/image-10.png)
インポートボタンをクリックすると、ページは自動的にインポートインターフェイスにリダイレクトされ、データインポートの進行状況をリアルタイムで表示できます。
その他のインポート操作については、ドキュメント「データインポート」を参照してください。専門のユーザーが自分でデータを事前注釈することを考慮して、事前注釈結果を含むデータのインポートのサポートを追加しました。
4. バッチ管理
左側のツールバーのデータバッチをクリックして、バッチリストに入ります。バッチの起動を選択してバッチのデータを正式に生産プロセスに入れるか、データのインポートをクリックしてデータのインポートを続行できます。
バッチが起動されると、バッチへのデータのインポートはできなくなります。
/image-14.png)
5.1 タスクメンバーの設定
- このタスクの左側にあるメンバーを選択し、
- タスクメンバーをクリックし、
- メンバーリストの右端でメンバーをこのタスクの管理者として設定します。
- タスクチームをクリックして、チーム全体をこのタスクのメンバーとして招待します。
/image-15.png)
/image-16.png)
5.2 ノードメンバーの設定
- バッチに入る
- ノードボタンをクリックし、
- ポップアップウィンドウでチームからメンバーを選択し、
- メンバーをこのノードの管理者または通常のレビュー担当者として設定します。
/image-17.png)
- 管理者はバッチデータをラベリングノードに返すか、次のレビューノードに渡すことができます。メンバーにはこの権限がありません。
- タスクの所有者である場合は、任意のノードのチームを設定できます。
- タスクの所有者でない場合は、割り当てられたノードに対応するメンバーのみを設定できます。たとえば、
- チームがレビュー2ノードにある場合は、レビュー2ノードのメンバー設定のみを操作できます。他のノードは操作する権限がありません。
- データがチームのいるノードにプッシュされたときにのみ、チームのメンバーを設定できます。
6. 品質レビュー
6.1 レビューの要求
- バッチデータがレビューノードにプッシュされたら、左下隅の開始ボタンをクリックして、そのバッチのレビューを開始できます。
/image-18.png)
- アイテムを選択せずに右上隅のラベルのレビューをクリックすると、ランダムレビューモードになり、アイテムがランダムに選択されてレビューされます。
/image-19.png)
- アイテムを選択してからラベルのレビューをクリックすると、選択したアイテムが順番にレビューされます。
6.2 受理待ちのアイテム
たとえば、監査2ノードのメンバーは、監査3ノードのエラータグ付きのアイテムを表示できますが、監査2ノードのエラータグ付きのアイテムは表示できません。
- **「受理待ちのアイテム」**リストには、現在の注釈者によって修正が必要なアイテム、つまり前のノードでエラータグが付いていたアイテムが表示されます。
/image-20.png)
7. レビューツール(2D/3Dフュージョン注釈)
7.1 ラベルレビュー
- アイテムをレビューするとき、レビュー担当者が誤ってデータを変更するのを防ぐために、レビューロックはデフォルトでロックされています。データコンテンツを変更する場合は、レビューロックのロックを解除する必要があります。このとき、レビューモードから編集モードに切り替わります。
- レビューモードでは、ラベルを右クリックすると、ラベルタイプ、ラベル属性、プリセットエラーの理由、カスタムエラーの理由など、ラベルの詳細ページがポップアップ表示されます。
/image-21.png)
- ラベル詳細ページの対応する位置で対応するエラー項目を確認し、タスク設定でプリセットされたタグエラーを選択し、カスタムエラーの理由を選択すると、すべてエラー判定ボタンがアクティブになります。判定エラーをクリックすると、ラベルのエラーレビューを保存できます。
/image-22.png)
- すべてのエラーラベルは右側のエラーに表示され、クリックすると対応するフレームにジャンプします。
/CxjPby3CCo5bwhxqjEEu9hr9s5W.png)
7.2 省略
- 左上隅の省略アイコンをクリックして、見逃したラベリングモードに入ります。
- 3D点群/2D画像の見逃したラベリング位置をクリックして、省略ウィンドウをポップアップ表示します。
- 見逃したラベルの種類または見逃したラベルの説明を選択し、
- 確認をクリックすると、省略マークが保持されます。
/KZXPbRCK6o6MQ1xun5MuhF70sCU.png)
- すべての見逃したラベルは、右側の「問題」に表示されます。
/FCUWbHj74oN2OlxTBWauhUSNs1b.png)
7.3 アイテム操作
- レビュー担当者は、アイテムに対して保存、スキップ、拒否、合格などの操作を実行できます。
- 保存:現在のレビューまたは変更内容を保存し、アイテムを終了するか、Webページを閉じても、既に行われたデータ変更には影響しません。
- スキップ:アイテムがスキップされた場合、既に行われたデータ変更は保持されますが、レビュー結果は統計分析に含まれません。
- 拒否:アイテムを誤ったアイテムとしてマークします。
- 合格:アイテムを正しいアイテムとしてマークします。
/NXfzbtROhoEY71xxis7u3PnTsoh.png)
7.4 バッチ操作
- このバッチのすべてのアイテムを確認した後、バッチデータに不満がある場合は、左下隅の「拒否」をクリックしてバッチをラベリングノードに差し戻してやり直すことができます。
- バッチデータが適格である場合は、左下隅の「合格」をクリックしてバッチを次のノードにプッシュできます。
/image-23.png)
7.5 やり直しレビュー
- アイテムのリストで、ドロップダウンして現在の合格および未レビューのアイテムをフィルタリングできます。
/image-24.png)
- アイテムのリストで、受理待ちのアイテムを表示できます。これは、最後のレビューで誤りが見つかり、修正されたデータです。
/image-25.png)