AI開発でアノテーションは必要不可欠な業務となります。しかし、膨大な数の教師データを作成するためのリソース不足に悩む企業は多いです。このような悩みを抱えて、アノテーション業務の自動化を検討する企業もいます。アノテーション業務の自動化は行えるの?アノテーション業務の自動化は精度が良いの?その他にリソース不足を解決できる方法はないの?この記事では、AI・機械学習のためのアノテーション業務の自動化の研究状況と対策方法について詳しく解説します。 AIに必要なアノテーションとはアノテーションとは、教師データを作成する業務のことをいいます。AIモデルは教師データを読み込み、テストデータの正誤を判断していくものです。AIモデルに学習させるほど精度は向上していくため、膨大で高品質な教師データが必要となります。したがって、AI開発する上でアノテーション業務は欠かせません。アノテーション業務については「アノテーション業務とは?精度向上と業務効率化を実現するポイント」を参考にしてください。【実証実験】AIのためのアノテーション業務の自動化果たして、アノテーション業務の自動化は行えるのでしょうか?まずは、アノテーション業務の最新動向についてご紹介します。東京大学大学院(出典元:東京大学の公式ホームページ)東京大学大学院(農学生命科学研究所科)でも、アノテーション業務の自動化が行われています。AIモデルに学習させた同類の品種であれば、データのラベル付けが自動化できます。アノテーションの自動化は、検出精度が実用レベルに満たない等の課題を抱えていました『モデル汎化法』として大きな注目を浴びています。みかんの教師データを読み込ませたAIモデルを活用し、リンゴとトマトの画像の検証に成功しました。栽培方法が似ているリンゴの検出精度は87.5%。栽培方法が異なるトマトの検出精度は76.9%。高い検出精度が出ています。Amazon(出典元:Amazon SageMaker Ground Truthの公式ホームページ)Amazon社でもアノテーション業務の自動化の研究が行われています。機械学習トレーニング『Amazon SageMaker Ground Truth』を活用すれば、一定以上のデータを読み込ませる必要がありますが、データのラベル付けの自動化を実現。アノテーション業務に必要なコスト削減ができる優れたツールではありますが、アノテーターがラベル付けした教師データと比較をすると品質が劣ります。Amazon社のシステムでも、アノテーターのラベル付けの精度まで至らない現状が研究結果で報告されています。 FastLabel(出典元:FastLabeのl公式ホームページ)アノテーション業務の完全自動化は難しい現状ですが、効率化することは可能です。FastLabel社はアノテーション業務で活用できるプラットフォーム開発していますが、動画アノテーションの一部自動化やセグメンテーションの自動化に成功しました。従来の方法では、動画のアノテーションを行う場合は静止画にしてラベル付けをしなければいけません。そのため、莫大な労力を必要としていましたが、FastLabelのツールでは動画のままアノテーションを行い、動画の始点終点をアノテーションすることで途中プロセスについては自動で線形補完することが可能です。動画の市場規模が拡大する中で大きな注目を浴びている技術です。また、セグメンテーションについては、対象領域を矩形で囲うことで、簡単にセグメンテーション領域の抽出を行うことができるため、大幅な時間短縮につなげることが可能です。 【結論】アノテーション業務の自動化は難しいアノテーション業務の研究状況をご紹介しましたが、残念ながら完全自動化は難しい状況です。また、アノテーション業務の自動化では、下記の点に注意する必要があります。 同領域のみ活用できる東京大学で行われたアノテーション業務の自動化は、機会学習の反復学習やディープランニング技術が活用されて実現できたものです。反復学習やディープランニングは注目を浴びている機械学習方法ですが、一定基準の元データを学習させる必要があります。そのため、基本的に同領域のみ活用できます。 精度が落ちるAI開発では『機械学習品質マネジメントガイドライン』がありますが、ガイドライン上でもAI精度は保証されるわけではないことを明記する必要があると述べられています。Amazon社が開発した機械学習トレーニング『Amazon SageMaker Ground Truth』は、アノテーション業務のコスト削減が実現できるツールであり、アノテーターの品質よりかは劣ってしまうと紹介されています。そのため、高精度なAIを開発したい方にはアノテーション業務の自動化は向いていません。 領域検出は苦手分野アノテーション業務の自動化は『物体検出』を得意としています。画像の特定の物を四角く囲むことをプーリングと呼びます。アノテーション業務の自動化で実現できるのはプーリングです。画像の特定の物の領域を把握するための『領域検出』は苦手分野です。領域検出のような細かい作業が必要な場合は、アノテーターの技術が必要となります。 AI向けアノテーション業務の課題AIアノテーションの自動化について解説しましたが、業務効率化に悩む企業は多いです。なぜ、多くの企業が業務効率化に悩んでしまうのでしょうか?ここでは、アノテーション業務の課題をご紹介します。 ヒトAI開発に必要となる教師データは膨大な数となります。多くの企業が悩むのは、膨大な数のラベル付けを行うアノテーターの確保です。アノテーターは社内で確保できないため、アノテーション業務の自動化を考える企業は非常に多いです。 解決方法社内でリソースが割けない場合は、業務委託を検討してみてください。AI開発支援実績を豊富に持つ代行業者であれば、アノテーション業務の研修をしなくて済みます。社内で人材育成するよりも手間・コストがかからないケースも多いです。そのため、人材不足で悩んだら業務委託を検討してみてください。 コストアノテーション業務にはコストの問題も出てきます。コスト削減のために内製化を検討しても、高度な技術を持つ従業員に業務をさせると生産性が落ちてしまいます。その一方で、外部委託をする場合は業者選びを間違えてしまうとコストが膨れ上がる恐れがあります。このような狭間に立たされて、アノテーション業務の自動化を考える企業も存在します。 解決方法アノテーション業務のコストは「内製化」「外注化」のどちらでも、業務効率化が必要です。アノテーション業務効率化すれば、作業工数が削減できます。その結果、コストが抑えられるのです。近頃は、教師データのラベル付けや進捗管理や品質管理が簡単に行えるツールが続々と登場しています。これらのツールを活用して業務効率化を実現しましょう。 ノウハウアノテーション業務には高度な技術が求められたり、識別が難しかったりする場合もあります。例えば、表情のカテゴリ分けは人によって認識の違いが起きます。このような共通認識ミスを防止するためにはルールが必要です。しかし、ルール作成や教育に注力したいと思っても、ノウハウがないと悩む企業も多いです。このような事情により、アノテーション業務の自動化を考える企業も存在します。 解決方法アノテーション業務のノウハウ不足に悩んだら、AI開発支援会社へ相談をしてください。チーム間の共通認識を強化させるためのマニュアル書の作成方法や、アノテーション業務の効率化までさまざまなノウハウを教えてもらえます。社内にないノウハウを蓄積すれば、より高精度なAI開発が実現できるでしょう。 AI向けのアノテーション業務は「FastLabel」AIアノテーション業務の効率化に悩んだ場合は『FastLabel』へご相談ください。ここでは、FastLabel社に依頼するメリットをご紹介します。 従量課金型FastLabelは従量課金制度のサービスです。他社では定額制度が採用されています。定額制度のサービスだと少量のデータ作成に多額のコストがかかります。そのため、気軽にアノテーション業務が依頼できなくなってしまうのです。このような問題を解決するために、FastLabelでは従量課金型を採用しています。 マネジメント料の削減アノテーション業務の費用は『品質水準』『プロジェクト管理』『アノテーション作業』により変動しますが、FastLabelはプラットフォーム上でアノテーション業務を行います。プラットフォーム上で作業することにより、データ作成の品質状態やアノテーターのパフォーマンスが可視化できます。そのため、マネジメントの手間がかかりません。プラットフォーム上で進捗管理をお客様側でして頂ければ、マネジメント料を頂いておりません。そのため、契約金額の10%程度のコストカットが実現できるのです。ダブルチェックを採用FastLabelは価格の安さと品質の高さにこだわっています。プロジェクト管理をプラットフォームで簡略化する一方で、データ作成には注力。FastLabel社はダブルチェック(1人のアノテーターがラベルを付けて、専門家が品質をチェックする体制)を採用しています。AI開発支援の経験を持つアノテーター同士でダブルチェックすることで、高品質の教師データを作成しています。 AI開発のノウハウを提供FastLabelはAI開発支援会社で、多種多様な業種のAI開発に関与してきました。AI開発支援の途中で、お客様からお聞きした声を参考に業務効率化の研究をしています。弊社が開発したプラットフォームを活用すれば、コストを下げながらデータ品質を上げることができます。『ノウハウ』『ツール』『代行』でAI開発を支援します。 補足:依頼方法要件ヒアリング:御見積にあたって必要な要件、および現在のAIのデータ作成においての課題感をお伺いします。見積提示:いただいた要件をもとに見積金額を提示します。契約:トライアル結果と見積金額を承認いただき、契約を締結します。要件定義:実際のアノテーション内容に認識のズレが出ないよう、要件定義およびルール統一を行います。ここでアノテーションマニュアルの作成も行います。アノテーション業務:データ収集・データクレンジング・アノテーション・検品まで代行します。納品:お客様の希望に沿った方法で納品します。 まとめ今回は、AI・機械学習のために必要なアノテーション業務の自動化について解説しました。ヒト・コスト・ノウハウの問題により、アノテーション業務の自動化を検討する企業が存在しますが、現在の研究段階では完全自動化は難しいです。アノテーション業務の課題を解決するためには、業務効率化をすることが最善の方法となります。FastLabel社は、アノテーション業務効率化の研究を行っているAI開発支援会社です。高品質な教師データを低価格で提供していることが強みとなっています。従量課金型を採用、豊富な実績でお客様の要望に柔軟に対応できることが同社の強みとなっています。そのため、ぜひ、アノテーション業務に課題を感じている方は『FastLabel』までご相談ください。