AI開発に必要なデータ収集・生成からアノテーション、モデル開発、MLOps構築までの全工程をサポートしているFastLabel株式会社(本社:東京都品川区、代表取締役CEO:上田英介、以下「当社」)は、オールインワンAIデータプラットフォーム『FastLabel』に、データマネジメント機能の β版を実装し、リリースしたことをお知らせいたします。■オールインワンAIデータプラットフォーム『FastLabel』についてデータマネジメントツール(従来はα版)、アノテーションツール、MLOpsツールを内包するAI開発を効率化・高度化するAIデータプラットフォームです。 高い業務網羅性とカスタマイズ性を備えており、非エンジニアでも使えるUI/UXかつ、大手企業様にも安心してご利用いただけるセキュアな設計となっています。お客様のご要望やフィードバック、データセントリックなAI開発においてあるべき機能を追求し、随時機能追加を行っており、年間200回以上のアップデートを実施しています。 ■データマネジメント機能β版のリリース概要これまでα版としてリリースしていたデータマネジメント機能について、お客様のフィードバックを反映しながら、画像データを中心に機能開発や対応したアノテーション種類の拡充を行ってまいりました。今回、画像にまつわるデータ管理やアノテーションプロジェクトとのシームレスな連携が可能になり、収集・作成したAIデータ管理業務が『FastLabel』上で一気通貫できる状態となりましたので、β版としてリリースいたしました。 ■データマネジメント機能β版のリリースの背景従来、PoC(概念検証)や利用範囲が限定されるAI開発においては、大量の学習データを必要としませんでした。しかし、米OpenAI社の「GPT-4」を始め、AIに求められる機能が多様化・高度化し、より人間に近い判断を代替するAIの需要が高まってきたことで、AI開発に必要なデータ量が急速に増加いたしました。また、エンタープライズな組織を中心に、大量のデータ収集・作成業務をより効率的に進めるため、部署間でのデータセットの共有を行ったり、複数人でデータセットを扱ったりなどするケースが増えてきております。これにより、データセットの管理が属人化し、整理が難しくなることで、秘匿性の高いデータを誰がいつどこで使っているのか分からないリスクを抱えたままAI開発が進んでしまっているケースも多く見られます。各現場では、データ管理のフォルダ階層ルールや命名規則の設定、共有したデータセットの顛末管理など様々な工夫が行われておりますが、煩雑な管理業務が増加し、本来はビジネス価値の創出や独自技術の開発などに注力したい機械学習エンジニアを中心に頭を悩ませています。さらに、実験〜運用フェーズまで膨大な実験サイクルを行っていく中で、結果の信頼性や再現性を担保するためにはデータセットのバージョン管理が必要です。Amazon S3など、バージョン管理の機能を提供しているサービスはありますが、バージョンの数の分だけ容量が増加してしまい、コストがかさんでしまうデメリットもあります。■求められるのは「1箇所で、セキュアに、低コストで」バージョン管理ができる仕組み上述の課題を踏まえ、データ管理の機能には以下の要件が求められています。 ①1箇所で管理できることデータの種類や利用ユーザーによって管理場所を分けてしまうことで、管理が煩雑となってしまいます。また、Amazon S3のようなクラウドストレージでは、中身を確認したり検索したりすることが難しく、エンジニアでしか使えないため、運用を見越した管理場所としては適しているとは言えません。様々な非構造データ、アノテーション種類に対応し、利用ユーザーを選ばないよう誰でも使えるUI・UXである機能が必要です。 ②セキュアであること環境としては、2要素認証など基本的なセキュリティ要件を満たし、かつ、データロケーションも安全な場所にあることが必要です。運用面では、誰がいつ使ったのかの利用履歴が管理されていることや、利用権限の設定ができることなどが重要となります。 ③バージョン管理ができ、かつ、コストを抑えられることバージョン管理の機能があると、フォルダ階層がシンプルになり管理コストを抑えることができ、実験サイクルにおけるトレーサビリティも向上します。また、バージョンの数の分だけコストがかからないようなテクノロジーも搭載されていると、ストレージコストを抑えた上で、管理コストを削減できるため、トータルでのコストを削減することが可能です。AI開発を進めるにあたって、上記のような要件を満たし、スムーズな業務プロセスとして運用できる「仕組み」になっていることが必要です。■『FastLabel』データマネジメント機能の特徴 〜1箇所で、セキュアに、低コストでバージョン管理ができるデータマネジメントシステム〜今回β版でリリースされるデータマネジメントシステムは、以下の特長を備えており、機械学習エンジニアの方の管理業務を大幅に効率化可能になっています。 ①誰でも使えるUI/UXで、様々なデータ・アノテーションタイプに対応しつつ、1箇所でデータを管理可能直感的に操作ができるUI・UXで、エンジニアでなくても誰でも簡単に見たいデータを検索・確認することが可能です。 UI/UXイメージ②日本国内のデータロケーション、国際基準の認証を取得し、エンタープライズのセキュリティにも対応できるセキュアなクラウドストレージ『FastLabel』は、カントリーリスクが低い日本リージョンにてデータ管理を行っています。情報セキュリティマネジメントシステム(ISMS)ISO27001規格を取得しており、情報セキュリティに関する組織・体制を確立しています。また、多要素認証や監査ログにも対応しており、セキュリティに厳しいエンタープライズの基準にも対応できるシステムになっています。 二段階認証イメージ情報セキュリティマネジメントシステム(ISMS)ISO27001規格に準拠(IS 756098 / ISO 27001)③差分のみを管理するテクノロジーを搭載した独自のバージョン管理機能により、低コストで運用可能変更履歴は差分データのみを管理するため、低コストでデータセットのバージョン管理をすることが可能です。「データのGitHub」をイメージして開発を行っており、どんな差分が発生したのか全てログで管理され、画面から簡単に確認することが可能で、過去のバージョンを遡って参照することも行うことができます。 バージョン管理イメージ上記の他にも以下の機能を搭載しており、お客様のデータ管理に関わる業務に対応できる仕組みとなっています。データの前処理・オーギュメンテーションメタデータの追加・管理SDK(学習環境への連携など)データの共有・権限・ダウンロード履歴管理アノテーション作業とのシームレスな連携機能EXIF情報の表示(画像)データ利用先へのドリルダウン・トレーサビリティ契約情報や利用規約情報の管理train/validation/testのデータタイプ管理■今後の展望 〜機械学習エンジニアを煩雑な業務から解放し、価値のある仕事にフォーカスできるように〜FastLabelでは、創業以来アノテーション代行サービスや品質管理コストを大幅に削減できるアノテーションツールの提供など、機械学習エンジニアが煩雑な業務から解放され、ビジネス価値の創出や独自技術の開発など本来注力すべき業務にフォーカスできるようサポートしてまいりました。今回のデータマネジメント機能 β版のリリースによって、より深く皆様をサポートできるのではないかと考えています。 今後も、さらにサポートを強化していくため、エンジニアが不在でも現場で簡単なAI開発が回せるMLOps機能などを順次リリースしていく予定です。何かお力になれることがありましたら、お気軽にお問い合わせください。 ■AIデータプラットフォーム『FastLabel』、その他サービスについてのお見積り、お問い合わせ方法お見積りや詳細のお問い合わせを希望のお客様は、以下のメールアドレス宛、もしくはURL先からお問い合わせください。お問い合わせ:info@fastlabel.aiURL:https://fastlabel.ai/#contact FastLabel株式会社について社名:FastLabel株式会社代表者:代表取締役CEO 上田 英介事業内容:AI開発を包括的に支援する「AIPaaS」(※)の提供(AIデータプラットフォーム、アノテーションサービス)設立:2020年1月23日本社所在地:〒141-0001 東京都品川区北品川5-5-27 201号URL:https://fastlabel.ai/※)AIPaaS…AI Process as a Service、AI開発プロセスを高速化・高度化させるサービス、プロダクトの総称本プレスリリースに関するお問い合わせFastLabel株式会社 広報担当メール:info@fastlabel.ai