2022年9月30日(金)に、FastLabel初のテキストアノテーションウェビナーを開催いたしました。Ubie株式会社のMLエンジニアである奥田様に登壇をいただき、対話型AI構築におけるデータセット作成の重要性やポイントをお話いただきました。ウェビナー内容①対話型AIの構築における工夫とデータセットの重要性Ubie株式会社 ML Engineer 奥田裕樹様Ubie株式会社で開発するAI問診システム「コエカルテ」において、どのようなタスクのデータを生成し、具体的にデータ作成をするにあたって工夫したポイントをお話いただきました。今回まず取り組んだのは、一般的には医療従事者ではないと書けないカルテの正解データを医師でない普通の作業者がデータ作成できるよう、平易な言葉で話される問診の会話にタスクを変換することでした。その上で、データ作成における、クラウドソーシング等に依頼する直接依頼型のメリットデメリットと、FastLabelのようなアノテーションサービスを利用する場合のメリットデメリットを実体験を交えながらお話をいただきました。依頼する際にはアノテーションガイドラインをきちんと作成することで、学習データの質のばらつきが出ないようになるとのことで、ガイドライン作成のコツもお話をいただいています。作成するAIの目的に合わせて、どのようなデータセットを作成し学習すべきか、開発者側やアノテーター支援者側もきちんと考えて、プロジェクトを実施していくことが改めて重要だと感じることのできるお話でした!!ウェビナー資料はこちら:%3Ciframe%20class%3D%22speakerdeck-iframe%22%20frameborder%3D%220%22%20src%3D%22https%3A%2F%2Fspeakerdeck.com%2Fplayer%2F97318acb1162467087d8f5339e582026%22%20title%3D%22%E5%AF%BE%E8%A9%B1%E5%9E%8BAI%E3%81%AE%E6%A7%8B%E7%AF%89%E3%81%AB%E3%81%8A%E3%81%91%E3%82%8B%E5%B7%A5%E5%A4%AB%E3%81%A8%E3%83%87%E3%83%BC%E3%82%BF%E3%82%BB%E3%83%83%E3%83%88%E3%81%AE%E9%87%8D%E8%A6%81%E6%80%A7%20-%20%E7%B4%A0%E6%97%A9%E3%81%8F%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E6%A7%8B%E7%AF%89%E3%81%97%E6%A4%9C%E8%A8%BC%E3%81%99%E3%82%8B%E3%81%9F%E3%82%81%E3%81%AB%E3%81%AF%22%20allowfullscreen%3D%22true%22%20mozallowfullscreen%3D%22true%22%20webkitallowfullscreen%3D%22true%22%20style%3D%22border%3A%200px%3B%20background%3A%20padding-box%20padding-box%20rgba(0%2C%200%2C%200%2C%200.1)%3B%20margin%3A%200px%3B%20padding%3A%200px%3B%20border-radius%3A%206px%3B%20box-shadow%3A%20rgba(0%2C%200%2C%200%2C%200.2)%200px%205px%2040px%3B%20width%3A%20%22%20100%25%22%3B%3D%22%22%20height%3A%3D%22%22%20315px%3B%22%3D%22%22%20data-ratio%3D%221.7777777777777777%22%3E%3C%2Fiframe%3E②AIデータプラットフォーム「FastLabel」による高品質なデータ作成のポイントFastLabel株式会社 代表取締役CEO 上田英介当社がアノテーションサービスを提供する上で、高品質なデータ作成を実現するために取り組んでいるポイント、効率的にデータ作成をするための自動アノテーション機能や、自然言語、音声のデータ作成における支援事例についてご紹介をいたしました。自然言語における支援事例として、「オンライン商談システム」における顧客の反応がポジティブかネガティブかを解析するAI開発の支援事例(会話の音声データの書き起こしからテキスト分類まで一気通貫でご支援)について、お話をいたしました。人により顧客の反応がポジティブがネガティブかの判断が異なってしまうことによるAI精度の低下が課題となっていましたが、弊社の方でアノテーションルールの明確化やアノテーターのオンボーディングを行うことにより、AI精度の16パーセント改善を図ることができました。また、当社で提供するAIデータプラットフォームにおけるテキスト分類の自動アノテーション機能を、今回のウェビナーで初公開いたしました。音声の書き起こしについても自動アノテーションで対応が可能となっており、当社ではこれを記念して「音声/自然言語アノテーションキャンペーン」を実施いたします。音声/自然言語アノテーションキャンペーンについてはこちらウェビナー資料はこちら:%3Ciframe%20class%3D%22speakerdeck-iframe%22%20frameborder%3D%220%22%20src%3D%22https%3A%2F%2Fspeakerdeck.com%2Fplayer%2F365cd8b52d0a43fe950073130c044888%22%20title%3D%22%E9%AB%98%E5%93%81%E8%B3%AA%E3%81%AA%E6%95%99%E5%B8%AB%E3%83%86%E3%82%99%E3%83%BC%E3%82%BF%E4%BD%9C%E6%88%90%E3%81%AE%E3%83%9B%E3%82%9A%E3%82%A4%E3%83%B3%E3%83%88%22%20allowfullscreen%3D%22true%22%20mozallowfullscreen%3D%22true%22%20webkitallowfullscreen%3D%22true%22%20style%3D%22border%3A%200px%3B%20background%3A%20padding-box%20padding-box%20rgba(0%2C%200%2C%200%2C%200.1)%3B%20margin%3A%200px%3B%20padding%3A%200px%3B%20border-radius%3A%206px%3B%20box-shadow%3A%20rgba(0%2C%200%2C%200%2C%200.2)%200px%205px%2040px%3B%20width%3A%20%22%20100%25%22%3B%3D%22%22%20height%3A%3D%22%22%20314px%3B%22%3D%22%22%20data-ratio%3D%221.78343949044586%22%3E%3C%2Fiframe%3E開催後のアンケートより「大変勉強になった」「オンボーディングなどの自分の知らないアノテーションプロセスを知ることができた」「テキストアノテーション関連のセミナーがあればまた参加したい」等、多くのご感想をいただきました。FastLabelは今後も、AI開発にお取り組みをされる企業様のお役に立てるような情報発信をしてまいります。今後とも、どうぞよろしくお願いいたします。FastLabelのアノテーションサービス、及びAIデータプラットフォームについて興味がある方は、以下のお問合せフォームよりお問合せください。