PIXTAが機械学習用「野菜画像データセット」を販売開始、日本で一般的な野菜40種を提供
ピクスタ株式会社が運営する写真・イラスト・動画・音楽素材のマーケットプレイス「PIXTA」は、機械学習用画像・動画データ提供サービスとして、日本国内で生産・出荷量の多い野菜40種を集めた「野菜画像データセット」の販売を開始する。

近年、食品分野においてもAIを活用した画像認識や品質管理、需要予測といった技術の開発が進み、農業・流通・小売など幅広い分野での応用が拡大している。
こうした技術開発には、対象となる国や地域で一般的に流通している野菜の画像を、バリエーション豊かに学習させることが求められる。しかし、海外のオープンデータや自主撮影により野菜画像を入手することは可能な一方で、日本国内で撮影されたデータは十分にそろっておらず、特にPoCフェーズなど限られた予算の中で手軽に入手できるデータセットが不足しているのが現状だ。
そこで、PIXTAは独自のクリエイターネットワークを活かし、日本で生産量の多い野菜を中心に国内で撮影された画像データを収集し、機械学習用のデータセットとして提供する。
具体的には、生育状況のモニタリングや収量予測、スマート家電における食材認識機能の開発や食品管理・在庫管理システムにおける自動識別、食材画像を活用したレシピ提案機能の開発などへの用途が想定されている。

日本国内で生産・出荷量の多い野菜40種類 各50点
だいこん、にんじん、ジャガイモ、さといも、かぶ、ごぼう、れんこん、やまのいも、はくさい、キャベツ、ほうれんそう、レタス、ねぎ、小松菜、ちんげん菜、ふき、みつば、しゅんぎく、水菜、セロリ、アスパラガス、カリフラワー、ブロッコリー、にら、にんにく、きゅうり、茄子、トマト、ピーマン、かぼちゃ、スイートコーン、さやいんげん、さやえんどう、グリーンピース、そらまめ、えだまめ、メロン、いちご、すいか(※収穫前、収穫後など野菜の状態は様々。加工、調理がされている野菜画像は含まない)
なお、提供されている画像は、撮影者から機械学習用データ活用の許諾を取得しており、商用利用も可能だ。
PIXTAは、今後もAI開発の現場で必要とされるデータを迅速かつ的確に提供し、日本国内における技術発展を支援していくとしている。
データ数:2000点
価格:19万8000円(税込)
撮影場所:日本国内
構図:俯瞰(垂直・水平)、正面・左右真横からの画角などさまざま
購入方法:機械学習用画像・動画データセット提供サービスサイトの「お問い合わせ」より希望のデータを選択して連絡
機械学習用画像・動画データセット提供サービス
https://pixta.jp/machinelearning-dataset
ピクスタ株式会社
https://pixta.co.jp/

農業・食品分野のAI開発に貢献
近年、食品分野においてもAIを活用した画像認識や品質管理、需要予測といった技術の開発が進み、農業・流通・小売など幅広い分野での応用が拡大している。
こうした技術開発には、対象となる国や地域で一般的に流通している野菜の画像を、バリエーション豊かに学習させることが求められる。しかし、海外のオープンデータや自主撮影により野菜画像を入手することは可能な一方で、日本国内で撮影されたデータは十分にそろっておらず、特にPoCフェーズなど限られた予算の中で手軽に入手できるデータセットが不足しているのが現状だ。
そこで、PIXTAは独自のクリエイターネットワークを活かし、日本で生産量の多い野菜を中心に国内で撮影された画像データを収集し、機械学習用のデータセットとして提供する。
具体的には、生育状況のモニタリングや収量予測、スマート家電における食材認識機能の開発や食品管理・在庫管理システムにおける自動識別、食材画像を活用したレシピ提案機能の開発などへの用途が想定されている。

画像サンプル
日本国内で生産・出荷量の多い野菜40種類 各50点
だいこん、にんじん、ジャガイモ、さといも、かぶ、ごぼう、れんこん、やまのいも、はくさい、キャベツ、ほうれんそう、レタス、ねぎ、小松菜、ちんげん菜、ふき、みつば、しゅんぎく、水菜、セロリ、アスパラガス、カリフラワー、ブロッコリー、にら、にんにく、きゅうり、茄子、トマト、ピーマン、かぼちゃ、スイートコーン、さやいんげん、さやえんどう、グリーンピース、そらまめ、えだまめ、メロン、いちご、すいか(※収穫前、収穫後など野菜の状態は様々。加工、調理がされている野菜画像は含まない)
なお、提供されている画像は、撮影者から機械学習用データ活用の許諾を取得しており、商用利用も可能だ。
PIXTAは、今後もAI開発の現場で必要とされるデータを迅速かつ的確に提供し、日本国内における技術発展を支援していくとしている。
サービス概要
「野菜画像データセット」データ数:2000点
価格:19万8000円(税込)
撮影場所:日本国内
構図:俯瞰(垂直・水平)、正面・左右真横からの画角などさまざま
購入方法:機械学習用画像・動画データセット提供サービスサイトの「お問い合わせ」より希望のデータを選択して連絡
機械学習用画像・動画データセット提供サービス
https://pixta.jp/machinelearning-dataset
ピクスタ株式会社
https://pixta.co.jp/
SHARE